学习理论——VC维的定义以及一些例子
本文主要介绍一些学习理论上的东西。首先,我们得明确,从训练集上学习出来的分类器的最终目标是用于预测未知的样本,那么我们在训练的时候该用多少的样本才能使产生的分类器的效果尽可能的好呢?这些就是VC-理论要解决的问题。在介绍这个理论之前,我们得先介绍一个比较抽象的概...
分类:
其他好文 时间:
2014-05-06 00:41:46
阅读次数:
536
属于离散监督,是一个简单的分类算法工作原理:存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关系。输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似数据(最近邻)的分类标签。k-...
分类:
其他好文 时间:
2014-05-04 20:00:18
阅读次数:
388
能够将热爱的技术应用于实际生活生产中,是做技术人员向往和乐之不疲的事。
现将前期手里面的一个项目做一个大致的总结,与大家一起分享、交流、进步。项目现在正在线上运行,项目名——基于Hadoop的数据分析综合管理平台。
项目流程整体比较清晰,爬取数据(txt文本)-->数据清洗-->文本模型训练-->文本分类-...
分类:
其他好文 时间:
2014-05-04 00:22:05
阅读次数:
476
第48期百度技术沙龙上的《大数据场景下主题检索应用》讲座介绍了很多训练大规模主题模型的技术细节。讲座回来后,我粗略整理了下讲座上涉及的主题模型和训练大规模模型相关的资料和文献。
1. 主题模型的发展历史
a. 布尔模型 Boolean model
b. 向量空间模型 VSM (Vector space model)
c. 潜在语义索引 LSI (Latent...
分类:
其他好文 时间:
2014-05-03 21:40:07
阅读次数:
371
1.研究背景安全风险态势预测分析是信息安全技术和管理领域中的重要内容,传统的方法一般会按如下几个方面独立地或者混合进行分析:1.获取历史上安全攻击相关信息,利用概率模型或者使用历史数据进行训练,根据结果进行风险预测[1][2];2.根据各种信息资产的安全脆弱性进行分析..
分类:
其他好文 时间:
2014-05-03 15:15:30
阅读次数:
364
我买的书或借的 没看的计算机方面: 深入浅出MFC vc++深入详解 算法入门 算法入门训练指南
大话数据结构 C++ 第6版本图像处理与机器视觉: 机器视觉 张广军 数字图像处理疑难解析 图像处理与计算机视觉算法应用 opencv2 图像配准技术模式识别:
机器学习实战 模式分类 神经网络设计 斯...
分类:
其他好文 时间:
2014-05-02 20:00:42
阅读次数:
323
【来信】 您好。我姓刘,是一名软件工程大一的学生,学校是个垫底的二本。当然,我没有看不起学校的意思,只是我们专业的很多老师的表现确实差强人意,具体来说也就是大家常说的上课就是读课本,一套PPT能用好几年那种。 但是我真的很喜欢这门学科,而且我也一直在努力,我现在是我们大一ACM集训队的队长,在这段时间的训练中,我们队伍的成绩还经常排在大二大三的队伍前面。这一年来,我每天写代码的时间都有七八个小...
分类:
其他好文 时间:
2014-05-02 19:49:52
阅读次数:
339
《从程序设计方法到思维训练》课程自推出以来,受到很多同学的欢迎,截止今天已经有1205人学习过本课程。原计划每周推出一讲,最近因为数字教育协同创新中心揭牌暨产品发布会的事情,导致连续两周的周六、周日加班,没有及时更新课程,跟大家道个歉。感谢大家一如既往的关注和..
分类:
其他好文 时间:
2014-05-02 04:26:57
阅读次数:
288
一只小蜜蜂...
Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)
Total Submission(s): 36202 Accepted Submission(s): 13302
Problem Description
有一只经过训练的蜜蜂只能爬...
分类:
其他好文 时间:
2014-04-30 22:48:40
阅读次数:
221
关于最大熵模型的介绍请看:http://www.cnblogs.com/hexinuaa/p/3353479.html
下面是GIS训练算法的python实现,代码不到100行。
from collections import defaultdict
import math
class MaxEnt(object):
def __ini...
分类:
其他好文 时间:
2014-04-30 22:46:39
阅读次数:
384