1.统计学习 统计学习是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科,也称统计机器学习。统计学习是数据驱动的学科。统计学习是一门概率论、统计学、信息论、计算理论、最优化理论及计算机科学等多个领域的交叉学科。 统计学习的对象是数据,它从数据出发,提取数据的特征,...
分类:
其他好文 时间:
2014-11-15 20:13:40
阅读次数:
223
在之前一篇博文中, 有同学在评论中问了个问题: 如何解决因式分解带来的推荐冷门关键词的问题。 在回答这个问题的时候, 想到了近几年在做搜索推荐系统的过程中, 学术界和工业界的一些区别。 正好最近正在做技术规划, 于是写偏文章说下工业界完整推荐系统的设计。结论是: 没有某种算法能够完全解决问题, 多重算法+交互设计, 才能解决特定场景的需求。下文也对之前的一些博文进行梳理,构成一个完整工业界推荐系统所具有的方方面面(主要以百度关键词搜索推荐系统为例)...
分类:
其他好文 时间:
2014-09-17 21:57:22
阅读次数:
424
第一章 统计学习方法概述1.1 统计学习 统计学习(statistical learning)是关于计算机基于数据概率模型并运用模型进行预测和分析的学科。统计学习也称为统计机器学习,现在人们提及的机器学习一般都是指统计机器学习。 统计学习的对象是数据(data),关于数据的基本假设是同类数据具有.....
分类:
其他好文 时间:
2014-08-27 18:26:38
阅读次数:
135
1.基础概念:
(1) 10折交叉验证:英文名是10-fold cross-validation,用来测试算法的准确性。是常用的测试方法。将数据集分成10份。轮流将其中的9份作为训练数据,1分作为测试数据,进行试验。每次试验都会得出相应的正确率(或差错率)。10次的结果的正确率(或差错率)的平均值作为对算法精度的估计,一般还需要进行多次10折交叉验证,在求其平均值,对算法的准确性进行估计。
...
分类:
其他好文 时间:
2014-08-01 13:47:32
阅读次数:
250
1. 统计学习统计学习是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科,也称统计机器学习。学习就是如果一个系统能够通过执行某个过程改进它的性能,这就是学习。统计学习的对象是数据,它从数据出发,提取数据的特征,抽象出数据的模型,发现数据中的知识,又回到对数据的分析与预测中去...
分类:
其他好文 时间:
2014-07-16 12:42:25
阅读次数:
275
最近的一些有趣链接的分享,包括科学,设计,机器学习等多个方面的。
例如:
1.在另一个星球上打印人类
2.偷听到外星人的星际通信
3.Yann LeCun在reddit上的问答
4.卖萌的水果
......
分类:
其他好文 时间:
2014-06-08 15:12:54
阅读次数:
262
最近的一些有趣链接的分享,包括科学,设计,机器学习等多个方面的。例如:1.在另一个星球上打印人类2.偷听到外星人的星际通信3.Yann
LeCun在reddit上的问答4.卖萌的水果...
分类:
其他好文 时间:
2014-06-07 10:37:04
阅读次数:
210