大数据风潮的来临,TMT行业仿佛一夜间易帜,集团战略开始由IT时代迈向DT时代,对于像阿里巴巴这样的公司不管是从广告平台、搜索平台、推荐平台还是到图像采集、语音识别类产品,在底层设计中都用到了非常精妙的算法,而这些优秀的算法在DT时代更加凸显了整个公司的技术实力。2014西溪峰会,齐聚集团算法十.....
分类:
其他好文 时间:
2014-09-28 01:52:20
阅读次数:
566
在回顾了VC分析之后,本节课重点介绍了另一个理解泛化的理论:偏差与方差,并通过学习曲线的运用比较了VC分析和偏偏差方差权衡的不同用途....
分类:
其他好文 时间:
2014-09-25 00:59:17
阅读次数:
245
scipy系列库有相当多的依赖,导致安装过程比较痛苦。要不停的去找依赖。
发现一个小日本给出的安装过程:
原载: http://memo.yomukaku.net/entries/jbRkQkq
1. 安装Python
2.7.3 Python
2.7.3のインストール
cd src
wget http://www.python.org/ftp/pytho...
分类:
编程语言 时间:
2014-09-24 13:07:16
阅读次数:
368
本文以百度关键词搜索推荐工具字面相关性模型为基础,介绍一个机器学习任务的具体设计实现。包括目标的设定,训练数据准备,特征选择及筛选, 以及模型的训练及优化。该模型可扩展到语意相关性模型,搜索引擎相关性及LTR学习任务的设计实现。该模型的设计调研实现,也可以很容易移植解决其他包括语义相关性的问题...
分类:
其他好文 时间:
2014-09-24 00:24:45
阅读次数:
321
JS Nice 是一款让经过混淆处理的JavaScript 代码可读更好的工具。它使用一种新型的用于 JavaScript 代码美化的去混淆和去压缩引擎。JSNice 采用先进的机器学习和程序分析技术,从可用的开源项目学习命名和类型规律。不错,去看看
分类:
编程语言 时间:
2014-09-23 22:32:05
阅读次数:
235
我爱自然语言处理:http://www.52nlp.cn/雨石:http://blog.csdn.net/stdcoutzyx
分类:
Web程序 时间:
2014-09-22 13:45:42
阅读次数:
155
Weka算法Classifier-trees-REPTree源码分析(二)...
分类:
其他好文 时间:
2014-09-22 01:22:31
阅读次数:
489
注:凭记忆写的,可能不全,也不一定正确。一. 简答题1. new 和 malloc 的区别。2. hash冲突是指什么?怎么解决?给两种方法,写出过程和优缺点。3. 命中的概率是 0.25,若要至少命中一次的概率不小于 0.75,则至少需要几次?二. 算法设计题1. 用C/C++写一个归并排序。数据...
分类:
其他好文 时间:
2014-09-20 17:34:59
阅读次数:
187
目前caffe不是很完善,输入的图片数据需要在prototxt指定路径。但是我们往往有这么一个需求:训练后得到一个模型文件,我们想拿这个模型文件来对一张图片抽取特征或者预测分类等。如果非得在prototxx指定路径,就很不方便。因此,这样的工具才是我们需要的:给一个可执行文件通过命令行来传递图片路径,然后caffe读入图片数据,进行一次正向传播。
因此我做了这么一个工具,用来抽取任意一张图片的特征。...
分类:
其他好文 时间:
2014-09-19 17:38:25
阅读次数:
333