分类回归树算法:CART(Classification And Regression Tree)算法采用一种二分递归分割的技术,将当前的样本集分为两个子样本集,使得生成的的每个非叶子节点都有两个分支。因此,CART算法生成的决策树是结构简洁的二叉树。
分类树两个基本思想:第一个是将训练样本进行递归地划分自变量空间进行建树的想法,第二个想法是用验证数据进行剪枝。
CART与C4.5的...
分类:
其他好文 时间:
2014-09-24 12:33:26
阅读次数:
230
本文以百度关键词搜索推荐工具字面相关性模型为基础,介绍一个机器学习任务的具体设计实现。包括目标的设定,训练数据准备,特征选择及筛选, 以及模型的训练及优化。该模型可扩展到语意相关性模型,搜索引擎相关性及LTR学习任务的设计实现。该模型的设计调研实现,也可以很容易移植解决其他包括语义相关性的问题...
分类:
其他好文 时间:
2014-09-24 00:24:45
阅读次数:
321
JS Nice 是一款让经过混淆处理的JavaScript 代码可读更好的工具。它使用一种新型的用于 JavaScript 代码美化的去混淆和去压缩引擎。JSNice 采用先进的机器学习和程序分析技术,从可用的开源项目学习命名和类型规律。不错,去看看
分类:
编程语言 时间:
2014-09-23 22:32:05
阅读次数:
235
思路:master:1、启用二进制日志2、定义server-id3、创建有复制权限的账户完善设置4、设置事务日志从内存缓冲直接同步存储到磁盘中slave:1、启用中继日志2、定义server-id3、使用有复制权限的帐号连接master4、启动iothread以及sqlthread完善设置5、定义节点为只读数据库Maria..
分类:
数据库 时间:
2014-09-23 02:29:04
阅读次数:
458
我爱自然语言处理:http://www.52nlp.cn/雨石:http://blog.csdn.net/stdcoutzyx
分类:
Web程序 时间:
2014-09-22 13:45:42
阅读次数:
155
Weka算法Classifier-trees-REPTree源码分析(二)...
分类:
其他好文 时间:
2014-09-22 01:22:31
阅读次数:
489
原题地址:https://oj.leetcode.com/problems/n-queens/题意:经典的N皇后问题。解题思路:这类型问题统称为递归回溯问题,也可以叫做对决策树的深度优先搜索(dfs)。N皇后问题有个技巧的关键在于棋盘的表示方法,这里使用一个数组就可以表达了。比如board=[1, ...
分类:
编程语言 时间:
2014-09-21 13:02:00
阅读次数:
208
注:凭记忆写的,可能不全,也不一定正确。一. 简答题1. new 和 malloc 的区别。2. hash冲突是指什么?怎么解决?给两种方法,写出过程和优缺点。3. 命中的概率是 0.25,若要至少命中一次的概率不小于 0.75,则至少需要几次?二. 算法设计题1. 用C/C++写一个归并排序。数据...
分类:
其他好文 时间:
2014-09-20 17:34:59
阅读次数:
187
目前caffe不是很完善,输入的图片数据需要在prototxt指定路径。但是我们往往有这么一个需求:训练后得到一个模型文件,我们想拿这个模型文件来对一张图片抽取特征或者预测分类等。如果非得在prototxx指定路径,就很不方便。因此,这样的工具才是我们需要的:给一个可执行文件通过命令行来传递图片路径,然后caffe读入图片数据,进行一次正向传播。
因此我做了这么一个工具,用来抽取任意一张图片的特征。...
分类:
其他好文 时间:
2014-09-19 17:38:25
阅读次数:
333
继续第二篇笔记中的例子。3.不断的迭代与探索的过程从上篇的图看到,直线并不能很好的代表week4以后的趋势。既然一阶函数不行,我们试试二阶函数?f(x)= ax**2 + bx + c继续使用polyfit这个函数来确定a,b,c的值: f2p =sp.polyfit(x,y,2) pr...
分类:
其他好文 时间:
2014-09-19 13:37:45
阅读次数:
240