京东评论情感分类器(基于bag-of-words模型)...
分类:
其他好文 时间:
2014-08-08 21:29:46
阅读次数:
572
Python 访问Facebook (http)...
分类:
编程语言 时间:
2014-08-07 07:15:59
阅读次数:
247
一、Mahout是什么?Mahout是Apache的一个开源项目(http://mahout.apache.org/),提供了机器学习领域的若干经典算法,以便开发人员快速构建机器学习和数据挖掘方面的应用。Mahout是基于Hadoop的。从名称上看也很有意思,Hadoop是一个大象的名字,而Maho...
分类:
其他好文 时间:
2014-08-07 03:04:39
阅读次数:
476
聚类(Clustering)分析有一个通俗的解释和比喻,那就是“物以类聚,人以群分”。针对几个特定的业务指标,可以将观察对象的群体按照相似性和相异性进行不同群组的划分。经过划分后,每个群组内部个对象间的相似度会很高,而在不同群组之间的对象彼此间将具有很高的相异度。 聚类技术一方面本身就是一种...
分类:
其他好文 时间:
2014-08-06 01:52:50
阅读次数:
203
一、关联规则中的频繁模式 关联规则(Association Rule)是在数据库和数据挖掘领域中被发明并被广泛研究的一种重要模型,关联规则数据挖掘的主要目的是找出:【频繁模式】:Frequent Pattern,即多次重复出现的模式和并发关系(Cooccurrence Relationships)....
分类:
其他好文 时间:
2014-08-06 01:34:20
阅读次数:
261
Python 分析Twitter用户喜爱的推文...
分类:
编程语言 时间:
2014-08-05 07:22:08
阅读次数:
329
回归(Regression)分析包括线性回归(Linear Regression),这里主要是指多元线性回归和逻辑斯蒂回归(Logistic Regression)。其中,在数据化运营中更多的使用逻辑斯蒂回归,它包括响应预测、分类划分等内容。 多元线性回归主要描述一个因变量如何随着一批自变量的变化....
分类:
其他好文 时间:
2014-08-04 23:58:10
阅读次数:
613
使用NLPIR-ICTCLAS2014分词系统...
分类:
其他好文 时间:
2014-08-04 14:18:57
阅读次数:
258
最近在看国外的文档,有些生词不认识。就用谷歌翻译来理解,用着用着闲来无事就按F12查看了下页面的源代码。发现可以用python简单的实现下谷歌翻译的页面功能。于是先上网搜下有没有类似的文章博客,发现几篇不错的,于是参考其他代码与自己的思路,简单的实现了下翻译的功能,代码如下:
import re
import urllib,urllib2
#----------模拟浏览器的行为,向谷...
分类:
编程语言 时间:
2014-08-03 20:39:45
阅读次数:
338
atitit.提升备份文件复制速度(4) ---数据挖掘 获取回收站文件列表
1. 放入回收站的原理and 1
2. info2文件文件结构 1
3. 获得文件列表2个法: 正则表达式or解析
1
4. 路径正则表达式[a-zA-Z]\:[\\a-zA-Z0-9\xB0-\xF7\xa1-\xfe_.~]+ 2
5. 参考 2
1. 放入回收站的原理and
info2...
分类:
其他好文 时间:
2014-08-03 20:37:45
阅读次数:
195