中国的这些年喜欢搞概念,什么云计算大数据啊,国家支持,专家鼓吹,各大会议论坛精彩纷呈,热闹过后发现还是默默地在用国外的技术和平台,就如同PC操作系统没有我们的份,手机操作系统也没有我们的份,虽然我们是世界上电脑和手机拥有量最多并且人们最喜欢玩手机的国家,感觉我们的学术专家和行业大佬们就只会扯蛋,扯多了会痛,痛定思痛,痛何如哉!吃饱喝足后还是继续扯蛋。相当可悲,若大个中国,真正心平静气地去做研究和开...
分类:
移动开发 时间:
2014-06-20 11:37:26
阅读次数:
322
在确定数据可视化为自己研究主题之初,我经常上网搜寻相关资料。但是初期的收集经常是杂乱无章,缺乏系统规划的。以至于我产生了三个困扰我的问题,分别是:
1. 信息可视化与数据可视化,到底有什么区别?或者说infographics 与visualization之间有何区别?
2.data visualization就是数据挖掘之后的用于显示结果的统计图吗?
3.曾经在知乎上看见某资深程序员直...
分类:
其他好文 时间:
2014-06-20 09:54:58
阅读次数:
206
贝叶斯分类器
贝叶斯分类器的分类原理是通过某对象的先验概率,利用贝叶斯公式计算出其后验概率,即该对象属于某一类的概率,选择具有最大后验概率的类作为该对象所属的类。眼下研究较多的贝叶斯分类器主要有四种,各自是:Naive
Bayes、TAN、BAN和GBN。 贝叶斯网络是一个带有概率...
分类:
其他好文 时间:
2014-06-13 13:46:25
阅读次数:
197
最近一段时间做了不少文本挖掘的项目和研究,正好总结一下文本挖掘预处理的流程,希望是干货。...
分类:
其他好文 时间:
2014-06-07 12:11:52
阅读次数:
238
博主是自然语言处理方向的,不是推荐系统领域的,这个程序完全是为了应付大数据分析与计算的课程作业所写的一个小程序,先上程序,一共55行。不在意细节的话,55行的程序已经表现出了协同过滤的特性了。就是对每一个用户找4个最接近的用户,然后进行推荐,在选择推荐的时候是直接做的在4个用户中选择该用户item没...
分类:
编程语言 时间:
2014-06-07 07:19:12
阅读次数:
473
既然陈超美都开始用生成概率模型了,之前的共词分析和共引分析市场不大了。动态主题监测与跟踪:HDP、共词与共引分析方法的比较Introduction
主题监测与跟踪在文献计量学、数据挖掘以及其他多个领域中都发挥重要作用。主题监测旨在从文档集合中识别重要主题,二主题跟踪旨在对一个已经识别到的主题演化.....
分类:
其他好文 时间:
2014-06-06 16:23:26
阅读次数:
814
今天主要认识了小柒、七念、圆影......体会了阿里人自己设计的chrome插件之UData。这是个很牛的插件,用于天猫和淘宝的数据分析,比如用户页面每个部位的点击量,同一IP的点击量,热度的显示,加入收藏夹、支付等数据,通过分析PV,UV,IPV便于他们后期页面的布局设计等。在学习体会的过程中,发...
分类:
其他好文 时间:
2014-06-05 16:32:24
阅读次数:
180
六月到了。开始找工作的节奏,IT方面知识储备严重欠缺,定计划,更新博客,记录自己的准备历程。1、数据结构 15天2、常用算法(排序、动态规划、贪心等)
30天3、数据挖掘算法 15天4、移动端、web端开发入门 15天5、操作系统 10天共计85天,那时将近9月,还能赶上找工作的大潮。何...
分类:
其他好文 时间:
2014-06-02 11:46:07
阅读次数:
314
经过前几天的学习,基本上能够小试牛刀编写一些小程序玩一玩了,在此之前做几项准备工作明白我要用hadoop干什么大体学习一下mapreduceubuntu重新启动后,再启动hadoop会报连接异常的问题答:数据提炼、探索数据、挖掘数据map=切碎,reduce=合并重新启动后会清空tmp目录,默认na...
一、Mahout简单介绍查了Mahout的中文意思——驭象的人,再看看Mahout的logo,好吧,想和小黄象happy地玩耍,得顺便陪陪这位驭象人耍耍了...附logo:(就是他,骑在象头上的那个Mahout)步入正文啦:
Mahout是一个非常强大的数据挖掘工具,是一个分布式机器学习算法的集.....
分类:
其他好文 时间:
2014-06-02 08:14:03
阅读次数:
273