Python 爬行Twitter用户的Friendship图...
分类:
编程语言 时间:
2014-08-01 09:19:31
阅读次数:
297
数据预处理(Data Preprocess):通过采用数据清理、数据集成与变换以及数据规约等方法对数据预先进行处理,处理后的数据用于数据挖掘。在当前社会中,由于大数据、数据源不唯一等原因使得在真实数据库存放的数据存在噪声、缺失和不一致的问题。基于数据的信息挖掘在数据不能保证的情况下,挖掘得到的信息也...
分类:
其他好文 时间:
2014-07-31 19:33:40
阅读次数:
258
转自:http://blog.chinaunix.net/uid-446337-id-94440.html分类:机器学习的有概率分类器(probabilistic) ,贝叶斯推理网络(bayesian inference networks) , 决策树分类器(decision tree) ,决策规则...
分类:
其他好文 时间:
2014-07-31 19:33:17
阅读次数:
411
数据可视化( Data Visualization )起源于18世纪,William Playfair 在他出版的书籍《 The Commercial and Political Atlas 》中第一次使用了柱形图和折线图。当时是为了表示国家的进出口量,在今天依然这么使用。19世纪初,他出版了《 Statistical Breviary 》一书,里面第一次使用了饼状图。这三种都是至今最常用的最著名...
分类:
其他好文 时间:
2014-07-31 13:27:46
阅读次数:
226
商业智能(BI,Business Intelligence)。SAP BI商业智能的概念最早在1996年提出。当时将商业智能定义为一类由数据仓库(或数据集市)、查询报表、数据分析、数据挖掘、数据备份和恢复等部分组成的、以帮助企业决策为目的技术及其应用。目前,商业智能通常被理解为将企业中现有的数据转化...
分类:
其他好文 时间:
2014-07-31 13:09:16
阅读次数:
297
一.扩展名:.aspx:窗体文件,为前台程序。.cs文件:类文件,主要为后台数据处理,供所有的.aspx文件的后台应用。.asmx文件:用于创建从其他应用程序使用的web服务的类。.css文件:样式表单,设置界面的整体风格。二.特殊文件夹:App_Browers:包含标识个别浏览器,并确定其功能的浏...
分类:
Web程序 时间:
2014-07-31 12:32:16
阅读次数:
297
守护进程和supervisor
前言
接触守护进程已经很久了,但是在工作中有时候却经常忘记它。这次是在需要后台跑一个十几万的数据处理工作,耗时较长的时候,习以为常的通过&将脚本放到后台去执行,将标准输出和错误输出重定向到日志文件。然后干其他的事情,却发现进程莫名奇妙的死掉,即使已经在所有可能出现异常的地方都比较注意,然后在合适的地方加上了try except这样的异常处理。但是任何异常...
分类:
其他好文 时间:
2014-07-31 09:57:16
阅读次数:
231
Python 提取Twitter用户的Tweet...
分类:
编程语言 时间:
2014-07-31 07:28:36
阅读次数:
346
神经网络模型一、神经网络模型 对网络模型的研究始于20世纪40年代,作为一门交叉学科,它是人类基于对其大脑神经认识的基础上,人工构造实现某种功能的网络模型。经过将近70年的发展,神经网络模型已成为机器学习的典型代表,它不依照任何概率分布,而是模仿人脑功...
分类:
其他好文 时间:
2014-07-31 02:39:15
阅读次数:
348
说Processing之前得先说一下数据可视化
数据可视化--顾名思义,是关于数据之视觉表现形式的研究,将数据用其他方式表现出来,使之更直观,
更清晰,更容易分析和处理,常见的表达方式如word中使用广泛的直方图、树状图、折线图、饼状图等。
数据可视化技术的基本思想是将数据库中每一个数据项作为单个图元元素表示,大量的数据集构
成数据图像,同时将数据的各个属性值以多维数据的形式表示,...
分类:
其他好文 时间:
2014-07-30 23:55:45
阅读次数:
244