Pandas 结构化数据(上) 一、实验说明 Pandas 是 python 的一个数据分析包,属于PyData项目的一部分。Pandas最初被作为金融数据分析工具而开发出来,因此 pandas 为时间序列分析提供了很好的支持。 Pandas 的名称来自于面板数据(panel data)和pytho ...
分类:
编程语言 时间:
2016-04-25 06:44:08
阅读次数:
479
在Ubuntu14.04环境下,配置机器学习最常用的包scikit-learn, 并在命令行中进行验证安装结果。然后配置Eclipse, 使用最熟悉的IDE - Eclipse作用Python的开发环境, 配置PyDev, 然后将Python环境配置到Eclipse。最后成功在Eclipse上运行Scikit-learn示例。...
分类:
系统相关 时间:
2016-04-19 20:00:26
阅读次数:
244
1.加载数据(Data Loading) 假设输入是特征矩阵或者csv文件,首先数据被载入内存。 scikit-learn的实现使用了NumPy中的arrays,所以,使用NumPy来载入csv文件。以下是从UCI机器学习数据仓库中下载的数据。 2.数据归一化(Data Normalization) ...
分类:
其他好文 时间:
2016-04-07 20:51:05
阅读次数:
286
文本挖掘的paper没找到统一的benchmark,只好自己跑程序,走过路过的前辈如果知道20newsgroups或者其它好用的公共数据集的分类(最好要所有类分类结果,全部或取部分特征无所谓)麻烦留言告知下现在的benchmark,万谢! 嗯,说正文。20newsgroups官网上给出了3个数据集, ...
分类:
其他好文 时间:
2016-04-05 13:58:41
阅读次数:
263
关键词列表: @author 作者名 @date 日期 @version 版本标识 @parameter 参数及其意义 @since 最早使用该方法/类/接口的JDK版本 @return 返回值 @throws 异常类及抛出条件 @deprecated 引起不推荐使用的警告 @see referen
分类:
系统相关 时间:
2016-03-14 10:43:20
阅读次数:
194
近期准备实习,于是终于步入了sublime的阵营,sublime确实性感。 在配置win7下C++编译运行集成环境的时候遇到点问题,于是接触了一下JSON格式,最后终于自己搞定了。。 参考文档:http://sublime-text.readthedocs.org/en/latest/referen
分类:
编程语言 时间:
2016-03-09 17:25:39
阅读次数:
148
资源不错 http://www.17bigdata.com/scikit-learn%e7%9a%84%e4%b8%bb%e8%a6%81%e6%a8%a1%e5%9d%97%e5%92%8c%e5%9f%ba%e6%9c%ac%e4%bd%bf%e7%94%a8.html 一幅图简单明了的介绍了s
分类:
其他好文 时间:
2016-03-07 16:40:38
阅读次数:
135
1.线性模板和最小平方 ·线性回归也可用于简单的分类,boundary虽然简单,但模型势必不准确。 ·存在问题: ESL P13:两种场景 ·scikit-learn: LinearModel.LinearRegression() class LinearRegression(LinearModel
分类:
其他好文 时间:
2016-03-05 13:00:22
阅读次数:
142
最近给业务线安装python的扩展numpy,scripy,scikit-learn时,遇到了一堆报错,也走了一些弯路,费了好长时间,最好发现竟然是一个很简单的问题。系统环境:Centos6.5Python:2.7pipinstallnumpy很顺利,没有报错pipinstallscipy一堆报错,报错大致如下Installingscipyonredhatwi..
分类:
其他好文 时间:
2016-03-02 20:19:18
阅读次数:
415
谱聚类通常会先对两两样本间求相似度。 然后依据相似度矩阵求出拉普拉斯矩阵,然后将每一个样本映射到拉普拉斯矩阵特诊向量中,最后使用k-means聚类。 scikit-learn开源包中已经有现成的接口能够使用,详细见 http://scikit-learn.org/dev/modules/genera
分类:
其他好文 时间:
2016-02-28 15:18:31
阅读次数:
802