关于机器学习所需要的测试数据集合 Kaggle网址(用的最多):https://www.kaggle.com/datasets UCI数据集网址(其次): http://archive.ics.uci.edu/ml/ scikit-learn网址(最少):http://scikit-learn.or ...
分类:
其他好文 时间:
2018-11-03 15:50:58
阅读次数:
194
有幸参加2018杭州中国计算机大会,关于优秀博士的培养和成长,整理分享给有心人。 路漫漫其修远兮,吾将上下而求索。 书籍推荐《Hands-On Machine Learning with Scikit-Learn & TensorFlow》 Education & Schools:4 Cs‘ 以下, ...
分类:
其他好文 时间:
2018-10-31 20:48:13
阅读次数:
192
写在前面 GraphLab Create 是一款机器学习的函数库,其中的SFrame也是十分强大的数据管理工具。它允许直接从硬盘中读取数据,免于将数据全部加载到内存中。这就使得对于大数据的处理成为可能.这也是相对于scikit learn的一个最大优点,我们知道,scikit learn是只能读取内 ...
分类:
其他好文 时间:
2018-10-31 15:34:35
阅读次数:
241
Numpy, Scipy, matplotib, pandas, Numpy: numpy是科学计算的基础包之一,其功能包括多维数组,高等数学函数等,以及伪随机数生成器, scikit-learn接受numpy的数组格式数据,所用到的说有的数据都必须转换成Numpy数组, Scipy: scipy是 ...
分类:
其他好文 时间:
2018-10-25 20:15:34
阅读次数:
191
scikit-learn包下有计算TF-IDF的api,其效果也很不错。首先得安装Scikit-clearn Scikit-learn 依赖: Python (>= 2.7 or >= 3.4), NumPy (>= 1.8.2), SciPy (>= 0.13.3). 计算TF-IDF sciki ...
分类:
编程语言 时间:
2018-10-24 17:49:22
阅读次数:
372
【火炉炼AI】机器学习051 视觉词袋模型+极端随机森林建立图像分类器 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 视觉词袋模型(Bag Of Visual Words,BOVW)来源 ...
分类:
其他好文 时间:
2018-10-23 23:10:00
阅读次数:
300
【火炉炼AI】机器学习050 提取图像的Star特征 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 对于图像的特征点,前面我们讨论过边缘检测方法,Harris角点检测算法等,这些检测算法 ...
分类:
其他好文 时间:
2018-10-22 20:33:21
阅读次数:
178
【火炉炼AI】机器学习048 Harris检测图像角点 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 角点检测算法大致有三类:基于灰度图像的角点检测,基于二值图像的角点检测,基于轮廓曲线 ...
分类:
其他好文 时间:
2018-10-22 16:48:40
阅读次数:
179
【火炉炼AI】机器学习046 图像边缘的检测方法 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 图像中各种形状的检测时计算机视觉领域中非常常见的技术之一,特别是图像中直线的检测,圆的检测 ...
分类:
其他好文 时间:
2018-10-22 11:37:16
阅读次数:
137
【火炉炼AI】机器学习045 对股票数据进行隐马尔科夫建模 (本文所使用的Python库和版本号: Python 3.6, Numpy 1.14, scikit learn 0.19, matplotlib 2.2 ) 股票数据是非常非常典型的时序数据,数据都是按照日期排列好,而且股价就是我们所能观 ...
分类:
其他好文 时间:
2018-10-19 20:47:41
阅读次数:
136