windows安装hadoop没必要倒腾Cygwin,直接解压官网下载hadoop安装包到本地->最小化配置4个基本文件->执行1条启动命令->完事。下面把这几步细化贴出来,以hadoop2.7.2为例。 1、下载hadoop安装包就不细说了:http://hadoop.apache.org/->左 ...
分类:
Windows程序 时间:
2017-05-13 09:52:12
阅读次数:
1964
1、执行流程 数据准备 train_net.py中combined_roidb函数会调用get_imdb得到datasets中factory.py生成的imdb 然后调用fast_rcnn下的train.py中get_training_roidb, 进而调用roi_data_layer下roidb.... ...
分类:
其他好文 时间:
2017-05-08 14:46:58
阅读次数:
228
本节内容 1.概览 1.1 Spark SQL 1.2 DatSets和DataFrame2.动手干活 2.1 契入点:SparkSession 2.2 创建DataFrames 2.3 非强类型结果集操作 2.4 程序化执行SQL查询 2.5 全局临时视图 2.6 创建DataSets 2.7 与 ...
分类:
数据库 时间:
2017-05-07 23:11:50
阅读次数:
527
本文介绍文本挖掘与文本分类的一些基本概念和流程,为后续学习分类算法做好铺垫。 一. 文本挖掘的概念 文本挖掘(Text Mining)是从非结构化文本信息中获取用户感兴趣或者有用的模式 的过程。其中被普遍认可的文本挖掘定义如下:文本挖掘是指从大量文本数据中抽取事先未知的、可理解的、最终可用的知识的过 ...
分类:
其他好文 时间:
2017-04-24 10:10:06
阅读次数:
193
题目: Error Curves Time Limit: 4000/2000 MS (Java/Others) Memory Limit: 65536/65536 K (Java/Others)Total Submission(s): 1151 Accepted Submission(s): 440 ...
分类:
其他好文 时间:
2017-04-16 20:23:37
阅读次数:
159
基于协同过滤的推荐引擎(理论部分)时隔十日,终于决心把它写出来。大多数实验都是3.29日做的,结合3.29日写的日记完成了这篇实战。数据集准备数据集使用上篇提到的Movielens电影评分数据里的ml...
分类:
其他好文 时间:
2017-04-16 11:29:00
阅读次数:
238
收集数据数据来源:http://archive.ics.uci.edu/ml/datasets/Haberman%27s+Survival
文本数据如下图所示:31,65,4,1
33,58,10,...
分类:
编程语言 时间:
2017-04-05 11:02:08
阅读次数:
424
1.引入库 首先引入keras: 接下来根据程序需要引入datasets,models,layers等,例如keras github里的cifar-10例程中写到: 2.构造数据 第一步,我们需要根据模型训练时需要的数据格式来构造数据的shape,有三种方法: (1)载入他人提供的已经制作好的数据集 ...
分类:
其他好文 时间:
2017-04-04 22:09:46
阅读次数:
1496
Slim Span Time Limit: 5000MS Memory Limit: 65536K Total Submissions: 7933 Accepted: 4227 Description Given an undirected weighted graph G, you should ...
分类:
其他好文 时间:
2017-03-03 21:15:54
阅读次数:
329
笔者最近开始对机器学习非常感兴趣,作为一个有志向的软设方向的女孩纸,我开始了学习的第一步入门,下面将今天刚刚学习的kNN及其应用进行总结和回顾,希望可以得到更好的提升,当然,有志同道合者,你可以联系我给我留言,毕竟菜鸟一起飞才能飞的更高更远。😳 首先,kNN算法也叫k-近邻算法,它的工作原理是:存 ...
分类:
其他好文 时间:
2017-02-18 21:17:31
阅读次数:
231