码迷,mamicode.com
首页 > 其他好文 > 详细

思路整理

时间:2016-05-31 00:57:12      阅读:117      评论:0      收藏:0      [点我收藏+]

标签:

1.首先学习基本的知识,文本分析。学习基本的linux命令,使用脚本对文本进行细粒度的切分,并对模型进行调研

2.分析文本文件中的特征,

3.分析文本文件中上下文之间的关系。

4.编写脚本文件,对脚本预处理,数据清洗,并产生格式化的数据

5.建立模型

6.编写map,reduce过程文件,对数据进行处理,产生结果。

 

思路整理

标签:

原文地址:http://www.cnblogs.com/bob-wzb/p/5544490.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!