声明:1)本文由我bitpeach原创撰写,转载时请注明出处,侵权必究。
2)本小实验工作环境为Ubuntu操作系统,hadoop1-2-1,jdk1.8.0。
3)统计词频工作在单节点的伪分布上,至于真正实际集群的配置操作还没有达到,希望能够由本文抛砖引玉。(一)Hadoop的配置修正 网上有很多...
分类:
其他好文 时间:
2014-05-05 21:54:47
阅读次数:
456
站在客户视角,一个系统,包括业务配置(是否启用某某功能,设置该功能的参数),包括业务数据(对业务运营过程产生的数据的分析和统计,用来反应系统的实际价值),包括硬件设备的外观和物理接口(开关、指示灯、输入输出端口,各子设备端口之间的连接线)。站在开发者视角,一个系统,包括各个业务,每个业务涉及的硬件设...
分类:
其他好文 时间:
2014-05-04 12:24:39
阅读次数:
272
这里是windows 环境下的安装 Windows 环境默认不提供任何版本的python。
这里使用的是安装ActivePython ActiveState 制作的 ActivePython 是专门针对 Windows 的 Python
套件,它包含套件, 一个完整的 Python 发布、一个适用于...
分类:
编程语言 时间:
2014-05-04 12:15:57
阅读次数:
400
前面的话:
这几天写了一个程序,在同一个目录里生成了很多文件,需要统计其中部分文件的总大小,发现经常用到的ls、du等命令都无济于事,我甚至都想到了最笨的方法,写一个脚本:mkdir一个新目录,把要统计总大小的文件mv过去,然后du或者ls
-lh新目录。诚然,这个办法又笨又不精确,于是求助万能的....
分类:
其他好文 时间:
2014-05-04 12:14:30
阅读次数:
307
Python应用领域
Web开发、数据库编程、桌面GUI应用开发、科学与数值计算、教育教学、网络应用开发、软件开发(控制、管理、测试等)、游戏与3D影像;游戏开发、网站建设、机器人和航天飞机控制等领域,Python几乎可以用在任何场合。
分类:
编程语言 时间:
2014-05-03 23:55:05
阅读次数:
507
今天遇到了这个方面的问题,目前找到两种办法。一种是换编译器如mingw,另一种是装vc。第一种方法没成功,现在正在等第二种。 第一种: 首先安装MinGW;
把MinGW的路径添加到环境变量path中,比如MinGW安装在D:\MinGW\中,就把D:\MinGW\bin添加到path中; 打开命令...
分类:
编程语言 时间:
2014-05-03 23:20:29
阅读次数:
363
方法1:defgcd(x, y):whilen: x, y=y,
x%yreturnx方法2:def yue(x,y): if y: return gcd(y,x%y) else: return x
分类:
编程语言 时间:
2014-05-03 22:46:11
阅读次数:
344
1、商业智能 商业智能的实现有三个层次:数据报表、多维数据分析和数据挖掘。 商业智能项目的实施步骤:
需求分析 数据仓库建模 数据抽取 建立商业智能分析报表 用户培训和数据模拟测试 系统改进和完善商业智能系统应具有的主要功能 数据仓库 数据ETL
数据统计输出(报表) 分析功能 商业智能的软件工具集...
分类:
其他好文 时间:
2014-05-03 22:16:23
阅读次数:
284
set集合函数主要用来去除重复:比如一个列表有多个重复值,可以用set搞掉>>>l=[1,2,3,4,5,4,3,21]>>>>>>l[1,2,3,4,5,4,3,21]>>>>>>>>>set(l)set([1,2,3,4,5,21])>>>set可以做交集,并集,差集set的增删改增:&..
分类:
编程语言 时间:
2014-05-03 20:49:16
阅读次数:
364
中途经过了好几天都没有动手了,得坚持下去啊刚看了Alex老师的视频,其中有个题目如下:编写登录接口-输入用户密码-认证成功后显示欢迎信息-输错三次后锁定#-*-coding:cp936-*-#用户名保存在一个文件名为user.txt文件中importos,stringtmp=file(‘C:\Users\hityxg\Desktop\user...
分类:
编程语言 时间:
2014-05-03 20:33:16
阅读次数:
471