前期已经完成了hadoop全分布模式的部署和运行,近期想更进一步的了解hadoop原理,基于hadoop2.X的书籍最好的莫过于《hadoop权威指南(第四版)》,很可惜作者年初才刚写完,没来得及翻译,只好看英文版了,书中的要点重点在接下来的一段时间我会依次翻译出来(全部翻译不太现实,没那么多时间精力,将近900页呢),如果有翻译不妥的地方,还请大家指出来,共同进步,谢谢!
今天是个开头,就先翻...
分类:
其他好文 时间:
2015-07-22 13:04:27
阅读次数:
97
preface: 因为某些原因重装了系统,原来在ubuntu下安装的一些软件又要重新安装,略微麻烦,整理下需要安装的步骤。
#========================================
1. Google浏览器:
参考linux公社给出的方法
在Ubuntu 14.04下安装Google Chrome浏览器非常简单,只要到Chrome的网站下载Deb...
分类:
系统相关 时间:
2015-07-19 06:41:21
阅读次数:
272
Preface Numbering罗马数字的处理,问从1-N,各个IVX...什么的出现了多少次。我们可以用IVX表示出1-9XLC表示出10-90CDM表示出100-900统计出怎么出现的。接下来从高位往下减来表示就好了。#include using namespace std;char dir[...
分类:
其他好文 时间:
2015-07-18 02:05:06
阅读次数:
122
preface: 最近忙着的项目想试着用斯坦福的parser,来解析句子生成句法分析树,然后分析子树,与treekernal结合起来,训练。stanford parser神器下载下来了,可使用却是蛋疼。一大堆说明,却没个方便快捷关于总的介绍。
一、必先利其器
stanford parser主页:http://nlp.stanford.edu/software/lex-parser.sh...
分类:
其他好文 时间:
2015-07-12 00:20:50
阅读次数:
244
preface: 承接上一条博客,帮师兄处理json文件读入数据库中。python读入数据到数据库中,出现编码问题。python里面定义了utf-8,然而文件中有日文、韩文、其他符号、拉丁编码等等,对编码不够熟悉果然是要死银的,弄了挺久的,却终究一个函数可破。encode()函数。
decode()和encode()这两个函数,有空的时候还是多看看才是。
# -*- coding: utf-8...
分类:
编程语言 时间:
2015-07-10 19:11:28
阅读次数:
174
一、nutz是什么nutz是一个轻便的web端开发框架。主页如下:http://www.nutzam.com/core/nutz_preface.html二、session简单介绍大家都知道http是无状态的,即:同一个浏览器发送多个请求,服务端并不知道这些请求是来自于同一个浏览器。所以为了使服务端...
分类:
其他好文 时间:
2015-07-05 13:38:53
阅读次数:
784
preface: 最近帮师兄处理json文件,需要读到数据库里面,以备其后续从数据库读取数据。数据是关于yelp网站里面的: https://github.com/Yelp/dataset-examples,http://www.yelp.com/dataset_challenge/. 涉及到一些json和sql的问题,记录下。
一、python sql安装
python 自带轻型数据库s...
分类:
数据库 时间:
2015-07-04 11:15:44
阅读次数:
1442
preface: 先前是需要在两部电脑之间互传文件,现在是需要直接从windows复制东西到ubuntu中,网上搜了下神器synergy可破。
卤主硬件条件为:一个ubuntu系统的32为电脑和windows8系统的64位电脑。
软件条件:synergy软件,在两个系统上都要装,而且需要是同一个版本。
软件安装:
卤主在ubuntu下直接sudo apt-get install syn...
分类:
其他好文 时间:
2015-07-01 12:16:50
阅读次数:
1058
preface: 想必,很多人都知道D.E.Knuth与V.R.Pratt和J.H.Morris同时提出所谓的狂拽酷炫屌炸天的KMP算法,在对字符串的匹配(或是字符串的查找)方面表现出比较好的效率,该算法对Brute-Force算法的较大改进,具体地讲就是消除了主串指针的回溯,从而使匹配的时间复杂....
分类:
编程语言 时间:
2015-06-29 21:45:42
阅读次数:
227
preface: 忙于最近的任务,需要用到libsvm的一些命令,如在终端运行java
svm_train train_file model_file. python
subset.py file train_num train_file test_file等命令,但file的准备又是通过python写好的,file需要是libsvm能够接受的格式,故用python写好特征,转为libsvm...
分类:
编程语言 时间:
2015-06-25 21:16:33
阅读次数:
177