声明:1)本文由我bitpeach原创撰写,转载时请注明出处,侵权必究。
2)本小实验工作环境为Ubuntu操作系统,hadoop1-2-1,jdk1.8.0。
3)统计词频工作在单节点的伪分布上,至于真正实际集群的配置操作还没有达到,希望能够由本文抛砖引玉。(一)Hadoop的配置修正 网上有很多...
分类:
其他好文 时间:
2014-05-05 21:54:47
阅读次数:
456
在Hadoop集群环境下安装Mahout。环境:OS:Centos 6.5 x64 &
Soft:Hadoop 1.2.1 & Mahout
0.91、简介mahout项目主页:https://mahout.apache.org/下载二进制包,上传到服务器。2、安装用集群环境用户安装,解压二进制包。...
分类:
其他好文 时间:
2014-05-05 21:35:23
阅读次数:
429
能够将热爱的技术应用于实际生活生产中,是做技术人员向往和乐之不疲的事。
现将前期手里面的一个项目做一个大致的总结,与大家一起分享、交流、进步。项目现在正在线上运行,项目名——基于Hadoop的数据分析综合管理平台。
项目流程整体比较清晰,爬取数据(txt文本)-->数据清洗-->文本模型训练-->文本分类-...
分类:
其他好文 时间:
2014-05-04 00:22:05
阅读次数:
476
第 1 章 MySQL 基本介绍一、与其它数据库比较总的来说,MySQL
数据库在发展过程中一直有自己的三个原则:简单、高效、可靠。从上面的简单比较中,我们也可以看出,在MySQL
自己的所有三个原则上面,没有哪一项是做得不好的。而且,虽然功能并不是MySQL 自身所追求的三个原则之一,但是考虑到当...
分类:
数据库 时间:
2014-05-04 00:00:41
阅读次数:
367
2.1MySQL物理文件组成2.1.1 日志文件1、错误日志:Error
Log如果要开启系统记录错误日志的功能,需要在启动时开启-log-error 选项。错误日志的默认存放位置在数据目录下,以hostname.err
命名。但是可以使用命令:--log-error[=file_name],修改其...
分类:
数据库 时间:
2014-05-03 23:34:57
阅读次数:
352
连接数据库操作很简单,首先需要配置好环境.下载JDK和MySql.这两个下载下来之后,点击安装即可.安装很简单,这里就不说了. 安装好这两个软件之后,接下来就是下载JDBC的jar包mysql-connector-java-5.0.5.zip,解压之后将mysql-connector-java-5....
分类:
数据库 时间:
2014-05-03 23:27:36
阅读次数:
399
一、关于复制的相关问题1、异步复制解决了那些问题复制解决的基本问题是让一台服务器的数据和另外的服务器保持同步,可以位于不同的网络拓扑中,对整台服务器的特定的数据库,甚至特定的表进行复制。基于语句复制和基于行复制,都是通过记录主服务器的二进制日志,并在从服务器..
分类:
数据库 时间:
2014-05-03 15:17:52
阅读次数:
486
MySQL/MariaDB数据备份与恢复备份数据对我们来说再重要不过了,那我们如何做到对数据尽可能的安全呢,当我们的数据丢失了那又该怎么做呢,所以说数据备份对我们的数据安全性来说太重要了。数据对我们来说再熟悉不过了,也最平常不过了,我们每天都在接触各色各样的数据,数据记..
分类:
数据库 时间:
2014-05-03 15:10:58
阅读次数:
499
一、主从一主多从时,主服务器上必须启用多个binlogdump线程,来对多个从服务器发起binlogeventdump,同时主服务器来得面临,前端众多客户端发起的写操作。主服务器压力很大,若挂了,从还能读不能写了,业务不能工作了,这样就催生了双主模型。双主模型下连上多个从也可以。但..
分类:
数据库 时间:
2014-05-03 14:44:43
阅读次数:
394
大致规划:主机IP描述VIP192.168.0.222对外提供高可用IPhaproxy+keepalived(node1)192.168.0.111haproxy为后端两台WEB服务的做动静分离;keepalived为haproxy做高可用。haproxy+keepalived(node2)192.168.0.112WEB(node3)192.168.0.113提供静态请求响应Apache+PHP+MySQL(node4)..
分类:
Web程序 时间:
2014-05-03 14:37:46
阅读次数:
610