前面,我们已经打下了很多关于HBase的理论基础,今天,我们主要聊聊在实际开发使用HBase中,需要关注的一些最佳实践经验。 1.Schema设计七大原则 1)每个region的大小应该控制在10G到50G之间; 2)一个表最好保持在 50到100个 region的规模; 3)每个cell最大不应该 ...
分类:
其他好文 时间:
2020-03-14 16:26:44
阅读次数:
47
感觉效率不是很高,是否能用sqoop来解决HBase与其他文件系统的数据导入导出。 通过HBase的相关JavaApi,我们可以实现伴随HBase操作的MapReduce过程,比如使用MapReduce将数据从本地文件导入HBase的表中,或我们从HBase的表中读取一些原始数据用于MapReduc ...
分类:
其他好文 时间:
2020-03-14 14:51:51
阅读次数:
51
解决github访问不了的问题 起因 发现git clone命令失败,显示 443的错误,请求超时。 初步认为是github被墙了,挂上梯子确实可以访问。 随后又不满足于此,因为发现手机端网站访问顺畅,电脑端网页却不行。 那么网站访问是正常的,错误肯定是在本机上。 解决办法 首先想到的是DNS被污染 ...
分类:
其他好文 时间:
2020-03-14 12:57:53
阅读次数:
119
HA+Zookeeper搭建: hadoop完全分布式搭建: https://www.cnblogs.com/Hephaestus/p/12213719.html hadoop高可用搭建: https://www.cnblogs.com/Hephaestus/p/12420370.html Zook ...
分类:
其他好文 时间:
2020-03-12 09:59:28
阅读次数:
46
刷新 flush privileges; 删除用户及权限 drop user 用户名@'%'; drop user gjh@'120.244.144.169'; 赋予权限 GRANT ALL PRIVILEGES ON *.* TO 'root'@'访问IP' IDENTIFIED BY '数据库密 ...
分类:
数据库 时间:
2020-03-11 23:26:31
阅读次数:
72
Python数据工具箱涵盖从数据源到数据可视化的完整流程中涉及到的常用库、函数和外部工具。其中既有Python内置函数和标准库,又有第三方库和工具。读者福利,想要了解python人工智能可直接点击链接即可领取相关学习福利包:石墨文档是安全网站放心,继续访问就可以领取了哦这些库可用于文件读写、网络抓取和解析、数据连接、数清洗转换、数据计算和统计分析、图像和视频处理、音频处理、数据挖掘/机器学习/深度
分类:
编程语言 时间:
2020-03-11 09:11:36
阅读次数:
83
demo 1 package com.bjsxt.hbase; 2 3 import java.io.IOException; 4 5 import org.apache.hadoop.conf.Configuration; 6 import org.apache.hadoop.hbase.Cell ...
分类:
编程语言 时间:
2020-03-10 19:46:43
阅读次数:
55
学习机器学习算法,最难的不是算法及公式推导的学习,因为这些很多都是成熟的现成的,有代码例子可以直接使用。最难的是将算法应用到实际的项目当中。 1. 算法概念 K最近邻(k-Nearest Neighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:在 ...
分类:
编程语言 时间:
2020-03-10 12:16:06
阅读次数:
60
Mysql远程无法连接 客户端远程连接mysql失败.(mysql server在Ubuntu上)ip能ping通,telnet ip:3306端口不通 Ubuntu下防火墙已经关闭 sudo ufw disableUbuntu ping windwos不通,关闭Windows防火墙后能ping通了 ...
分类:
数据库 时间:
2020-03-08 17:34:59
阅读次数:
69
看到一个关于fork()的题目(来源于:https://mp.weixin.qq.com/s/MsGeaWNmSVOCT7kXFrQm_g),如下: #include <stdio.h> #include <sys/types.h> #include <unistd.h> int main(void ...
分类:
其他好文 时间:
2020-03-06 19:14:28
阅读次数:
153