码迷,mamicode.com
首页 >  
搜索关键字:hadoop nutch hbase    ( 16575个结果
LINUX 拥有遍历文件夹功能的 查找关键字 文件、文件夹
查找文件: [root@bigdata admin]# find . -type f -name "a.txt" ./Downloads/hadoop-2.10.0/a.txt 拥有遍历文件夹功能的 查找关键字 文件、文件夹: [root@bigdata admin]# vi a [root@big ...
分类:系统相关   时间:2020-04-11 20:26:04    阅读次数:98
Windows下的Eclipse连接不上虚拟机上的hdfs,一直显示Listing folder content的解决方案
Eclipse连接不上虚拟机上的hdfs,一直显示Listing folder content,如下图所示: 要做到以下三点: 1. 本身就还没创建输入和输出目录,此时要在hdfs上建个文件夹 。 #bin/hdfs dfs -mkdir –p /user/hadoop/input #bin/hdf ...
分类:Windows程序   时间:2020-04-11 18:28:41    阅读次数:273
LINUX CentOS 8 systemctl firewall 防火墙开启/关闭 命令
[root@localhost ~]#firewall-cmd --state not running [root@bigdata hadoop]# systemctl is-enabled firewalld.service;echo $? (查看服务是否开机启动) enabled 0 [root ...
分类:系统相关   时间:2020-04-11 18:17:13    阅读次数:249
HBase 支持的数据类型
感谢平台分享-http://bjbsair.com/2020-04-10/tech-info/53323.htmlHBase通过Put操作和Result操作支持“byte-in/bytes-out”接口,所以任何可以转换为字节数组的内容都可以作为一个值存储。输入可以是字符串、数字、复杂对象、甚至可以是图像,只要它们可以呈现为字节。值的大小有实际的限制(例如,在HBase中存储10-50MB的对象可
分类:其他好文   时间:2020-04-11 10:15:34    阅读次数:72
HBase 特殊情况
感谢平台分享-http://bjbsair.com/2020-04-10/tech-info/53327.html对于快速失败优于等待的应用程序在客户端的hbase-site.xml中,设置以下参数:设置hbase.client.pause=1000设置hbase.client.retries.number=3如果你想跨越分裂和区域移动,大幅增加hbase.client.retries.numbe
分类:其他好文   时间:2020-04-11 10:02:00    阅读次数:60
Apache Hadoop
阿帕奇Hadoop Apache?Hadoop®项目开发了用于可靠,可扩展的分布式计算的开源软件。 Apache Hadoop软件库是一个框架,该框架允许使用简单的编程模型跨计算机集群对大型数据集进行分布式处理。它旨在从单个服务器扩展到数千台机器,每台机器都提供本地计算和存储。该库本身不依赖于硬件来 ...
分类:Web程序   时间:2020-04-11 09:56:47    阅读次数:102
HBase 二级索引和备用查询路径
感谢平台分享-http://bjbsair.com/2020-04-10/tech-info/53319.html你也可以将本文的标题理解为“如果我的表rowkey看起来像这样,但我也希望我的查询表这样。”dist-list上的一个常见示例是row-key格式为“user-timestamp”格式,但对于特定时间范围内的用户活动有报告要求。因此,用户选择容易,因为它处于密钥的主导位置,但时间不是。
分类:其他好文   时间:2020-04-11 09:48:59    阅读次数:66
HBase和MapReduce
感谢平台分享-http://bjbsair.com/2020-04-10/tech-info/53333.htmlApacheMapReduce是一个用于分析大量数据的软件框架。它由ApacheHadoop提供。MapReduce本身超出了本文档的范围。开始使用MapReduce的好地方是https://hadoop.apache.org/docs/r2.6.0/hadoop-mapreduce-
分类:其他好文   时间:2020-04-11 09:37:51    阅读次数:83
HBase模式案例Steroids上的日志数据_时间序列上
感谢平台分享-http://bjbsair.com/2020-04-10/tech-info/53335.html这实际上是OpenTSDB的方法。OpenTSDB做的是重写数据并将行打包到某些时间段中的列中。但是,这是一般概念的工作原理:例如,以这种方式摄入数据:每个细节事件都有独立的rowkeys,但是会被重写成这样:上述每个事件都转换为存储的列,其相对于开始timerange的时间偏移量(例
分类:其他好文   时间:2020-04-11 09:30:59    阅读次数:60
HBase 版本数量
感谢平台分享-http://bjbsair.com/2020-04-10/tech-info/53325.htmlBase最大版本数量HBase通过HColumnDescriptor为每个列族配置要存储的最大行数版本。最大版本的默认值为1。这是一个重要的参数,因为如数据模型部分所述,HBase也没有覆盖行的值,而是按时间(和限定符)存储不同的值。在重要的压缩过程中删除多余的版本。最大版本的数量可能
分类:其他好文   时间:2020-04-11 09:19:02    阅读次数:97
16575条   上一页 1 ... 68 69 70 71 72 ... 1658 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!