面试题 一、Hadoop 1.Hadoop面试题总结(一) 2.Hadoop面试题总结(二)——HDFS 3.Hadoop面试题总结(三)——MapReduce 4.Hadoop面试题总结(四)——YARN 5.Hadoop面试题总结(五)——优化问题 二、Zookeeper 1.Zookeeper ...
分类:
其他好文 时间:
2021-03-02 11:41:45
阅读次数:
0
1.概述 在大数据的浪潮下,时时刻刻都会产生大量的数据。比如社交媒体、博客、电子商务等等,这些数据会以不同的类型存储在不同的平台里面。为了执行ETL(提取、转换、加载)操作,需要一个消息中间件系统,该系统应该是异步和低耦合的,即来自各种存储系统(如HDFS、Cassandra、RDBMS等)的数据可 ...
分类:
其他好文 时间:
2021-03-01 13:50:00
阅读次数:
0
大数据分析——数据抓取 IOT数据抓取 1、系统架构 2、架构说明 系统架构分成三层和四个功能 ,三层分布式M2M层、M2C层、平台应用层,四个功能是 数据采集、连接、逻辑处理、存储 M2M层: 主要指的是硬件数据采集层,它包括但设备数据通过NB-IOT、WIFI、4G、5G、RJ45的方式直接上传 ...
分类:
其他好文 时间:
2021-03-01 13:48:41
阅读次数:
0
继承的本质是对某一批类的抽象,从面实现对现实世界更好的建模. extends的意思是"扩展".子类是父类的扩展. JAVA中类只有单继承,没有多继承! 继承是类和类之间的一种关系.除此之外,类和类之间的关系还有依赖,组合,聚合等. 继承关系的俩个类,一个为子类(派生类,),一个为父类(基类).子类继 ...
分类:
编程语言 时间:
2021-02-27 13:29:46
阅读次数:
0
1.windows下调试时需要将hadoop.dll文件放到C:\Windows\System32下,网上很多说改源码的,其实这样也是ok的,不然会报权限错误 Exception in thread "main" java.lang.UnsatisfiedLinkError: org.apache. ...
1. 管道相关命令 1.1 cut cut:以某种方式按照文件的行进行分割 参数列表: 参数 英文 含义 -c characters 按字符选取 -b 按字节选取 忽略多字节字符边界,除非也指定了 -n 标志 -d '分隔符' delimiter 自定义分隔符,默认为制表符。 -f 'n1,n2' ...
分类:
系统相关 时间:
2021-02-26 13:01:54
阅读次数:
0
当在终端执行sudo命令时,系统提示“hadoop is not in the sudoers file”: 其实就是没有权限进行sudo,解决方法如下(这里假设用户名是cuser): 1.切换到超级用户:$ su 2.打开/etc/sudoers文件:$vim /etc/sudoers 3.修改文 ...
分类:
其他好文 时间:
2021-02-25 11:47:06
阅读次数:
0
pyspark有个bug, 虽然下面代码写了 write.mode("overwrite")但是不生效 spark.conf.set("hive.exec.dynamic.partition.mode", "constrict") db_df.repartition(1).write.mode("o ...
分类:
其他好文 时间:
2021-02-23 14:14:20
阅读次数:
0
在hive客户端建一张表比如bb 条件bb与abc表结构相同,abc有数据,把abc的数据导到bb里 hive -e是为了解决每次进入客户端的麻烦操作,使用了hive -e命令,可以在hive客户端外对客户端进行操作, 例如 hive -e "use aaa;select * from abc li ...
分类:
其他好文 时间:
2021-02-22 12:21:51
阅读次数:
0
数据的基本类型及扩展 1. 数据类型: public class Demo01 { public static void main(String[] args) { //八大数据类型 int num1 = 10; byte num2 = 20; short num3 = 30; long num4 ...
分类:
其他好文 时间:
2021-02-22 11:54:36
阅读次数:
0