数据算法 Hadoop Spark大数据处理技巧 ...
分类:
编程语言 时间:
2020-07-13 18:11:22
阅读次数:
80
tophua/spark-machine-learning-book Spark机器学习书代码 25 Jupyter Notebook Updated on 22 Dec 2017 zengxiaosen/eshop 电商+大数据+spark机器学习 11 Java Updated on 5 Dec ...
分类:
其他好文 时间:
2020-07-13 18:02:05
阅读次数:
74
首先,编程语言未来将是人类与智能体进行沟通交流的重要方式之一,所以学习一门编程语言是有必要的,由于Python目前在人工智能领域有广泛的应用,而且Python语言简单易学,所以选择学习Python语言是个不错的选择。 Python语言除了在人工智能领域有广泛的应用之外,在Web开发、大数据开发和嵌入 ...
分类:
编程语言 时间:
2020-07-13 15:40:17
阅读次数:
73
首先,编程语言未来将是人类与智能体进行沟通交流的重要方式之一,所以学习一门编程语言是有必要的,由于Python目前在人工智能领域有广泛的应用,而且Python语言简单易学,所以选择学习Python语言是个不错的选择。Python语言除了在人工智能领域有广泛的应用之外,在Web开发、大数据开发和嵌入式开发领域均有应用,可以说Python语言的应用生态非常健全,是当前IT行业内应用最广泛的编程语言之一
分类:
编程语言 时间:
2020-07-13 15:14:43
阅读次数:
58
hadoop生产环境的使用是很复杂的,有些公司是CDH或者Ambari等管理工具运维的,有些是原生的集群俗称裸奔,前者优缺点是运维,查看监控等容易,对于底层理解不友好;裸奔集群反之,裸奔集群的很多东西都需要定制和自己开发,比如监控用zabbix,告警用企业微信,节点的异构严重的,需要二次开发配置文件 ...
分类:
其他好文 时间:
2020-07-13 13:17:45
阅读次数:
65
水平有限,本文仅以流水账的方式 介绍自己 安装 三款软件 的过程。 环境Ubuntu on 虚拟机: $ cat /proc/version Linux version 4.15.0-54-generic (buildd@lgw01-amd64-014) (gcc version 7.4.0 \(U ...
分类:
其他好文 时间:
2020-07-13 13:14:44
阅读次数:
63
0 概述 1)准备3台客户机(关闭防火墙、静态ip、主机名称) 2)安装JDK 3)配置环境变量 4)安装Hadoop 5)配置环境变量 6)配置集群 7)单点启动 8)配置ssh 9)群起并测试集群 1 虚拟机准备 1). 克隆虚拟机 2). 修改克隆虚拟机的静态IP 3). 修改主机名 4). ...
分类:
系统相关 时间:
2020-07-12 22:11:59
阅读次数:
88
java.io.IOException: Could not locate executable null\bin\winutils.exe in the Hadoop binaries. 出现这个问题的原因是我们在windows上模拟开发环境,但并没有真正的搭建hadoop和spark 解决办法: ...
1 Hadoop是什么 2 Hadoop三大发行版本 Hadoop三大发行版本:Apache、Cloudera、Hortonworks。 Apache版本最原始(最基础)的版本,对于入门学习最好。 Cloudera在大型互联网企业中用的较多。 Hortonworks文档较好。 Apache Hado ...
分类:
其他好文 时间:
2020-07-12 00:59:06
阅读次数:
92
从源头上解决,在上传到HDFS之前,就将多个小文件归档 使用tar命令 带上参数-zcvf 示例: tar -zcvf xxx.tar.gz 小文件列表 如果小文件已经上传到HDFS了,可以使用在线归档 使用hadoop archive命令 示例: hadoop archive -archiveNa ...
分类:
其他好文 时间:
2020-07-11 17:00:14
阅读次数:
76