Spark文档阅读之Programming Guides - Quick Start。学习spark-shell任务提交方法和独立spark任务的创建和提交执行。 ...
分类:
其他好文 时间:
2020-06-15 20:41:53
阅读次数:
51
https://www.cse.unsw.edu.au/~cs9313/20T2/slides/L2.pdf https://drive.google.com/drive/folders/13_vsxSIEU9TDg1TCjYEwOidh0x3dU6es 第二节课花了40分钟讲,如果dataNode ...
分类:
其他好文 时间:
2020-06-15 18:02:14
阅读次数:
50
hadoop文件目录结构 http://192.168.21.110:50070/explorer.html#/ 登录后会看到hadoop的数据目录 报错解决 Permission denied: user=dr.who, access=WRITE, inode="/":root:supergrou ...
分类:
其他好文 时间:
2020-06-15 17:48:08
阅读次数:
55
往大数据方向发展需要学哪些技术?网上一搜真是指不胜屈。对于小白来说,实在是一头雾水,到底哪些是当下流行的?哪些是必须要先学会的?流行?主次搞不清。为了解决这些疑惑,羚羊专门花了些时间, 挨个技术去研究对比归类,大概总结出以下的技术点: 文件存储: Hadoop HDFS、GFS、KFS、Tachyo ...
分类:
其他好文 时间:
2020-06-15 12:10:17
阅读次数:
249
企业介绍: 中国电信上海理想信息产业(集团)有限公司,成立于1999年,注册资本7000万元,是上海市投资规模较大的信息技术企业之一。母公司员工500多人,其中80%以上员工具有大学本科以上学历,从事软件开发人员超过50%,是一个典型的“知识密集型”企业。 通过整合公司内各事业部多年大型项目实施的整 ...
分类:
其他好文 时间:
2020-06-15 00:04:45
阅读次数:
78
1添加pom.xml配置 <build> <sourceDirectory>src/main/scala</sourceDirectory> <testSourceDirectory>src/test/scala</testSourceDirectory> <plugins> <plugin> <g ...
分类:
数据库 时间:
2020-06-14 18:56:57
阅读次数:
138
HDFS【shell操作hdfs命令】 上传 -help:输出这个命令参数 hadoop fs -help rm -moveFromLocal:从本地剪切粘贴到HDFS hadoop fs -moveFromLocal ./kongming.txt /sanguo/shuguo -copyFromL ...
分类:
系统相关 时间:
2020-06-14 18:55:11
阅读次数:
64
代码: import re import datetime from pyspark.sql import SparkSession from pyspark import SparkContext from elasticsearch import Elasticsearch spark=Spar ...
分类:
编程语言 时间:
2020-06-14 17:09:05
阅读次数:
125
4个site.xml文件和 3个env.sh文件和1个slave文件 1,core-site.xml 2,hdfs-site.xml 3,mapred-site.xml 4,yarn-site.xml 5,hadoop-env.sh 6,mapred-env.sh 7,yarn-env.sh 8,s ...
分类:
其他好文 时间:
2020-06-14 17:07:49
阅读次数:
141
1. 用idea的maven项目 package 打包, 去 Linux 执行 spark-submit --class com.Spark_HDFS --master local ./SXC-1.0-SNAPSHOT.jar 遇到 找不到主类 , 这时候需要更加稳定的打包方式 去打包 scala ...
分类:
其他好文 时间:
2020-06-14 12:57:57
阅读次数:
127