码迷,mamicode.com
首页 >  
搜索关键字:大数据开发 Hadoop Spark    ( 19831个结果
COMP9313 Lab1 SPARK pyspark 安装
遇到的问题: 1. SPARK & HADOOP 不能安装在有空格的目录下 比如 programs file这种 2. 需要设置环境变量 PYSPARK_PYTHON PYSPARK_DRIVER_PYTHON 到3.6.5的环境,不然3.6 3.7会撞车 ...
分类:其他好文   时间:2020-06-29 21:28:22    阅读次数:66
scala
scala 一: scala基础 1 概念 Scala就是一门语言, 是spark的框架语言. 继承了面向对象编程和函数式编程. Scala是一种多范式的编程语言,其设计的初衷是要集成面向对象编程和函数式编程的各种特性。Scala运行于Java平台(Java虚拟机),并兼容现有的Java程序。htt ...
分类:其他好文   时间:2020-06-29 18:52:39    阅读次数:75
spark读取文件时对字符编码的支持
在spark中常使用textFile读取文件,默认的是UTF-8编码,但在实际读取文件时,存在不同的文件编码,如果不是UTF-8编码的文件,便不能直接使用这个方法读文件。 以下是2种读取不同编码文件的方法,下面以ANSI的中文简体编码为例,codepage是1252. 方法1:使用decode方法 ...
分类:其他好文   时间:2020-06-29 17:21:19    阅读次数:202
安装hadoop2.9.2 jdk1.8 centos7
安装JDK1.8 查看JDK1.8的安装 https://www.cnblogs.com/TJ21/p/13208514.html 安装hadoop 上传hadoop 下载hadoop 地址http://mirrors.hust.edu.cn/apache/hadoop/common/ 放到mkdi ...
分类:其他好文   时间:2020-06-29 17:13:37    阅读次数:53
【Hadoop篇05】Hadoop配置集群时间同步
做任何事都要经受得挫折,要有恒心和毅力,满怀信心坚持到底 Hadoop配置集群事件同步 时间同步方式 找一台机器,作为时间服务器,所有的机器与这台集群时间进行定时的同步,比如,每隔十分钟,同步一次时间 配置时间同步步骤 1.时间服务器配置(必须root用户) rpm -qa|grep ntp 2.修 ...
分类:其他好文   时间:2020-06-29 17:07:37    阅读次数:45
spark-submit提交任务到yarn错误
1.Error initializing SparkContext. 20/06/29 05:52:43 INFO yarn.Client: Deleted staging directory hdfs://master:9000/user/hadoop/.sparkStaging/applicat ...
分类:其他好文   时间:2020-06-29 15:02:48    阅读次数:96
spark之通过sparksql中的SQL语句实现电影点评系统用户行为分析
用户文件users.dat的格式描述如下: 1. userid::gender::age::occupation::zip-code 2. 用户id、性别、年龄、职业、邮政编码 评级文件ratings.dat的格式描述如下: 1. userid::movieid::rating::timestamp ...
分类:数据库   时间:2020-06-29 00:44:59    阅读次数:129
智慧工厂管理平台怎么建设,智慧工厂管理系统平台开发
智慧工厂管理平台怎么建设,智慧工厂管理系统平台开发 一、智慧工厂管理平台概述: 互联网是个神奇的大网,大数据开发和软件定制也是一种模式,这里提供最详细的报价,如果你真的想做,可以来这里,这个手机的开始数字是一伍扒中间的是壹壹三三最后的是泗柒泗泗,按照顺序组合起来就可以找到,我想说的是,除非你想做或者 ...
分类:其他好文   时间:2020-06-29 00:24:04    阅读次数:86
spark上的深度学习——按照雅虎的做法,本质上就是rdd.pipe,推理部分直接代理给tensorflow
from:https://juejin.im/post/5ad4b620f265da23a04a0ad0 看原文代码即可知道本质 Deep Learning On Spark 经过刚才的介绍,我们知道spark是一个分布式的通用计算框架,而以tensorflow为代表的deep learning是一 ...
分类:其他好文   时间:2020-06-28 13:38:28    阅读次数:60
Hadoop伪分布模式配置
Hadoop伪分布模式配置 Hadoop共有三种部署方式:本地模式,伪分布模式及集群模式;本次安装配置以伪分布模式为主,即在一台服务器上运行Hadoop(如果是分布式模式,则首先要配置Master主节点,其次配置Slave从节点)。以下说明如无特殊说明,默认使用root用户登录主节点,进行以下的一系 ...
分类:其他好文   时间:2020-06-28 00:11:54    阅读次数:74
19831条   上一页 1 ... 52 53 54 55 56 ... 1984 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!