码迷,mamicode.com
首页 >  
搜索关键字:pyspark    ( 164个结果
spark开发常见问题之一:java.io.IOException: Could not locate executable null\bin\winutils.exe in the Hadoop binaries.
最近在学习研究pyspark机器学习算法,执行代码出现以下异常: 19/06/29 10:08:26 ERROR Shell: Failed to locate the winutils binary in the hadoop binary pathjava.io.IOException: Cou ...
分类:编程语言   时间:2020-01-14 13:18:30    阅读次数:110
pyspark基础知识点
1. 查 1.1 行元素查询操作 像SQL那样打印列表前20元素,show函数内可用int类型指定要打印的行数: df.show() df.show(30) 以树的形式打印概要: df.printSchema() 获取头几行到本地: list = df.head(3) # Example: [Row ...
分类:其他好文   时间:2019-12-29 18:39:19    阅读次数:73
jupyter调教
python2,python3两个kernel共存 引入:事情的起因是公司需要用pyspark,而将pyspark封装到jupyter中。而公司spark集群上都是py2的解释器。因此jupyter上运行时需要使用py2的kernel 环境:使用conda3自带的jupyter,已装py3解释器,非 ...
分类:其他好文   时间:2019-12-29 12:57:28    阅读次数:73
spark 怎么去连接 ElasticSearch
https://stackoverflow.com/questions/52659109/cannot read from elasticsearch using pyspark https://stackoverflow.com/questions/35982550/how to read dat ...
分类:其他好文   时间:2019-12-23 18:29:41    阅读次数:104
linux 下 python 运行 pyspark
from pyspark import SparkContext Traceback (most recent call last): File "<stdin>", line 1, in <module> 要先安装 findspark 包 然后执行 pip install findsparp 再进 ...
分类:编程语言   时间:2019-12-15 14:44:20    阅读次数:206
serializers进阶
文章出处 https://www.cnblogs.com/pyspark/p/8607801.html 【01】前言 serializers是什么?官网是这样的”Serializers allow complex data such as querysets and model instances ...
分类:其他好文   时间:2019-11-28 21:05:08    阅读次数:105
spark-submit之使用pyspark
在linux下,执行pyspark代码 —— 实测有效 1. 安装pycharm或者spyder,然后在其中编写代码和执行语句 2. 通过job来提交,即spark-submit提交,下面主要讲这种方法 首先假设,自己写的 *.py 文件包含了这些包,即通过import导入 import os fr ...
分类:其他好文   时间:2019-11-17 20:39:47    阅读次数:185
SparkSQL
Spark SQL 增加了DataFrame 即带有Schema信息的RDD DataFrame 创建 启动pyspark(由于内存不够 启动本地,模式) pyspark --master local pyspark 自动生成 sc,sparksession from pyspark import ...
分类:数据库   时间:2019-11-09 22:07:07    阅读次数:95
spark操作hbase
hbase的操作命令 https://www.cnblogs.com/lzh-boy/p/8966826.html code:查看表数据 from pyspark.sql import SparkSessionimport osos.environ['PYSPARK_PYTHON']='/opt/a ...
分类:其他好文   时间:2019-09-29 18:20:50    阅读次数:110
DRF源码-fields.py
https://www.cnblogs.com/pyspark/p/8607801.html https://www.cnblogs.com/LYliangying/articles/9896548.html fieids.py主要定义了各种字段的序列化类。Field是基类。 class Field ...
分类:其他好文   时间:2019-08-03 12:55:12    阅读次数:103
164条   上一页 1 2 3 4 5 6 ... 17 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!