码迷,mamicode.com
首页 >  
搜索关键字:dataframe    ( 1310个结果
pandas模块
pandas的两个主要数据对象:Series,DataFrame Series:是一种类似于以为数组的对象,它由一组数据(各种numpy数据类型)以及一组与之相关的数据标签组成。 仅由一组数据即可产生最简单的Series,并且会自动产生索引: 可以通过Series的values和index分别获取数 ...
分类:其他好文   时间:2017-10-17 19:57:44    阅读次数:178
翻译:Python和SQL Server 2017的强大功能
Python和SQL Server 2017的强大功能 Python是SQL Server 2017的新版本。它的主要目的是允许在SQL Server中使用基于Python的机器学习,但它可以使用的远不止这些,还有任何Python库或框架。为了提供一个可能的示例,Hitendra展示了如何安全地使用 ...
分类:数据库   时间:2017-10-17 18:56:55    阅读次数:310
DataFrame操作
一 通过索引取数据 (ix/loc/iloc) loc (根据索引名称取数据) iloc (根据索引序号取数据) ix (综合两者) 需要注意的地方,1 该类用法必须先通过索引,取到行(series)再取列数据, 直接取列数据会报错 2 通过ix获取数据时,如果索引为int, 则识别为loc, 使用 ...
分类:其他好文   时间:2017-10-15 15:17:19    阅读次数:308
DataFrame查找
一 通过索引取数据 (ix/loc/iloc) loc (根据索引名称取数据) iloc (根据索引序号取数据) ix (综合两者) 需要注意的地方,1 该类用法必须先通过索引,取到行(series)再取列数据, 直接取列数据会报错 2 通过ix获取数据时,如果索引为int, 则识别为loc, 使用 ...
分类:其他好文   时间:2017-10-15 14:42:39    阅读次数:157
Spark SQL中 RDD 转换到 DataFrame (方法二)
1.people.txt:soyo8, 35小周, 30小华, 19soyo,88/** * Created by soyo on 17-10-10. * 使用编程方式定义RDD模式 */ import org.apache.spark.sql.types._ import org.apache.s... ...
分类:数据库   时间:2017-10-10 21:55:24    阅读次数:154
Spark SQL
1.DataFrame与RDD的区别 RDD是分布式的 Java对象的集合 DataFrame是一种以RDD为基础的分布式数据集,也就是分布式的Row对象的集合(每个Row对象代表一行记录),提供了详细的结构信息,也就是我们经常说的模式(schema).简单理解就是类似表 2.Schema 是什么 ...
分类:数据库   时间:2017-10-10 21:43:38    阅读次数:225
scala spark and dataframe example
承接上篇pyspark,这里再给一个我写的scala的例子。这个的目的是从埋点事件里统计需要的几个事件并分区域累计,kafka stream实时计算 要说一下,版本特别重要,一个是spark版本(<2, 2.0, >2.0),一个是scala版本(主要是<2.11和2.11),注意匹配 pom.xm ...
分类:其他好文   时间:2017-10-09 14:14:50    阅读次数:242
[Spark][Python][RDD][DataFrame]从 RDD 构造 DataFrame 例子
[Spark][Python][RDD][DataFrame]从 RDD 构造 DataFrame 例子 from pyspark.sql.types import * schema = StructType( [ StructField("age",IntegerType(),True), Str ...
分类:编程语言   时间:2017-10-07 23:33:06    阅读次数:177
[Spark][Python][DataFrame][RDD]DataFrame中抽取RDD例子
[Spark][Python][DataFrame][RDD]DataFrame中抽取RDD例子 sqlContext = HiveContext(sc) peopleDF = sqlContext.read.json("people.json") peopleRDD = peopleDF.map( ...
分类:编程语言   时间:2017-10-07 22:46:45    阅读次数:220
[Spark][Python][DataFrame][RDD]从DataFrame得到RDD的例子
[Spark][Python][DataFrame][RDD]从DataFrame得到RDD的例子 $ hdfs dfs -cat people.json $pyspark sqlContext = HiveContext(sc) peopleDF = sqlContext.read.json("p ...
分类:编程语言   时间:2017-10-07 17:31:36    阅读次数:191
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!