码迷,mamicode.com
首页 >  
搜索关键字:textfile    ( 261个结果
文件写入补充(序列化对象写入)
student类必须标记序列化using System;using System.Collections.Generic;using System.Text;namespace TextFile{ [Serializable] class Student { public string ...
分类:其他好文   时间:2014-11-19 15:54:42    阅读次数:192
Spark调优
使用Spark有一段时间了,现在记录spark调优的一些经验。1.textFile的minparitition,只是设置最小的partition数目,下界(比如3),当数据量大的时候,改参数不起作用。可以尝试设置成10002. reduceByKey的并行度,也就是reduce的数目。 2.1 s....
分类:其他好文   时间:2014-10-31 23:30:55    阅读次数:326
C# .NET - Sql Bulk Insert from multiple delimited Textfile using c#.net
SqlBulkCopy.WriteToServer has 4 overloads:SqlBulkCopy.WriteToServer (DataRow[]) Copies all rows from the supplied DataRow array to a destination table...
分类:数据库   时间:2014-10-22 09:59:00    阅读次数:341
Hive基础之Hive的存储类型
Hive常用的存储类型有:1、TextFile: Hive默认的存储类型;文件大占用空间大,未压缩,查询慢;2、Sequence File:3、RCFile:facebook开发的一个集行存储和列存储的优点于一身,压缩比更高,读取列更快,它在mr环境中大规模数据处理中扮演着重要的角色;是一种行列存储...
分类:其他好文   时间:2014-08-14 16:01:08    阅读次数:283
TextFile SequencFile性能对比
首先所有的输入格式都继承FileInputFormat,对于TextFile和SequenceFile有对应的TextInputFormat和SequenceFileInputFormat。我们先来看一下TextInputFormat的实现:publicclassTextInputFormatextendsFileInputFormat<LongWritable,Text> implementsJobConfigurable{ p..
分类:其他好文   时间:2014-08-04 18:17:29    阅读次数:677
GraphX笔记
val graph=GraphLoader.edgeListFile(sc,"/home/spark/spark/graphx/data/followers.txt")//加载边时顶点是边上出现的点,定点默认数据是1 val users = sc.textFile("/home/spark/spark/graphx/data/users.txt").map { line=> val field...
分类:其他好文   时间:2014-08-01 23:17:12    阅读次数:323
Spark上对SequenceFile的支持
本文介绍了spark对hadoop sequencefile的读写支持,实现方式以及简单的使用方法。sequencefile和textfile类似,在上下文里有直接提供读取方法,但最终走的还是hadoopFile方法。...
分类:其他好文   时间:2014-07-10 17:11:52    阅读次数:951
HashSet/List 排序
要求:用户从外部导入TXT文件(input textfile),该文件有三列,分别是storeNum,MosrName,MosrNum,如下是一个input textfile的Case:5099,Scoresby,56595250,Scoresby,56595211,Scoresby,5659513...
分类:其他好文   时间:2014-07-06 13:12:43    阅读次数:232
python发送邮件
#!/usr/bin/envpython #-*-coding:utf8-*- importsmtplib fromemail.mime.textimportMIMEText textfile=‘sendmail.html‘ withopen(textfile,‘rb‘)asf: msg=MIMEText(fp.read(),‘html‘,‘utf8‘) msg.set_charset(‘utf8‘) me=‘xxx@163.com‘ you=‘xxxx@qq.com‘ msg[‘Subject‘]=..
分类:编程语言   时间:2014-07-04 06:41:33    阅读次数:325
【spark系列3】spark开发简单指南
分布式数据集创建之textFile 文本文件的RDDs能够通过SparkContext的textFile方法创建,该方法接受文件的URI地址(或者机器上的文件本地路径,或者一个hdfs://, sdn://,kfs://,其他URI).这里是一个调用样例:scala> val distFile...
分类:其他好文   时间:2014-05-29 18:58:27    阅读次数:429
261条   上一页 1 ... 24 25 26 27 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!