搜索关键字：textfile，搜索到261个结果！码迷,mamicode.com！

Spark API编程动手实战-06-对搜狗日志文件深入实战操作

本节中所用到的内容是来自搜狗实验室，网址为：http://www.sogou.com/labs/dl/q.html 我们使用的是迷你版本的tar.gz格式的文件，其大小为87K，下载后如下所示：上传到服务器后，解压并查看：查看Sogou文件内容：该文件的格式如下所示：访问时间 \t 用户ID \t 查询词 \t 该URL在返...

分类：Windows程序时间：2015-01-29 14:40:30 阅读次数：192

Spark API编程动手实战-02-以集群模式进行Spark API实战textFile、cach

操作HDFS：先要保证HDFS启动了：启动spark集群：以spark-shell运行在spark集群上：查看下之前上传到HDFS上的”LICENSE.txt“文件：用spark读取这个文件：使用count统计该文件的行数： ?我们可以看到count 耗...

分类：Windows程序时间：2015-01-28 14:50:25 阅读次数：264

使用Spark计算PV、UV

日志字段格式： id,ip,url,ref,cookie,time_stamp 把日志文件放到HDFS。仅取了1000行。 hadoop fs -put 1000_log hdfs://localhost:9000/user/root/input 计算PV。 scala> val textFile = sc.textFile("hdfs://localhost:9000/user/ro...

分类：其他好文时间：2015-01-28 14:41:15 阅读次数：421

【将txt文本转图片】

【测试类】 1 public static void main(String[] args) 2 { 3 try 4 { 5 File textFile = new File("F:\\java56班\\eclipse-SDK-...

分类：其他好文时间：2015-01-25 22:18:17 阅读次数：168

Hive-4-Hive的文件格式

Hive文件格式 1、 TextFile 默认文件格式数据不做压缩，磁盘开销大，数据解析开销大，可以结合Gzip、Bzip2使用（系统自动检测，执行查询时自动解压）数据不会被Hive切分，所以无法对数据进行并行操作创建命令： 2、 SequenceFile 是Hadoop API提供的一种二进制文件支持使用方便、可分割、可压缩的特点支持三种压缩方式...

分类：其他好文时间：2015-01-24 15:53:06 阅读次数：183

Spark API编程动手实战-02-以集群模式进行Spark API实战textFile、cache、count

Spark API编程动手实战-02-以集群模式进行Spark API实战textFile、cache、count...

分类：Windows程序时间：2015-01-23 11:18:56 阅读次数：272

Delphi 快速读取TXT 指定行的数据

继上次的问题。在提取了大量的Email 数据后。现在读取数据成了一个问题。今天我取过1~100w的数据。明天我要取100w~200w的数据。在不用数据库的情况下，我搞了一个下午。Delphi Tstringlist 和 textfile 的简单读取是满足不了的。Tstringlist加载不了大数据。普通的textfile 读取指定行，必须循环count到指定行。想了一下午，然后想到另类...

分类：Windows程序时间：2014-12-11 19:11:21 阅读次数：359

Managing an Oracle Instance

初始化参数文件：-PFILE：Staticparameterfile,PFILE-SPFILE：Persistentserverparameterfile,SPFILEPFILE--initSID.ora·Textfile·Modifiedwithanoperatingsystemeditor·Modificationsmademanually·Changestakeeffectonthenextstartup·Onlyopenedduringinstancestartup·D..

分类：数据库时间：2014-12-04 18:18:38 阅读次数：308

Spark累加器使用

Spark累加器使用使用spark累加器，解决视频平均播放数计算，以及视频播放数平方和平均值 val totalTimes=sc.accumulator(0l) val totalVids=sc.accumulator(0) val totalPow2Times=sc.accumulator(0d) val timesFile=sc.textFile("/user/zheny...

分类：其他好文时间：2014-11-27 18:24:55 阅读次数：192

使用R语言进行主题发现（一）

写作目的最近由于研究需要，使用R语言对文本进行了主题发现，下面对具体过程进行记录。步骤一：读取文本并进行预处理本实验中主要对从SCI引文数据库中关于bigdata的索引记录进行分析，文件名为download_2.txt 目录为c:\\data\\,具体代码为：#文件路径textfile<-"C:\\...

分类：编程语言时间：2014-11-22 11:49:12 阅读次数：752

共261条上一页 1 ... 23 24 25 26 27 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)