1.准备国家的json数据 将准备好的json数据放在指定的目录下,此处可以重这里下载 2.测试编写python脚本处理json提取字段值 3.读取文本循环遍历提取字段值 4.最终处理数据结果 CSV格式: Excel格式: ...
分类:
编程语言 时间:
2018-06-30 15:23:27
阅读次数:
188
转自:https://www.cnblogs.com/redick/p/6644594.html 1.InputStream、OutputStream 处理字节流的抽象类 InputStream 是字节输入流的所有类的超类,一般我们使用它的子类,如FileInputStream等. OutputSt ...
分类:
其他好文 时间:
2018-06-12 23:28:58
阅读次数:
227
在hadoop上用Python实现WordCount 一、简单说明 本例中我们用Python写一个简单的运行在Hadoop上的MapReduce程序,即WordCount(读取文本文件并统计单词的词频)。这里我们将要输入的单词文本input.txt和Python脚本放到/home/data/pyth ...
分类:
编程语言 时间:
2018-06-09 14:36:55
阅读次数:
493
sed简介 sed是一个流(stream)编辑器,每次读取文本中的一行,放到内存的缓冲区(pattern space),然后使用sed命令处理pattern space中的内容,处理完成后,默认输出至屏幕(stdout)。随后处理下一行数据。 sed工作特性 不直接编辑源文件,拷贝一份至patter ...
分类:
系统相关 时间:
2018-06-05 19:58:40
阅读次数:
271
/**. */ package com.encdata.lihao; import com.mysql.fabric.xmlrpc.base.Array; import java.io.BufferedReader; import java.io.File; import java.io.FileI... ...
分类:
其他好文 时间:
2018-05-25 14:02:11
阅读次数:
162
缓冲输入字节流: | InputStream 输入字节流的基类 | FileInputStream 读取文件的输入字节流 | BufferedInputStream 缓冲输入字节流 作用:提高读取文件的效率缓冲输出字节流: | OutputStream 输出字节流的基类 | FileOutputSt ...
分类:
其他好文 时间:
2018-05-25 00:24:07
阅读次数:
135
查找 find /文件夹 搜索名字 读取文本 cat 文件名 新建文件及文件夹 mkdir 文件夹名 touch 文件名(带后缀) 删除文件及文件夹 rm -rf 文件夹名 rm -f 文件名(带后缀) 修改及保存文本 vi 文件名 //进入编辑模式 i //插入字符 x //删除当前字符: dd ... ...
分类:
系统相关 时间:
2018-05-23 15:00:05
阅读次数:
197
输入字符流: | Reader 输入字符流的基类。 抽象类 | FileReader 读取文件的输入字符流 | BufferedReader 缓存输入字符流(提高效率和扩展了FileReader的功能)。内部其实也维护了一个字符数组扩展功能:readLine() 一次读取文本的一行数据,如果读取到了 ...
分类:
其他好文 时间:
2018-05-22 20:47:05
阅读次数:
142
一· Java的流 (1).一个流是一个输入设备或输出设备的抽象表示,具有明确的方向性, (2)分为 输入流inputStream和reader作为基类 。 只能从中读取数据,不能写入数据 输出流outStream和writer作为基类 。只能其中写入数据,不能从中读取数据 (3).操作不同分为字符 ...
分类:
其他好文 时间:
2018-05-21 19:46:20
阅读次数:
149