tidyverse library把data.frame拓展tibble、读取数据readr、清洗数据tidyr、文本处理stringr、加工数据dplyr、画图ggplot2等library打包在一起。读取数据readxl、时间处理lubridate另外加载。 The goal of tidyr ...
分类:
编程语言 时间:
2020-05-28 23:09:10
阅读次数:
113
awk工作原理 第一步:执行BEGIN{action;...}语句块中的语句。 第二步:从文件或标准输入(stdin)读取一行,然后执行pattern{action;...}语句块,它逐行扫描文件,从第一行到最后一行重复这个过程,直到文件全部被读取完毕。 第三步:当读至输入流末尾时,执行END{ac ...
分类:
其他好文 时间:
2020-05-17 17:36:16
阅读次数:
70
JSON Lines文本文件格式的文档 本页描述JSON Lines文本格式,也称为换行符分隔的JSON。JSON Lines是一种方便的格式,用于存储可以一次处理一条记录的结构化数据。它与Unix样式的文本处理工具和Shell管道一起很好地工作。这是日志文件的绝佳格式。这也是在协作流程之间传递消息 ...
分类:
Web程序 时间:
2020-05-16 19:07:53
阅读次数:
87
AWK是一门程序设计语言,在linux领域,它是一个功能非常强大的文本处理工具。 语法: awk [option] '/pattern/{action}' file... 参数option -F 指定分隔符(可以用正则设置多个分隔符,默认分隔符为任意个连续空格) 条件pattern、动作action ...
分类:
系统相关 时间:
2020-05-12 09:42:44
阅读次数:
71
字符串和文本处理库 Conversion库:对C++类型转换的增强,提供更强的类型安全转换、更高效的类型安全保护、进行范围检查的数值转换和词法转换。 Format库:实现类似printf的格式化对象,可以把参数格式化到一个字符串,而且是完全类型安全的。 IOStream库 :扩展C++标准库流处理, ...
分类:
其他好文 时间:
2020-05-12 09:39:27
阅读次数:
77
sed 功能强大的流式文本编辑器 补充说明 sed 是一种流编辑器,它是文本处理中非常重要的工具,能够完美的配合正则表达式使用,功能不同凡响。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏 ...
分类:
系统相关 时间:
2020-05-11 18:23:33
阅读次数:
69
https://www.ctolib.com/docs/sfile/tutorialspoint-programming/awk/26.html Awk教程 AWK是一种解释性编程语言。它是非常强大的,专为文本处理。AWK 提供了极其强大的功能:可以进行样式装入、流控制、数学运算符、进程控制语句甚至 ...
分类:
其他好文 时间:
2020-05-09 00:34:49
阅读次数:
48
https://zhuanlan.zhihu.com/p/64419762 每当拿到原始数据,不如意十有八九,快速准确的清洗数据也是必备技能,数据清洗正好是 PowerQuery 的强项,本文就来介绍两个常用的 M 函数:Text.Remove 和 Text.Select。 看到以 Text 开头的 ...
分类:
其他好文 时间:
2020-05-07 15:25:07
阅读次数:
267
一、 grep 工具 grep [选项] '关键字' 文件名 选项: -i:不区分大小写 -v:查找不包含的内容行(反选) -w:按单词搜索 -o:打印匹配关键字 -c:统计匹配到的次数 -n:显示行号 -r:逐层遍历目录查找 -A:显示匹配行及后面多少行 -B:显示匹配行及前面多少行 -C:显示匹 ...
分类:
其他好文 时间:
2020-05-02 00:06:31
阅读次数:
91