1、不同类别文本量统计,类别不平衡差异 2、文本长度统计 3、文本处理,比如文本语料中简体与繁体共存,这会加大模型的学习难度。因此,他们对数据进行繁体转简体的处理。 同时,过滤掉了对分类没有任何作用的停用词,从而降低了噪声。 4、上文提到训练数据中,存在严重的样本不均衡问题,如果不对该问题做针对性的 ...
分类:
其他好文 时间:
2019-07-02 16:15:03
阅读次数:
135
Linux学习路线图运维学习需要分为四个阶段:①linux初级入门②linux中级进阶③linux高级提升④资深方向细化。第一阶段:初级入门Linux基础知识、基本命令(起源、组成、常用命令如cp、ls、file、mkdir等常见操作命令)Linux用户及权限基础Linux系统进程管理进阶Linux高效文本、文件处理命令(vim、grep、sed、awk、find等命令)第二阶段:中级进阶(基础运
分类:
系统相关 时间:
2019-07-02 13:29:03
阅读次数:
164
pwd命令 显示当前所在的目录 pwd命令 显示当前所在的目录 ls命令 显示目录下的子目录和文件 ls 显示当前目录下的子目录和文件 ls命令 显示目录下的子目录和文件 ls 显示当前目录下的子目录和文件 ls -a 显示当前目录下的所以子目录和文件(包括隐藏文件和文件夹) ls -a 显示当前目 ...
分类:
系统相关 时间:
2019-06-30 15:59:18
阅读次数:
118
章节详情 第1章 课程介绍 第2章 变量的高级用法 第3章 函数的高级用法 第4章 Shell编程中的常用工具 第5章 文本处理三剑客之grep 第6章 文本处理三剑客之sed 第7章 文本处理三剑客之awk 第8章 Shell脚本操作数据库实战 第9章 大型脚本工具开发实战 第10章 课程总结 ...
分类:
系统相关 时间:
2019-06-30 14:15:58
阅读次数:
312
char *find_str(char *src, char *dst) { while(*src == *dst){ src++; dst++; if(*dst == 0){ break; } } if( *dst == 0){ return src; } ... ...
分类:
其他好文 时间:
2019-06-29 22:16:22
阅读次数:
92
linux运维学习需要分为四个阶段:初级入门、中级进阶、高级提升、资深方向细化。第一阶段:初级入门初级阶段需要把linux学习路线搞清楚,任何学习都是循序渐进的,所以学linux也是需要有一定的路线。初级入门:Linux基础知识、基本命令(起源、组成、常用命令如cp、ls、file、mkdir等常见操作命令)Linux用户及权限基础Linux系统进程管理进阶Linux高效文本、文件处理命令(vim
分类:
系统相关 时间:
2019-06-26 12:05:16
阅读次数:
158
一些相对高性能的单片机会带以太网接口,网口在MCU里算是比较复杂的外设了,因为它涉及到网络协议栈,通常情况下网络协议栈会运行在一个RTOS中,所以对普通单片机开发者来说网口使用起来相对难度较大一些。在Linux下网口是一个经常使用的接口,由于Linux具备成熟完备的网络通信协议栈,底层驱动厂家也都提 ...
分类:
系统相关 时间:
2019-06-21 15:45:42
阅读次数:
133
目录 Thymeleaf 模板引擎 官方文档下载 Hello World 新建应用 后台控制器 前端页面 浏览器访问测试 Thymeleaf 模板引擎1、Thymeleaf 是 Web 和独立环境的现代服务器端 Java 模板引擎,能够处理HTML,XML,JavaScript,CSS 甚至纯文本。 ...
分类:
其他好文 时间:
2019-06-18 14:03:33
阅读次数:
110
1.文本处理三剑客 在 Shell 下使用这些正则表达式处理文本最多的命令有下面几个工具: 命令 描述 grep 默认不支持扩展表达式,加-E 选项开启 ERE。如果不加-E 使用花括号要加转义符\{\} egrep 支持基础和扩展表达式 awk 支持 egrep 所有的正则表达式 sed 默认不支 ...
分类:
其他好文 时间:
2019-06-15 15:43:56
阅读次数:
109