处理文本 长距离依赖关系 处理变长输入序列 原理 展开之后是一个$T$层的前馈神经网络 计算公式 $$net_t = Ux_t + Wh_{t 1}$$ $$h_t = f(net_t)$$ $$y = g(Vh_T)$$ $f$为激活函数,$g$为最后的分类函数(如Softmax) $U$为输入层 ...
分类:
其他好文 时间:
2019-11-24 17:17:35
阅读次数:
71
非结构化数据处理(文本)正则match 方法:从起始位置开始查找,一次匹配# match 方法用于查找字符串的头部(也可以指定起始位置),它是一次匹配,只要找到了一个匹配的结果就返回,而不是查找所有匹配的结果。它的一般使用形式如下:# 其中,string 是待匹配的字符串,pos 和 endpos ...
分类:
其他好文 时间:
2019-11-22 12:05:45
阅读次数:
74
1.HTTP协议简介http(超文本传输)协议,是互联网应用最为广泛的一种网络协议,主要用于Web服务,通过计算机处理文本信息,格式为HTML(超文本标记语言)来实现。2.Http协议的版本:0.9版本:仅支持html页面(已被淘汰);1.0版本:(1)引入MIME(多用途互联网邮件扩展)机制,引入这个机制之后就可以发送多媒体信息;(2)引入keep-alive机制,支持持久链接的功能(但这个ke
分类:
Web程序 时间:
2019-11-18 23:26:38
阅读次数:
154
awk 入门教程 作者: 阮一峰 日期: 2018年11月 7日 感谢 腾讯课堂NEXT学院 赞助本站,腾讯官方的IT课程 免费试学。 awk是处理文本文件的一个应用程序,几乎所有 Linux 系统都自带这个程序。 它依次处理文件的每一行,并读取里面的每一个字段。对于日志、CSV 那样的每行格式相同 ...
分类:
其他好文 时间:
2019-11-16 19:18:50
阅读次数:
87
pandas模块 "pandas官方文档" pandas基于Numpy,可以看成是处理文本或者表格数据。pandas中有两个主要的数据结构,其中Series数据结构类似于Numpy中的一维数组,DataFrame类似于多维表格数据结构。 pandas是python数据分析的核心模块。它主要提供了五大 ...
分类:
其他好文 时间:
2019-11-13 10:46:19
阅读次数:
74
AWK是一种处理文本文件的语言,是一个强大的文本分析工具。Linux环境中自带。 awk调用方法 1. 命令行 2. shell脚本方式 3. awk脚本方式 ` ...
分类:
系统相关 时间:
2019-11-08 20:44:45
阅读次数:
98
[TOC] 一、存储引擎 1.什么是存储引擎? mysql中建立的库=== 文件夹 库中建立的表=== 文件 现实生活中我们用来存储数据的文件有不同的类型,每种文件类型对应各自不同的处理机制:比如处理文本用txt类型,处理表格用excel,处理图片用png等 数据库中的表也应该有不同的类型,表的类型 ...
分类:
数据库 时间:
2019-11-04 00:07:01
阅读次数:
92
正则表达式定义了字符串的模式。 正则表达式可以用来搜索、编辑或处理文本。 正则表达式并不仅限于某一种语言,但是在每种语言中有细微的差别。 正则表达式实例 一个字符串其实就是一个简单的正则表达式,例如 Hello World 正则表达式匹配 "Hello World" 字符串。 .(点号)也是一个正则 ...
分类:
编程语言 时间:
2019-11-03 01:02:27
阅读次数:
83
awk是一个处理文本的编程语言工具,能用简短的程序处理标准输入或文件、数据排序、计算以及生成报表等等。 基本的命令语法:awk option 'pattern {action}' file 其中pattern表示AWK在数据中查找的内容,而action是在找到匹配内容时所执行的一系列命令。花括号用于... ...
分类:
系统相关 时间:
2019-10-29 21:48:56
阅读次数:
115
Sed编译器 2019.10.14 vim /vi 是交互式文本编辑工具。而sed 是流编辑器,非交互式处理文本,一次只处理一行内容。 其中sed编辑指令的格式如下: [address1][,address2] function [argument] 其中,地址参数address1、address2 ...
分类:
其他好文 时间:
2019-10-21 11:28:13
阅读次数:
98