正则表达式的本质是使用一系列特殊字符模式,来表示某一类字符串。正则表达式无疑是处理文本最有力的工具,而.NET的System.dll类库提供的System.Text.RegularExpressions.Regex类实现了验证正则表达式的方法。Regex 类表示不可变(只读)的正则表达式。它还包含各 ...
分类:
Web程序 时间:
2016-11-23 07:36:18
阅读次数:
276
Python自然语言处理工具小结 作者:白宁超 2016年11月21日21:45:26 1 Python 的几个自然语言处理工具 TextBlob:TextBlob 是一个处理文本数据的 Python 库。提供了一些简单的api解决一些自然语言处理的任务,例如词性标注、名词短语抽取、情感分析、分类、 ...
分类:
编程语言 时间:
2016-11-21 23:39:32
阅读次数:
818
1.字符串变量用于存储并处理文本; 2.字符串变量用于包含有字符的值,在创建字符串后,就可以对它进行操作了,可以直接在函数中使用字符串,或把它存储在变量中; <?php $txt="Hello world"; //当你赋一个文本值给变量时,请记得文本值加上单引号或双引号 echo $txt; ?> ...
分类:
Web程序 时间:
2016-11-18 09:42:03
阅读次数:
213
背景: 通常在UNIX下面处理文本文件的方法是sed、awk等shell命令,对于处理大文件受CPU,IO等因素影响,对服务器也有一定的压力。关于sed的说明可以看了解sed的工作原理,本文将介绍通过python的mmap模块来实现对大文件的处理,来对比看他们的差异。 说明: mmap是一种虚拟内存 ...
分类:
编程语言 时间:
2016-11-17 13:19:00
阅读次数:
477
以下所写的内容在菜鸟教程中可以找到。如果有需要可以去看看。 正则表达式定义了字符串模式,可以用来搜索,编辑或处理文本;它不仅限于某一种语言,但是在每一种语言中有细微的差别。 java.util.regex包主要包括以下三个类: 1.Pattern类:pattern对象是一个正则表达式的编译表示。Pa ...
分类:
编程语言 时间:
2016-11-15 14:23:15
阅读次数:
198
HTTP协议:超文本传输协议(HTTP,HyperTextTransferProtocol)是互联网上应用最为广泛的一种网络协议。所有的WWW文件都必须遵守这个标准。设计HTTP最初的目的是为了提供一种发布和接收HTML页面的方法。1960年美国人TedNelson构思了一种通过计算机处理文本信息的方法,并称之为..
分类:
Web程序 时间:
2016-11-15 01:35:54
阅读次数:
362
文章导读 正则表达式的本质是使用一系列特殊字符模式,来表示某一类字符串。正则表达式无疑是处理文本最有力的工具,而.NET提供的Regex类实现了验证正则表达式的方法。Regex 类表示不可变(只读)的正则表达式。它还包含各种静态方法,允许在不显式创建其他类的实例的情况下使用其他正则表达式类。 基础梳 ...
Perl 有很多其它语言所没有的特性,这其中对正则表达式(regular expression)的强大支持是它最为突出的一个亮点。正则表达式使得 perl 在处理文本时具有非常强大的优势:快速,灵活而且很可靠,甚至可以说,强大文本处理能力,是 perl 在众多语言中最为闪耀的一个特点。 因此学习 p ...
分类:
其他好文 时间:
2016-10-31 07:10:13
阅读次数:
184
string (字符串) 对象的属性及方法,如下 又称为引用类型 大部分是系统自身转换成伪对象,方便 使用这些方法 处理文本字符串 var str = 'hello'; 这里保存的hello是一个字符串,是字符串字面量,就是字面上的意思 console.log(str.length) 这里打印出的长 ...
分类:
Web程序 时间:
2016-10-30 20:22:18
阅读次数:
246
超文本传输协议简称http协议,它是互联网上应用最为广泛的一种协议。所有的www文件都必须遵守这个标准。设计http最初的目的是为了提供一种发布和接收的html页面方法。1960年美国人Ted Neslon构思了一种通过计算机处理文本信息的方法,并称之为超文本,这成为了http超文本传输协议架构的发 ...
分类:
Web程序 时间:
2016-10-29 16:39:51
阅读次数:
187