命名实体识别(Named Entity Recognition)也是自然语言处理中的一个难关,特别是中文这样没有大小写等固定形态的语言。上次介绍过《实战HMM-Viterbi角色标注中国人名识别》,这次基于类似的原理,为HanLP实现中文地址地名(NS)的自动识别。原理训练对熟语料自动角色标注,统计...
分类:
其他好文 时间:
2014-11-17 22:42:38
阅读次数:
197
# -*- coding:utf-8 -*-
import re,urllib,sys,os,time
def getAllUrl():
entry=sys.argv[1]
#try:
getPage=urllib.urlopen(entry).read()
#except:
# print "Error"
pattern=re.compile(r'')
web_site_p...
分类:
编程语言 时间:
2014-11-17 17:55:13
阅读次数:
304
The string"PAYPALISHIRING"is written in a zigzag pattern on a given number of rows like this: (you may want to display this pattern in a fixed font fo...
分类:
其他好文 时间:
2014-11-17 15:29:56
阅读次数:
198
一、捕获组的概念捕获组可以通过从左到右计算其开括号来编号,编号是从1 开始的。例如,在表达式((A)(B(C)))中,存在四个这样的组:1 ((A)(B(C)))2 (A)3 (B(C))4 (C)组零始终代表整个表达式。 以(?) 开头的组是纯的非捕获 组,它不捕获文本,也不针对组合计进行计数。与...
分类:
其他好文 时间:
2014-11-17 12:09:47
阅读次数:
248
exists(key):确认一个key是否存在
del(key):删除一个key
type(key):返回值的类型
keys(pattern):返回满足给定pattern的所有key
randomkey:随机返回key空间的一个key...
分类:
其他好文 时间:
2014-11-17 10:40:50
阅读次数:
285
Grep想说爱你不容易grep:GlobalsearchREgularexpressionandPrintouttheline文本搜索工具:根据用户指定的“模式(pattern)”对目标文本进行过滤,显示被模式匹配到的行。用法:grep[OPTION]...‘PATTERN‘FILE...grep--color自动执行着色正则表达式:是由一类字符书写的模式,其..
分类:
其他好文 时间:
2014-11-17 07:02:19
阅读次数:
366
1、问:grep、egrep是什么?答:grep是文本搜索工具,grep是根据用户指定的‘模式(pattern)’对目标文本进行过滤,显示被模式匹配到的行。2、问:grep、egrep中用户指定的‘模式(pattern)’是什么?分为几类?答:grep中用户指定的‘模式’是一种由特殊字符组成的具有某种..
分类:
系统相关 时间:
2014-11-17 07:00:01
阅读次数:
344
import java.util.HashMap;import java.util.Map;import java.util.regex.Matcher;import java.util.regex.Pattern;public class RegexExam { public stati...
分类:
编程语言 时间:
2014-11-16 22:52:14
阅读次数:
247
讲grep与egrep之前,我们先要知道grep与egrep是两种文本搜索工具。而文本搜索类工具就是根据用户指定的“模式(pattern)”对目标文本进行过滤,显示被模式匹配到的行。正则表达式其定义:由一类字符书写的模式,其中有些字符不表示字符的字面意义,而是表示控制或通配的功能;..
分类:
其他好文 时间:
2014-11-16 18:55:19
阅读次数:
217
1、模式定义
原型模式(Prototype Pattern):原型模式是一种对象创建型模式,用原型实例指定创建对象的种类,并且通过复制这些原型创建新的对象。原型模式允许一个对象再创建另外一个可定制的对象,无须知道任何创建的细节。
原型模式的基本工作原理是通过将一个原型对象传给那个要发动创建的对象,这个要发动创建的对象通过请求原型对象拷贝原型自己来实现创建过程。
2、模式结构
原型模式...
分类:
其他好文 时间:
2014-11-16 13:28:43
阅读次数:
190