在学习nlp自然语言处理的过程中,免不了要使用中文分词资源作为分词依据或前期调研。所以想研究中文分词,第一步需要解决的就是资源问题。 作为中文信息处理的壁垒,中文分词在国内的关注度似乎远远超过了自然语言处理的其他研究领域。在中文分词中,资源的重要性又不言而喻,最大匹配法(正向、逆向)等需要一个好的词 ...
分类:
其他好文 时间:
2016-09-03 14:56:01
阅读次数:
197
Scanner是一个使用正则表达式来解析基本类型和字符串的简单文本扫描器。Scanner 使用分隔符模式将其输入分解为标记,默认情况下该分隔符模式与空白匹配。然后可以使用不同的 next 方法将得到的标记转换为不同类型的值。 以下代码: 当输入如下: 第一个in.nextInt()会读取数字12,但 ...
分类:
编程语言 时间:
2016-09-03 13:29:25
阅读次数:
157
spoj1811 给两个长度小于100000的字符串 A 和 B,求出他们的最长公共连续子串。 先将串 A 构造为 SAM ,然后用 B 按如下规则去跑自动机。用一个变量 lcs 记录当前的最长公共子串,初始化为0。设当前状态结点为 p,要匹配的字符为 c,若 go[c] 中有边,说明能够转移状态, ...
分类:
其他好文 时间:
2016-09-03 09:40:27
阅读次数:
168
最近做项目时,用到了hibernnate,批量删除10000条数据时,删除时前台将id传到后台,用in匹配去删除,页面直接卡死。 解决方法,将传过来的10000条id分批删除,每删除五百条后,调用getCurrentSession().flush。问题的到解决 以下资料是涉及flush参考。值得学习 ...
分类:
Web程序 时间:
2016-09-03 00:56:30
阅读次数:
164
1、显示当前系统上root、fedora或user1用户的默认shell;PS:第一眼看到问题可能会有点头疼,那就把问题拆分完成,组合多个简单命令完成复杂工作
第一步,查找到这些用户并显示:使用|或衔接多个过滤条件:
[root@CentOS7~]#grep-E"^root\>|^fedora\>|^user1\>"/etc/..
分类:
系统相关 时间:
2016-09-02 23:37:06
阅读次数:
415
box-sizing 属性允许您以特定的方式定义匹配某个区域的特定元素。包括border-box|content-box(默认)|padding-box 先来看下代码,比较一下它们之间的区别: css部分: 实现效果如下: 现在我们来看下区别: 上面的三张图,第一张width=150px;第二张为1 ...
分类:
Web程序 时间:
2016-09-02 20:32:51
阅读次数:
172
来源:http://www.cnblogs.com/kaituorensheng/archive/2012/08/20/2648209.html 正则表达式中,group()用来提出分组截获的字符串,()用来分组 究其因 1. 正则表达式中的三组括号把匹配结果分成三组 group() 同group( ...
分类:
编程语言 时间:
2016-09-02 20:25:25
阅读次数:
145
来源:百度知道 这个叫断言,只匹配一个位置比如,你想匹配一个“人”字,但是你只想匹配中国人的人字,不想匹配法国人的人就可以用一下表达式(?=中国)人所以,楼主的表达式与其他通配符连用才能起到效果。(?=.*[a-z])\d+这个就表示 匹配以“任意字符连着一个小写字母”开头的数字,只匹配数字。(?< ...
分类:
其他好文 时间:
2016-09-02 20:24:44
阅读次数:
154
FCSFCS訊框檢查序列(Frame Check Sequence, FCS)為 32 位元 CRC 檢查碼。所謂的CRC錯誤就是指訊框(Frame->網路中傳輸的資料,在連結層中的最小單位)的FCS值與計算得到的FCS值不匹配,可能的原因為傳輸中的Frame被損壞所造成。 FCS是802.3訊框和 ...
分类:
编程语言 时间:
2016-09-02 20:20:31
阅读次数:
1599
1.修改GameManager类中的GameManager::m_serverIP = "192.168.1.225"; 2.SceneMain类中在点击房间类型时,发送自己游戏的类型ID,如我的游戏是3101,所以这里改成31,而不用正常情况下的GameTypeIndex_CD m_sceneDa ...
分类:
其他好文 时间:
2016-09-02 18:48:26
阅读次数:
106