码迷,mamicode.com
首页 >  
搜索关键字:正则表达式 grep sed 字符串    ( 122800个结果
Python编写网页爬虫爬取oj上的代码信息
OJ升级,代码可能会丢失. 所以要事先备份. 一开始傻傻的复制粘贴, 后来实在不能忍, 得益于大潇的启发和聪神的原始代码, 网页爬虫走起!  已经有段时间没看Python, 这次网页爬虫的原始代码是 python2.7版本, 试了一下修改到3.0版本, 要做很多包的更替,感觉比较烦,所以索性就在这个2.7版本上完善了.  首先观赏一下原始代码,我给加了一些注释:  # -*-...
分类:编程语言   时间:2014-05-15 02:39:45    阅读次数:439
[LeetCode]Regular Expression Matching
Regular Expression Matching,正则表达式...
分类:其他好文   时间:2014-05-15 02:35:05    阅读次数:241
LUA string库
string库中所有的字符索引从前往后是1,2,...;从后往前是-1,-2,...string库中所有的function都不会直接操作字符串,而是返回一个结果...
分类:其他好文   时间:2014-05-14 21:44:00    阅读次数:346
为Python添加默认模块搜索路径
为Python添加默认模块搜索路径 方法一:函数添加 1) import sys 2) 查看sys.path 3) 添加sys.path.append("c:\\") 方法二:修改环境变量 windows用户可以修改系统环境变量PYTHONPATH 方法三:增加.pth文件,推荐! 在site-packages添加一个路径文件,如mypkpath.pth,必须以...
分类:编程语言   时间:2014-05-14 21:21:27    阅读次数:419
中文分词选取-不成词个数判断法
运用前面几篇文章中的分词算法,可以把中文中的词语分出来,但是不同算法可能得到的分词结果不一样,到底如何确定那种分词效果最好呢。我们在这篇文章中探讨一种判断分词效果好坏的方法。 在分词的时候,有些单字是不成词的。可以搜索所有分词的可能性,然后对每一种分词结果进行统计,规则如下:每分出一个词就给分词统计结果加一,如果遇到不成词的单字就再给该分词结果加一。得到的结果分别计算出来。选出一个得分最低的就是所要分词的字符串的结果。 下面就用代码实现一下上面的思想。分别用正向最大匹配和逆向...
分类:其他好文   时间:2014-05-14 21:04:01    阅读次数:256
左旋转字符串
题目描述: 定义字符串左旋转操作:把字符串前面的若干个字符移动到字符串尾部,如把字符串 abcdef 左旋转 2 位得到字符串 cdefab。请实现字符串左旋转的函数,要求对长度为 n 的字符串操作的时间复杂度为 O(n),空间复杂度为 O(1)。 解法一:暴力移位法 此方法就是将需要移动的字符串逐个移动到大字符串的末尾 移动一个字符(java方法) /** * * ...
分类:其他好文   时间:2014-05-14 20:55:47    阅读次数:281
练习题(4) -- 一道简单而有有趣的题目
题目如下:一个字符串形如 "yazyypta" 从这个字符串中删除任何字符,得到的字符串都是它的子字符串,比如对于这个字符串 "ya", "ayy", "pta" 都是它的子字符串,所有的子字符串按照字母序比较大小,求最大的大小最大的子字符串 举几个例子 1) abc c 2) bcbxa xa 3) bababa bbba...
分类:其他好文   时间:2014-05-14 20:47:34    阅读次数:235
Eclipse(MyEclipse)下安装使用VSS插件
mYEclipse整合了CVS插件而没有VSS的插件。因习惯了用VSS进行版本控制。因此网上找资料整理了一下VSS插件的使用。 下载与安装: 一、下载VSS插件 可以去官方网站下载,也可以点这个链接http://sourceforge.net/projects/vssplugin/下载最新的org.vssplugin_1.6.2 Eclipse的VSS插件。文件大小约1MB。 详细...
分类:系统相关   时间:2014-05-14 20:34:10    阅读次数:426
中文分词选取-依概率选取
上一篇文章中介绍了一种中文分词的选取算法,本篇文章将介绍另外一种中文分词选取算法,依概率选取算法。 中文分词分词完成之后,还是上篇文章中的原则,分词结果不唯一,然后我们算法的目的是从几种分词好的算法之后选取一个作为分词的最终结果。算法会统计每个词在所有文档中的概率,该算法的中心思想是计算一个字符串中所有分词的概率之积,选取概率最大的作为分词的最终结果。 算法步骤:第一步,通过上几篇文章的的算法对字符串进行分词;第二步,扫描每一次分词结果;第三步,计算每一次分词结果的所有词的概...
分类:其他好文   时间:2014-05-14 20:05:32    阅读次数:285
static关键字以及字符串常量的理解
链接属性总共有三种:external(外部)、internal(内部)以及none(无)。默认情况下标识符一般是外部或者无属性,但是,通过static关键字,则可以改变标识符的属性,将外部属性转变成内部属性,一般我们所说的内外链接属性其实也是相对于文件作用域而言的。...
分类:其他好文   时间:2014-05-14 19:38:52    阅读次数:256
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!