爬取text 包含某个关键字时zhibo_unicode = unicode("直播","utf-8")sel.xpath('//a[contains(span/text(),"%s")]/@href' % zhibo_unicode) 只能用%s占位符这种类似的方式。 以下方式是不...
分类:
其他好文 时间:
2014-06-28 21:14:38
阅读次数:
232
这个方法是用windows的字符集转换的,跟sybase 的unicode码表可能在某些符号上有差别,对于大部分字符来说,尤其是 汉字,应该不会有问题的,如果要求比较高的话,可以买sybase的 unicode开发包,:P [code] #include #include #include #...
分类:
其他好文 时间:
2014-06-21 13:25:12
阅读次数:
254
1. codePointAT方法JavaScript内部,字符以UTF-16的格式储存,每个字符固定为2个字节。对于那些需要 4个字节储存的字符(Unicode编号大于0xFFFF的字符),JavaScript会认为它们是两个字符。ES6提供了codePointAt方 法,能够正确处理4个字节储存的...
分类:
其他好文 时间:
2014-06-21 12:09:17
阅读次数:
299
字符串是一段字符的有序集合,如"hellow,world"或"信天翁"。Swift 中的字符串由 String 类型表示,对应着 Character 类型值的集合。Swift 中的 String 类型为你的编程提供了一个高速的,兼容 Unicode规范 的文本处理方式。Swift 创建和处理字符串的...
分类:
其他好文 时间:
2014-06-18 16:41:25
阅读次数:
346
在Win7上,进入VisualStudio2008的cmd line promptperl -MCPAN -e shellinstall Spreadsheet::ParseExcelinstallSpreadsheet::ParseExcel::FmtUnicodeinstall Unicode:...
分类:
其他好文 时间:
2014-06-18 14:24:23
阅读次数:
373
为了程序编写方便,根除乱码问题等等需求,很多新项目都采用了Unicode编码。同时,不少使用MBCS多字节编码的旧项目为了升级,也有了转向Unicode编码的意向。不过,从MBCS升级到Unicode并不是无缝的,该问题的复杂程度,取决于代码总量和代码的编写质量。本文是作者在一个C/C++项目中的一...
分类:
其他好文 时间:
2014-06-18 14:16:01
阅读次数:
147
搜集了一些资料,与同学一起进行了简单的測试,总结例如以下。分词工具特点支持语言原理词典及扩展性StandardAnalyzer中文、英文(unicode)中文:单字符切分英文:依据空格切分ChineseAnalyzer中文,不支持中文和英文及数字混合的文本分词按字分词,与StandardAnalyz...
分类:
其他好文 时间:
2014-06-18 14:09:29
阅读次数:
162
1 string类型是密封(sealed)类型,即从object对象中继承而来。
2 string实例实际就是一个Unicode字符串
3 string类型的值可以是字符串文字
4 string关键字是预定义类System.String的别名,所以我们可以这样写:
string name = "Fred"; or String name = "Fred"
5 同样的...
分类:
其他好文 时间:
2014-06-18 11:46:23
阅读次数:
184
一、NMAKE 和 Makefile
1.1 NMAKE - 命令解释器, 根据Makefile文件中定义的脚本,完成项目的编译等操作
1.2 Makefile - 定义编译、连接等脚本语言
1.3 Makefile 文件的使用
1.3.1 基本语法规则
window.exe:window.obj //依赖行
cl.exe window.c /c...
分享一个不错的编写properties文件的Eclipse插件(plugin),有了它咱们在修改一些简体中文、繁体中文等Unicode文本时,就不用再运用native2ascii编码了。您能够经过Eclipse中的软件晋级(SoftwareUpdate)装置此插件,过程如下:1、打开Eclipse的Help菜单,将鼠标移到Software..
分类:
系统相关 时间:
2014-06-16 17:10:01
阅读次数:
357