上个月,我做了一次分享,详细介绍了Unicode字符集,以及JavaScript语言对它的支持。下面就是这次分享的讲稿。 一、Unicode是什么? Unicode源于一个很简单的想法:将全世界所有的字符包含在一个集合里,计算机只要支持这一个字符集,就能显示所有的字符,再也不会有乱码了。 它从0.....
分类:
编程语言 时间:
2014-12-28 10:22:43
阅读次数:
216
如下所示代码:publicclassExample014{
publicstaticvoidmain(String[]args){
/**
*itisatestfor\utest.
*/
//\u0022是双引号的Unicode转义字符
System.out.println("a\u0022.length()+\u0022b".length());
}
}结果说明:上述程序有编译错误。如果删除多行注释,..
分类:
编程语言 时间:
2014-12-28 01:52:59
阅读次数:
231
1. 由于Java采用16位的Unicode字符,因此需要基于字符的输入/输出操作。从Java1.1版开始,加入了专门处理字符流的抽象类Reader和Writer,前者用于处理输入, 后者用于处理输出。2. Java程序语言使用Unicode来表示字符串和字符,Unicode使用两个字节来表示一.....
分类:
其他好文 时间:
2014-12-27 20:12:01
阅读次数:
207
今天在处理Google网站管理员中的500错误时发现这样一些URL。这些URL不仅出现500错误,而且不显示自定义错误,只显示ASP.NET的默认错误页面。从这些出错的URL中观察到了一个规律:都包含%3F这个编码,解码出来对应的字符是?。从错误信息的代码执行堆栈信息中,可以看出错误发生在从URL中...
分类:
其他好文 时间:
2014-12-27 15:06:54
阅读次数:
4263
空白字符在 JavaScript 的正则里,\s 是 unicode-aware 的,可以匹配 \u0020, \u0009 等空白字符。但各个浏览器的实现有差异,具体可以参见:JavaScript, Regex, and Unicode.大部分情况下,JS 类库在实现 trim 方法时,使用 /^...
分类:
Web程序 时间:
2014-12-27 11:16:29
阅读次数:
337
任务:unix环境通过c程序获取本虚拟机网卡eth0的IP.
总结:
1. 标准I/O库函数相对于系统调用的函数多了个缓冲区(,buf),安全性上通过buf 防溢出。
2.用system函数输出是标准输出,进一步理解fork函数和exec函数重新开启一个进程运行程序;
3.printf 这类输出函数中“ ”若包含“记得要换成转义字符\" 资料链接: htt...
分类:
其他好文 时间:
2014-12-26 23:04:23
阅读次数:
412
近期用shell在处理数据时,发现read命令在读取数据时会把\t替换成空格,以及行末尾的\t舍弃。查看read的help,发现-r可以保留转义字符,搜了一下有人也说可以用-r,但是我的实验结果却是即使-r也还是依旧。无奈该用awk进行的数据处理。使用\t作为数据字段分割符在数据挖掘过程中是经常.....
分类:
其他好文 时间:
2014-12-26 18:31:39
阅读次数:
143
上个月,我做了一次分享,详细介绍了Unicode字符集,以及JavaScript语言对它的支持。下面就是这次分享的讲稿。 一、Unicode是什么? Unicode源于一个很简单的想法:将全世界所有的字符包含在一个集合里,计算机只要支持这一个字符集,就能显示所有的字符,再也不会有乱码了。 它从0.....
分类:
编程语言 时间:
2014-12-26 16:33:09
阅读次数:
201
搜集了一些资料,与同学一起进行了简单的測试,总结例如以下。分词工具特点支持语言原理词典及扩展性StandardAnalyzer中文、英文(unicode)中文:单字符切分英文:依据空格切分ChineseAnalyzer中文,不支持中文和英文及数字混合的文本分词按字分词,与StandardAnalyz...
分类:
其他好文 时间:
2014-12-26 12:57:08
阅读次数:
142
python编码问题字符串在Python内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码(decode)成unicode,再从unicode编码(encode)成另一种编码。decode的作用是将其他编码的字符串转换成unicod...
分类:
其他好文 时间:
2014-12-26 12:45:38
阅读次数:
154