在抓取下来的网页源码显示的是如下的内容,而不是可读性的汉字 经查资料后得知, 在网页中以四开头的是HTML实体,具体什么是HTML实体,请百度:http://baike.baidu.com/view/4757776.htm 如何把汉字转换成HTML实体呢? 其实很简单,汉字的HTML实体由三部分组成 ...
分类:
编程语言 时间:
2018-07-20 17:33:43
阅读次数:
324
C#之使用StringHelper来处理汉字转拼音
在TestDB数据库中,编写一个存储过程proc_test_stat: 1)参数1 @target 类型nvarchar 长度 256 2)要求返回以下结果集: 字符及其在 @target 中出现的次数,字段名分别是c, count 注意:字符串可能包含:符号,数字,字母,汉字等 提示:在临时数据库 ...
分类:
其他好文 时间:
2018-07-17 19:28:21
阅读次数:
217
1、一个正则表达式,只含有汉字、数字、字母、下划线不能以下划线开头和结尾:^(?!_)(?!.*?_$)[a-zA-Z0-9_/u4e00-/u9fa5]+$ 其中:^ 与字符串开始的地方匹配(?!_) 不能以_开头(?!.*?_$) 不能以_结尾[a-zA-Z0-9_/u4e00-/u9fa5]+ ...
分类:
其他好文 时间:
2018-07-16 22:18:05
阅读次数:
136
首先很好的一点就是博客园的搜索机制是索引搜索,不仅仅是关键词搜索,而且索引也很稳定,但是依然不是万能的,有需要注意的地方 索引搜索的机制就是首先把我们输入的搜索条件进行分词,然后再查询出带有任何一个关键词的文章,如果我们输入的词条都是汉语,那么分词自然按照语法,但是我们一般都会是英文和数字和汉字混合 ...
分类:
其他好文 时间:
2018-07-15 19:40:24
阅读次数:
446
#EXAMPLE 结果分析: strlen 把一个中文按3字节算(复杂的汉字会按4字节算) mb_strlen 'UTF-8'编码 一个汉字按一个字节位来算 PHP内置的字符串长度函数strlen无法正确处理中文字符串,它得 到的只是字符串所占的字节数。对于GB2312的中文编码,strlen得到的 ...
分类:
Web程序 时间:
2018-07-15 19:23:07
阅读次数:
223
1、为何要编码 由于计算机底层只能识别二进制数字即0和1,因而所谓的“hello world”对于计算机当然是不认识的,为了让计算机能够识别这些汉子或者数字或者字符,自然就需要一套编码表帮助计算机去理解 首先,在中文中,一个汉字占两个字节,一个字节占8位,即需要8个0或者1的数字排列在一块。 重点: ...
分类:
其他好文 时间:
2018-07-13 13:30:12
阅读次数:
130
1.由数字、26个英文字母或者下划线组成的字符串: ^[0-9a-zA-Z_]{1,}$ 2.非负整数(正整数 + 0 ): ^/d+$ 3. 正整数: ^[0-9]*[1-9][0-9]*$ 4.非正整数(负整数 + 0): ^((-/d+)|(0+))$ 5. 负整数 : ^-[0-9]*[1-... ...
分类:
其他好文 时间:
2018-07-13 13:24:39
阅读次数:
184
Redis安装 redis 介绍: http://www.redis.net.cn/order/ windows 安装:http://www.cnblogs.com/ningskyer/articles/5730611.html ubuntu 安装: Redis 连接方式 2. redis-py使用 ...
分类:
编程语言 时间:
2018-07-13 13:19:46
阅读次数:
185
python 编码的发展历程,编码转换函数:ord(), chr(), 汉字输出
分类:
其他好文 时间:
2018-07-12 00:29:26
阅读次数:
195