上篇文章中,抓取网页时,本想匹配其中的汉字。由于出现乱码,只好匹配英文绕过了问题。 原因很简单:该网页没指定utf8,默认应该是GBK 解决办法也很简单:引入 "golang.org/x/text/encoding/simplifiedchinese" 比如原来的代码是 resp, err := t ...
分类:
其他好文 时间:
2020-01-22 16:29:36
阅读次数:
108
直接上代码了。 Java控制台代码: C#控制台代码: Java和C#运行结果一致,如下: 明文:20200121密钥:Tt3rLPrDIVIhXqAz密文:jHaDswvQaPn4ZvashXOTNQ==解密:20200121 本文首发于我的CSDN博客:https://blog.csdn.net ...
分类:
编程语言 时间:
2020-01-22 16:08:34
阅读次数:
129
来自森大科技官方博客http://www.cnsendblog.com/index.php/?p=328GPS平台、网站建设、软件开发、系统运维,找森大网络科技!http://cnsendnet.taobao.com unicode指的是一种编码字符集,即所谓的万国码,而UTF-8,UTF-16(L ...
分类:
其他好文 时间:
2020-01-19 19:07:49
阅读次数:
91
虽然微博官方有Python SDK,但是下载链接竟然失效了??,再Pypi找到一个库——weibo. 安装weibo库 pip install weibo 报错 “ERROR: Command errored out with exit status 1: python setup.py egg_i ...
分类:
编程语言 时间:
2020-01-18 01:33:18
阅读次数:
188
很多情况下我们是这样读取文本文件的: with open(r'F:\.Python Project\spidertest1\test\pdd凉席.txt', 'r') as f: text = f.read()但是如果该文本文件是gbk格式的,那么将会报以下错误: Traceback (most r ...
分类:
编程语言 时间:
2020-01-17 13:36:12
阅读次数:
174
编码问题HelloWorld.java:3: 错误: 编码GBK的不可映射字符 * 瀹冨皢鎵撳嵃瀛楃涓? Hello World ...
分类:
编程语言 时间:
2020-01-15 17:54:54
阅读次数:
228
刚遇到一批bytes数值,python,有的是gbk的有的是utf-8的,于是用这种方式处理了一下,比较快 if isinstance(rs_list[i], bytes):try: rs_list[i] = rs_list[i].decode('utf-8') except Exception a ...
分类:
其他好文 时间:
2020-01-14 20:44:13
阅读次数:
94
聊天模式client端importsocketsk=socket.socket()address=(‘172.16.10.1‘,3000)sk.connect(address)whileTrue:inp=input(‘>>>‘)ifinp==‘exit‘:breaksk.send(bytes(inp,‘utf8‘))data=sk.recv(1024)print(str(data
分类:
编程语言 时间:
2020-01-12 21:59:28
阅读次数:
142
编辑/etc/vim/vimrc文件,加上如下几行: set fileencodings=utf-8,ucs-bom,gb18030,gbk,gb2312,cp936 set termencoding=utf-8 set encoding=utf-8 set fileencodings=utf-8, ...
分类:
系统相关 时间:
2020-01-12 13:07:08
阅读次数:
86
问题症状:登录后台后,发布英文标题没问题,发布中文会提示“标题不能为空”问题根源:htmlspecialchars在php5.4默认为utf8编码,gbk编码字符串经 htmlspecialchars 转义后的中文字符串为空,也就是标题为空.解决办法:给 htmlspecialchars 添加 EN ...
分类:
其他好文 时间:
2020-01-12 09:50:10
阅读次数:
118