业务场景,开发的小程序和APP需要类似朋友圈一样的功能,然后好多客户都需要发带emoji表情的文字 所以,这里说一下php如何处理字符中的emoji表情 utf-8 编码的 emoji 表情或者某些特殊字符占用 4 个字节。utf-8 编码的常用中文字符占用 3 个字节。 三个 PHP 内置函数: ...
分类:
Web程序 时间:
2020-04-30 15:52:31
阅读次数:
120
原创曾记否? 最后发布于2018-09-10 19:40:54 阅读数 9955 收藏展开为什么要对URL进行encode在写网络爬虫时,发现提交表单中的中文字符都变成了TextBox1=%B8%C5%C2%CA%C2%DB这种样子,观察这是中文对应的GB2312编码,实际上是进行了GB2312编码 ...
分类:
编程语言 时间:
2020-04-27 17:28:00
阅读次数:
136
Matolotlib是最流行的python底层绘图库,主要是做数据可视化图表。它可以让数据更加直观的呈现,让数据更加客观,具有说服力。学习爬虫后,可能会遇到对大量的数据的处理,于是学习数据分析是必不可少的。 Matplotlib的基本要点: Matplolib常用的图形有这几种形式,折线图,散点图, ...
分类:
编程语言 时间:
2020-04-26 11:04:04
阅读次数:
110
一、字符编码和字符集1、字符编码(characterencoding):字符编码是一种法则,在数字与符号之间建立的对应关系。不同的国家有不同的语言,包含的文字、标点符号、图形符号各有不同。例如在ASCII编码中,用数字97表达字符‘a‘与字符集相对应,常见的字符编码有ASCII,GBK,GB18030,Unicode等。2、字符集(Characterset)字符集是字符的集合,字符
分类:
其他好文 时间:
2020-04-23 00:14:48
阅读次数:
177
Unicode是支持最广的,这就意味着我们可以作为一个中间体来转换。多种字符集都是可互相转的,很简单。 https://tonybai.com/2019/11/07/non-ascii-character-encoding-illustrated/ func main() { var s = "中国 ...
分类:
其他好文 时间:
2020-04-22 20:04:47
阅读次数:
93
迅雷号自媒体视频文件自动上传,贴标签发布 难点 本地文件上传,通过send_keys(‘文件路径’)的方式实现上传的目的 文件名通过正则匹配的方式进行处理,主要匹配出中文标题名称 处理过程中文件名称中包括中文字符,特殊字符,数字等 视频文件上传是否完成的判断,视频上传的进度条通过js加载,在上传的过 ...
分类:
编程语言 时间:
2020-04-22 09:18:26
阅读次数:
73
问题:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xcd 原因:文件里面存在非'utf-8'编码的字符,比如其他平台上写入的中文字符 解决:尝试其他解码格式 import codecs with codecs.open(fname, 'r ...
分类:
其他好文 时间:
2020-04-17 12:30:56
阅读次数:
74
一、概述及字符集 在工作中,有时我们会遇到更换数据库字符集的问题,那如何正确更换数据库的字符集呢?更换之后数据库的数据不会出现乱码,下面简单讲解一下数据库不同字符集的转换过程。 1.1 需要更换字符集的场景 1、原有数据库的字符集由于前期规划不足,随着业务的发展不能满足业务的需求。如原来业务系统用的 ...
分类:
数据库 时间:
2020-04-13 13:48:00
阅读次数:
94
现今主流的计算机中文字符编码方案是:GBK和UTF-8。 不同编码方案使用不同的字符集,GBK字符集在中文字符长度和字符数量上存在绝对优势,但对国外字符并不支持。所以,完全面向国内的程序/网页使用的是GBK字符集的GBK编码,而面向国外或面向国内兼国外的程序/网页使用的是Unicode字符集的UTF ...
分类:
其他好文 时间:
2020-04-12 10:45:10
阅读次数:
102
本文使用的Hadoop为2.7.7,版本如果不同要下载相应版本的文件 配置本地的Hadoop库(不需完整安装,但是要有环境支持) 下载文件 https://github.com/speedAngel/hadoop2.7.7 解压到任意路径,没有中文字符和空格 把解压包的bin替换到解压路径 把bin ...
分类:
其他好文 时间:
2020-04-05 00:24:45
阅读次数:
98