首先感谢这位博主的分享:https://www.cnblogs.com/walo/p/10608436.html 1、字符串前加 u 例:print(u"我是含有中文字符组成的字符串。") 作用: 后面字符串以 Unicode 格式 进行编码,一般用在中文字符串前面,防止因为源码储存格式问题,导致再 ...
分类:
编程语言 时间:
2020-02-11 23:08:36
阅读次数:
139
正则表示式 = 模式 + 修饰符 修饰符 i 不区分大小写 m 多行匹配 g 全局匹配,即匹配到第一个结果后不会停止,而是继续向后查找匹配 u Unicode模式,将模式视为Unicode序列点的序列 s dotAll模式,匹配任何字符,包括\n 正则表达式创建方式 字面量形式://. new Re ...
分类:
编程语言 时间:
2020-02-11 09:24:57
阅读次数:
82
1.字符集 === ASCII码 一字节;包括英文数字这些符号 GB2312编码 汉字为两字节;与ASCII码兼容,后来扩展汉字又有了GBK编码 Unicode编码 包括中,日,韩,英文等格式;有Utf 32,Utf 16,Utf 8三种格式 Utf 32:每个字符都采用4字节(32bit),缺点浪 ...
分类:
其他好文 时间:
2020-02-11 00:10:05
阅读次数:
176
将这两行的注释去掉就可以了。 另外,如果项目使用的是Unicode设置,则可以在pugiconfig.hpp中: // Uncomment this to enable wchar_t mode #define PUGIXML_WCHAR_MODE 将wchar模式打开即可。 ...
分类:
其他好文 时间:
2020-02-10 09:50:27
阅读次数:
60
python代码的编码格式 #coding:utf-8 在操作文件时,如果文件名带有中文,则需要将文件路径以Unicode的编码格式进行操作 具体的方式如下 path = "你的路径" ipath = unicode(path, "utf8")# 也可以使用以下方法Path = open(u'行业拆 ...
分类:
编程语言 时间:
2020-02-09 23:33:46
阅读次数:
179
格式化字符串说明符 | 说明符 | 作用 | | : : | : : | | | 格式化整数 | | / | 格式化 16 进制表示的数字 | | | 格式化浮点型 | | | 输出浮点数 | | | 输出科学计数表示法 | | | 用于规定输出定长的整数,其中开头的数字 0 是必须的 | | | ...
分类:
其他好文 时间:
2020-02-09 14:30:44
阅读次数:
97
Python字符串内建函数: 注:汉字属于字符(既是大写又是小写)、数字可以是: Unicode 数字,全角数字(双字节),罗马数字,汉字数字。 1.capitalize( ): 将字符串第一个字母大写 # 使用 字符串.capitalize() 方法将字符串首字母大写 strs = 'abc' p ...
分类:
编程语言 时间:
2020-02-08 17:27:59
阅读次数:
85
Unicode介绍 Unicode是一张编码表格,包含了世界上每个国家所有的字符对应的二进制数据 计算机只能识别二进制,例如010101001这种二进制数据(计算机使用高低电平表示0和1)。 但是这些二进制人是难以看懂的,于是美国人就用ASCII码制作了一张表,包含了从a,b,c,.....@%$等 ...
分类:
其他好文 时间:
2020-02-08 17:21:07
阅读次数:
127
1. unicode 与utf-8 https://www.jianshu.com/p/e1fd1d936278 ASCII 是字符集+编码规则。只对英文字母和常见的符号进行了编号,最多只有256个字符(一个byte) Unicode 是「字符集」, 为世界上的所有字符统一指定了一个2byte 数字 ...
分类:
编程语言 时间:
2020-02-08 16:02:16
阅读次数:
111
一、简介 MySQL在5.5.3之后增加了这个utf8mb4的编码,mb4就是most bytes 4的意思,专门用来兼容四字节的unicode。utf8mb4是utf8 的超集,除了将编码改为utf8mb4外不需要做其他转换。当然,为了节省空间,一般情况下使用utf8也就够了。 二、内容描述 那上 ...
分类:
其他好文 时间:
2020-02-08 15:24:43
阅读次数:
87