1、CodePage ? 定义:一个经过挑选的以特定顺序排列的字符内码列表,对于早期的单字节内码的语种,codepage中的内码顺序使得系统可以按照此列表来根据键盘的输入值给出一个对应的内码。对于双字节内码,则给出的是MultiByte到Unicode的对应表。这样就可以把以Unicode形式存放的 ...
分类:
其他好文 时间:
2020-01-13 01:14:12
阅读次数:
101
这里列举了大概500个左右的库: ! Chardet字符编码探测器,可以自动检测文本、网页、xml的编码。 colorama主要用来给文本添加各种颜色,并且非常简单易用。 Prettytable主要用于在终端或浏览器端构建格式化的输出。 difflib,[Python]标准库,计算文本差异 Leve ...
分类:
编程语言 时间:
2020-01-08 14:54:10
阅读次数:
202
一、需求场景 大家在平时的开发中,肯定会遇到“某些字符超过多少字截断,并显示...”的需求,特别是在移动端,碍于屏幕尺寸的限制,某些“昵称”,“备注”等等字段,经常会让截断,后面跟着仨点。 1、纯汉字或纯英文字符串 直接用slice、substr、substring、splice等方法就可以直接按照 ...
分类:
Web程序 时间:
2020-01-08 10:27:19
阅读次数:
86
MySQL 字符集和校验规则工作原理 字符编码相关参数 数据流中的转码过程 校验规则 __Tips:字符集和校验规则总是相伴的__ 一 从简单的建库语句开始 db_name : 数据库名 必填 db_charset:数据库的字符集 缺省为服务器字符集 db_collation:数据库的校验规则 缺省 ...
分类:
数据库 时间:
2020-01-05 15:29:18
阅读次数:
88
1、字符编码 python2默认ascii编码 python3默认utf-8编码 2、除法运算 python2 整数相除的结果是一个整数,把小数部分完全忽略掉,浮点数除法会保留小数点的部分得到一个浮点数的结果。 在python3中 对于整数之间的相除,结果也会是浮点数 Python 2.x: >>> ...
分类:
编程语言 时间:
2020-01-05 09:34:53
阅读次数:
73
一、Unicode编码 1 UTF-8 -16 -32编码和Unicode编码 Unicode编码是一种计算机字符编码标准,其实个人认为叫字符集更为准确;而我们熟悉的UTF-8 UTF-16 UTF-32是Unicode的具体实现(怎么存储在计算机)。 1)Unicode编码规范制定标准: 把世界上 ...
分类:
其他好文 时间:
2020-01-04 20:08:44
阅读次数:
766
有时候从网上下载了中英文的字幕文件,字符编码是ANSI的,需要转换为UTF-8的编码格式。 或者其他的文本文件需要转换为UTF8格式。可以实现批量转换。 在Notepad++安装Python Script 插件 打开插件管理器 在Search搜索框中输入:Python Script , 然后选择插件 ...
分类:
编程语言 时间:
2020-01-04 13:02:46
阅读次数:
171
pip2 运行提示 LookupError: unknown encoding: cp65001 这个错误是因为,脚本试图打印的Unicode字符不能使用当前控制台字符编码表示。 在执行pip后尝试运行set PYTHONIOENCODING=UTF-8,设置环境变量编码格式为UTF-8 ...
分类:
编程语言 时间:
2020-01-04 10:40:49
阅读次数:
89
计算机字符编码编年史 标签(空格分隔): Java基础 话说字符编码 各种各样的编码标准搞得头大,哪哪分不清。so,想按照字符编码出现的时间顺序做一个梳理。 1.ASCII ASCII,American Standard Code for Information Interchange,美国信息交换 ...
分类:
其他好文 时间:
2020-01-02 19:05:34
阅读次数:
77
package 测试想法的小示例代码; import java.io.CharArrayWriter; import java.io.PrintWriter; import java.io.UnsupportedEncodingException; import java.util.Arrays; ...
分类:
编程语言 时间:
2020-01-02 09:32:40
阅读次数:
68