先定义两个概念。 字符集 字符集就是把字符和一串数字(码点)一一对应起来。GB2312,GBK,UNICODE,这些都是字符集。 字符编码 字符编码就是取得字符集中和字符对应的那串数字(字符编码)之后,基于取得的那串数字再生成另外一串数字。utf8,utf16,utf32这些都是字符编码。 字符集和 ...
分类:
其他好文 时间:
2018-09-23 00:49:01
阅读次数:
193
最近发现DOMDocument对象很重要,还有XMLHTTP也很重要 注意大小写一定不能弄错. 属性: 1Attributes 存储节点的属性列表(只读) 2childNodes 存储节点的子节点列表(只读) 3dataType 返回此节点的数据类型 4Definition 以DTD或XML模式给出 ...
分类:
编程语言 时间:
2018-09-21 00:39:46
阅读次数:
203
最近在使用python爬取高考分数线时,获得的response里面输出了中文乱码: 解决方案是:将response设置编码格式,一般的如果网页中没有标明type格式,一般默认的都是'ISO-8859-1'编码,我们只需要把编码格式转为 'gb2312' 即可 添加一行代码:下面标红的,这样就可以解决 ...
分类:
编程语言 时间:
2018-09-20 20:20:41
阅读次数:
203
数据库的编码很重要,如果没正确定义编码,会导致整个数据库是乱码的,如果你设置数据库为utf8,导出为gb2312,肯定乱码,反之则一样,你定义什么编码方式,导出用什么编码方式。1,查看数据库的编码方式showvariableslike‘character_set_database‘;2,创建数据库指定编码createdatabasedc3688charactersetutf8;3,修改数据库的编码
分类:
数据库 时间:
2018-09-16 15:56:39
阅读次数:
166
0.常见的编码表 ASC||:美国标准信息交换码,用一个字节的7位可以表示。 ISO8859-1:拉丁码表。欧洲码表,用一个字节的8位来表示。无法存储汉字,或者只取了汉字的一半使用 GB2312:中文编码表 GBK:中国的中文码表升级,融合了更多的中文文字符号。 Unicode:国际编码,融合了多种 ...
分类:
编程语言 时间:
2018-09-15 12:24:02
阅读次数:
138
1、连接Mysql 格式: mysql -h主机地址 -u用户名 -p用户密码1、连接到本机上的MYSQL。首先打开DOS窗口,然后进入目录mysql\bin,再键入命令mysql -u root -p,回车后提示你输密码.注意用户名前可以有空格也可以没有空格,但是密码前必须没有空格,否则让你重新输 ...
分类:
数据库 时间:
2018-09-11 14:09:28
阅读次数:
214
```python
# -*- coding:utf-8 -*-
# ASCII 是一种单字节的编码,可表示256个不同字符
# 中文 在 python3 中默认用 unicode编码
lst = ['你', # str类型,unicode编码 str('你'), # 同上 u'你', # 同上 '... ...
分类:
编程语言 时间:
2018-09-10 00:56:40
阅读次数:
191
20171006 在写入txt中遇到生僻字,使用gb18030编码,而不是gb2312 20170528 在读取xml中中文,输出中文文件jpg中又出现编码错误 invalid mode ('wb') or filename: 'file/img/51190230001_\xe5\x88\x98\x ...
分类:
编程语言 时间:
2018-09-08 22:37:48
阅读次数:
179
宋体 SimSun黑体 SimHei微软雅黑 Microsoft YaHei微软正黑体 Microsoft JhengHei新宋体 NSimSun新细明体 PMingLiU细明体 MingLiU标楷体 DFKai-SB仿宋 FangSong楷体 KaiTi仿宋_GB2312 FangSong_GB2 ...
分类:
其他好文 时间:
2018-09-05 17:59:43
阅读次数:
155
二进制(0,1) 电脑识别的格式只是二进制 utf-8属于unicode的子集编码(utf-8属于) ASCII 255 1bytes --> 1980 gb2312 7000+ --> 1995 GBK1.0 2W+ --> 2000 GB18030 2W7+ --> unicode 2bytes ...
分类:
其他好文 时间:
2018-09-04 17:50:13
阅读次数:
188