使用python的时候经常会遇到文本的编码与解码问题,其中很常见的一种解码错误如题目所示, 1、编码设置 第一行没有设置 # _*_ coding:utf-8 _*_ 2、后面处理数据时没有转码下,如open函数上 处理如下:with open("data.txt",'r',encoding='UT ...
分类:
其他好文 时间:
2020-07-26 22:53:19
阅读次数:
74
在获取yaml文件数据时,提示:UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 2: illegal multibyte sequence import yaml def test_yaml(): with ope ...
分类:
编程语言 时间:
2020-07-26 16:00:12
阅读次数:
88
问题:启动Tomcat控制台,字典显示乱码? 原因:编码问题导致字体显示乱码 解决方案:在conf目录下 logging.properties;把utf-8,替换成GBK;保存后重启toncat即可 重启tomcat,控制台显示正常 ...
分类:
其他好文 时间:
2020-07-24 16:06:16
阅读次数:
86
文字在计算机中都是图片 最早的编码是ASCII编码(一个字母占一个字节)表示 如:字母a 的ASCII是97。 而中文规定一个汉字占两个字节(一个汉字分为两部分图片) 最早的编码为GBK编码(国标编码); 为了使计算机识别不同国家的语言 就有了Unicode编码(用唯一的二进制表示唯一的文字) ja ...
分类:
其他好文 时间:
2020-07-24 09:25:58
阅读次数:
131
前言 本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。 作者:栗科技 一、爬取介绍 利用Chrome浏览器抓包可知,B站的弹幕文件以XML文档式进行储存,如下所示(共三千条实时弹幕) 其URL为: http://comment.b ...
分类:
编程语言 时间:
2020-07-20 22:24:28
阅读次数:
134
一:引言 django项目中遇到如图报错: 原因是:这个版本django由于出错信息的代码有编码读取问题 造成无法正常显示 二:解决方法 1.根据提示找到 python安装路径\Lib\site-packages\django\views\debug.py 大约在332行 2.在该行的open()中 ...
分类:
其他好文 时间:
2020-07-19 17:51:56
阅读次数:
98
文件的基本操作 操作系统默认编码 windows:gbk linux:utf-8 Mac-OS:utf-8 打开文件 f1 = open('read.txt', encoding='utf-8',mode='r') f1变量称为文件操作句柄,通常以f1、file_handler、f_h等约定俗成形式 ...
分类:
编程语言 时间:
2020-07-17 19:46:14
阅读次数:
73
字符集 Mysql 的字符集有4个级别的默认设置:服务器级,数据库级,表级和字段级,客户端交互时,也可以指定字符集 # 字符集:是一个系统支持的所有抽象字符的集合。字符是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字等 最早的字符集:ASCII码 中国的字符集:gbk,utf8,gb ...
分类:
数据库 时间:
2020-07-16 22:03:20
阅读次数:
128
import zipfile with zipfile.ZipFile(r'E:/Python爬虫精进.zip','r') as f: for 文件名 in f.namelist(): 信息=f.getinfo(文件名) 文件名=文件名.encode('cp437').decode('gbk') p ...
分类:
其他好文 时间:
2020-07-11 12:28:20
阅读次数:
76
浅谈cookie技术 Javaweb编程中有一种方法称之为Cookie,在百度百科中,这样给cookie下定义: Cookie,有时也用其复数形式 Cookies。类型为“小型文本文件”,是某些网站为了辨别用户身份,进行Session跟踪而储存在用户本地终端上的数据(通常经过加密),由用户客户端计算 ...
分类:
其他好文 时间:
2020-07-10 23:58:35
阅读次数:
90