import pandas as pd pd.options.display.max_rows = 10 # 设置显示行数 #读入是直接指定索引 df1 = pd.read_csv(r'E:\anacondatest\PythonData\高校信息.csv', encoding='gbk', ind ...
分类:
其他好文 时间:
2020-03-24 21:39:38
阅读次数:
70
python3的字符编码让人头疼。这个也不是一篇介绍gbk,utf-8,unicode怎么表示英文,中文字符的基础知识总结。网上有很多类似的文章,目前也不需要升入学习到了解各个bit位表示什么含义。目的:清楚了解为什么在python3不同的编码,解码,windows,linux操作系统下,字符是否能够正确显示。前提:了解不同编码用不同的二级制编码和长度来表示字符。在python3中,各种字符编码之
分类:
编程语言 时间:
2020-03-23 18:49:43
阅读次数:
119
1. 中文Fz使用utf8字符集 新版本gbk默认不支持,解决办法使用旧版本中文版。但是实际还是会造成一些中文文件在Windows explorer里上传失败,建议用客户端例如flashfxp2.虚目录给需目录(非home目录)建立别名。效果如图3.IE8开始,FTP默认不使用Windows exp... ...
分类:
其他好文 时间:
2020-03-21 13:05:44
阅读次数:
66
今天在安装tomcat的过程中遇到一些问题,其中一个就是界面乱码 解决方案: 找到tomcat目录下conf文件夹的logging-properties文件 这里我选择用ultraedit打开,将如下的encoding=utf-8 改为GBK 重启后发现问题解决了 ...
分类:
其他好文 时间:
2020-03-20 20:15:01
阅读次数:
70
由于windows下默认文件编码为gbk或者是gb2312,所以将windows下面的文件移到linux下时,常常会出现乱码的现象。 使用enca工具可以进行文件编码的查看。 ubuntu下enca的安装命令: 1 sudo apt-get install enca 2 3 4 enca查看文件 5 ...
分类:
系统相关 时间:
2020-03-18 09:37:36
阅读次数:
71
对于字符编码,时间长了很容易搞混,这里不在阐述各个字符集的来龙去脉,仅记下结论:ascii:8bit,主要存放的是英?文,数字,特殊符号gb2312:16bit,简体字版中文gbk:16bit,主要存放中?文和亚洲字符.兼容ascii和gb2312unicode:16bit和32bit两个版本.平时我们?用的是16bit这个版本.全世界所有国家的?文字信息.缺点:浪费空间(传输和存储)utf-8:
分类:
其他好文 时间:
2020-03-16 09:51:28
阅读次数:
48
砍柴ing 今天主要进行数据清洗及处理 # -*- coding: gbk -*- import json import pymysql import jieba.analyse ##生成三个表:用来做地图可视化 ##表province:省:项目数 ##表city:市:项目数 ##表contie:县 ...
分类:
其他好文 时间:
2020-03-15 16:25:44
阅读次数:
84
varchar的长度最大是65535字节 创建的时候varchar(n) 这里面的n是字符长度 所以编码格式不一样,n的最大值也不一样 编码格式为Latin1时 n理论最大值为 65535 编码格式为gbk时 n理论最大值为 65535/2 = 32767 编码格式为utf8时 n理论最大值为 65 ...
分类:
其他好文 时间:
2020-03-14 22:20:10
阅读次数:
88
影响索引长度因素:-- 1. 索引列为字符串类型的情况1) 列长度: 2) 列是否为空: NULL(+1),NOT NULL(+0)3) 字符集: 如 utf8mb4=4,utf8=3,gbk=2,latin1=14) 列类型为字符: 如 varchar(+2), char(+0)计算公式:key_... ...
分类:
数据库 时间:
2020-03-13 18:54:46
阅读次数:
118
我的机器默认编码是GBK,在本机上中文显示正常,但换到其他的机器就显示乱码,为了解决这个问题,统一使用UTF-8编码。 一、修改workspace编码windows->preferences->gengral->workspace 在下面编码选择other->UTF-8应用。 二、修改Content ...
分类:
系统相关 时间:
2020-03-13 13:02:36
阅读次数:
64