1、错误现象 环境:Python3.7 描述: 用open方法获取文件句柄; 用read/readlines方法一次读取文件所有内容; 尝试了编码GB2312/GBK/GB18030/UTF-8,发现UnicodeDecodeError报错没有解决。 查看读取的文件。是txt的文件,文件大小30-5... ...
分类:
编程语言 时间:
2019-03-18 01:27:33
阅读次数:
446
1.读取.csv文件 df2 = pd.read_csv('beijingsale.csv', encoding='gb2312',index_col='id',sep='\t',header=None) 参数解析见:https://www.cnblogs.com/datablog/p/612700 ...
分类:
其他好文 时间:
2019-03-17 23:22:44
阅读次数:
570
1.1 代码下载 将代码下载到本机具体位置: 根据svn地址用外部svn工具导入项目到本地一个目录 比如 d:/a 1.2 导入工程 1.2.1 导入gradle工具 1.2.2 选择代码路径 1.2.3 选择gradle路径 如果采用在线下载,则选择第一个 也可以选择前文已经下载好的gradle路 ...
分类:
其他好文 时间:
2019-03-14 15:17:00
阅读次数:
168
character set和collation的是什么? character set即字符集 我们常看到的UTF-8、GB2312、GB18030都是相互独立的character set。即对Unicode的一套编码。 那么如何理解Unicode与UTF-8、GB2312的区别呢? 打个比方,你眼前 ...
分类:
数据库 时间:
2019-03-13 21:43:59
阅读次数:
245
常见的字体: 常见的颜色: 宋体 SimSun 1、pink 粉红色 黑体 SimHei 2、brown 褐色, 茶色 微软雅黑 Microsoft YaHei 3、beige 灰褐色 微软正黑体 Microsoft JhengHei 4、camel 驼色 新宋体 NSimSun 5、amber 琥 ...
分类:
其他好文 时间:
2019-03-12 23:48:54
阅读次数:
296
1,用SXSSFWorkbook会快很多,HSSFWorkbook比较慢,2000条数据要跑130s。 2,maven: 3,代码如下: 这样导出2万多条,只要300ms左右。 4,另外,jxl和POI类似,也是java操作excel的类库,操作使用和poi一样。 ...
分类:
其他好文 时间:
2019-03-11 17:38:35
阅读次数:
227
二进制 0101010 ASCII 只能存英文和拉丁字符,一个字符占一个字符。8位 gb2312 只能6700多个中文 1980年 gbk1.0 存了2万多个字符 1995年 gb18030 27000中文 2000年 unicode utf-32 一个字符占4个字节 unicode utf-16 ...
分类:
其他好文 时间:
2019-03-09 22:00:24
阅读次数:
165
一个汉字对应的两个byte,都是负数。都是字节首位为1。 GB2312和GBK每一个汉字由2个字节组成,这2个字节的ASCII码大小分别是:gb2312: high8 = 0xa1-->0xfe (161 - 254)low8 = 0xa1-->0xfe (161 - 254) gbk: high8 ...
分类:
其他好文 时间:
2019-03-09 13:05:47
阅读次数:
831
有的时候当我们导出文件时,如果文件比较小可以使用phpexcel,但是当文件太大时就会遇到很多瓶颈(excel条数限制、导出时间太长等)。 这个时候要么使用excel分批次导出,要么就需要使用csv导出。但是,分批次导出还需要合并。纯csv的话,导出的文件又不好看,还要转换成excel。 最近看到一 ...
分类:
其他好文 时间:
2019-03-04 20:48:25
阅读次数:
387