码迷,mamicode.com
首页 > 编程语言 > 详细

python编码及类型转换

时间:2017-05-25 01:19:44      阅读:207      评论:0      收藏:0      [点我收藏+]

标签:pandas   port   logs   字符   log   查看   float   int   dataframe   

使用chardet模块来判断数据的编码;输入参数为str类型。

#coding:utf-8
import cchardet
f =open(hadoop.txt,r)     #打开文本文件,只读
about=f.read()         #读取文本内容
print cchardet.detect(about)       #判断字符串编码

#将字符串的原编码先转成unicode编码,再转成utf-8编码 print about.decode(gbk).encode(utf-8)

 

pd.DataFrame数据类型转换

# -*- coding: UTF-8 -*-
import pandas as pd
df = pd.DataFrame([{col1:a, col2:1}, {col1:b, col2:2}])
print df
print 查看df对象数据类型
print df.dtypes
df[col2] = df[col2].astype(int)
print -------------------------------------------
print df[col2] .dtypes

df[col2] = df[col2].astype(float64)
print -------------------------------------------
print df.dtypes

 

当然方法还有很多。。。

python编码及类型转换

标签:pandas   port   logs   字符   log   查看   float   int   dataframe   

原文地址:http://www.cnblogs.com/lanchang/p/6884052.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!