码迷,mamicode.com
首页 > 编程语言 > 详细

Python中基本的读文件和简单数据处理

时间:2017-05-17 00:47:17      阅读:323      评论:0      收藏:0      [点我收藏+]

标签:unique   value   person   类型   content   imp   UI   delay   dict   

Python中基本的读文件和简单数据处理

DataQuest上面的免费课程(本文是Python基础课程部分),里面有些很基础的东西(csv文件读,字符串预处理等),发在这里做记录。涉及下面六个案例:

  1. Find the lowest crime rate(读取csv文件,字符串切分,for循环和if判断过滤数据)
  2. Discover weather pattern in LA(for循环和if判断进行频数统计)
  3. Building a Spell Checker(词频统计,字符串预处理,字典跑字符串,统计正确错误单词)
  4. Analyze NFL data(使用CSVmodule导入文件,类,函数,使用字典和list进行简单统计)
  5. What should you name your kid if you want them to be a US Congressperson?(数据预处理,强制类型转换int(),try-except语句,字典方式统计,转存需要数据)
  6. Which airline is delayed the most?
  7. 附录:逐行读取txt文件

 

案例1 Find the lowest crime rate

(读取csv文件,字符串切分,for循环和if判断过滤数据)

crime_rates.csv是单sheet,73Rows,2Cols的文件。第一列是城市名称(字符串),第二列是犯罪数量(整数)。但是读入Python开始都是字符串,在后面类型转换将字符串形式的犯罪数量强制转换成整型。 并将分隔开转换后的数据存到full_data这个list中,然后使用for循环将犯罪数量最小的城市找出来(if判断,已知犯罪数最小为130),并将这个城市名存入变量city中。

 

案例2 Discover weather pattern in LA

(for循环和if判断进行频数统计)

两列数据的文本文件,有表头。导入la_weather.txt文本文件,切分,存入变量weather_data中,去掉表头。使用字典(dictionary)进行不同类型的频数统计。

 

案例3 Building a Spell Checker

(词频统计,字符串预处理,字典跑字符串,统计正确错误单词)

 

 

 案例4 Analyze NFL data

(使用CSVmodule导入文件,类,函数,使用字典和list进行简单统计)

 

 

 案例5 What should you name your kid if you want them to be a US Congressperson?

(数据预处理,强制类型转换int(),try-except语句,字典方式统计,转存需要数据)

 

 

案例6 Which airline is delayed the most?

这个案例来来回回做了好几天,反正基本上大都是参考答案做过的……酱油了……

 

附录1 逐行读取txt文件

 

Python中基本的读文件和简单数据处理

标签:unique   value   person   类型   content   imp   UI   delay   dict   

原文地址:http://www.cnblogs.com/MLing/p/6864266.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!