码迷,mamicode.com
首页 > 其他好文 > 详细

编号007

时间:2017-06-05 19:56:01      阅读:175      评论:0      收藏:0      [点我收藏+]

标签:读取   cnn   style   难点   code   比较   span   通过   情况   

一.站点的统一

一个站点可能有若干线路通过,因此首先要解决的问题是:将这些线通过的同一个站点视为一个站点,因为之前是按照线路来命名的,所以作出修改

实施方案:

  • 将ic_line_dict_station_201508_9column.csv生成一个加上station name的ic_line_dict_station_201508_2.csv
  • 修改项目GivenameToDict,将AFCGPS.csv与前一步生成的文件合并得到有name的busAfcDict_201508.csv
  • 形成name和station_code的一对多的对应关系(难点是中文编码的问题),另外可以给name编个号
  • 因为出行链中是未考虑这种情况的站点编号,所以,有两种选择:一是,不修改出行链,将name和station_code的一对多的对应关系存入缓存中,在计数的时候读取缓存。二是重新运行一遍出行链,将station_code变成我自己形成的编号。

二.统计下车人数

时间间隔半小时,统计在各站点下车的人数,按天还是按周还是按月??打听下作为CNN的输入,哪种比较好

编号007

标签:读取   cnn   style   难点   code   比较   span   通过   情况   

原文地址:http://www.cnblogs.com/amelie-tingting/p/6946686.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!