原文链接
对于庞大的公交地铁路线信息的数据挖掘,一般软件遇到的问题主要有两点:1.对于文本信息的挖掘,特别是中文词汇的挖掘,缺乏成熟的工具或者软件包,2.对于大数据量,一般软件的读取和处理会遇到问题。...对于这类数据,我们一般用r软件可以轻松实现读取,数据挖掘以及可视化的过程。...例如对于下面这样的车站数据:
和近600M的进出站信息的数据, 如果要实现每隔一段时间的对应路线的进出站人数整理以及可视化的过程,我们可以进行一下的步骤进行分析:
首先我们进行数据的读取和预处理
install.packages...)[1]#进站人数总和 ###将数据进行输出 write.table(data4,"E:\\1号线一卡通进出站整理.txt")#将数据整理好输出到指定的目录文件名 ########2号线 data4=arrange...1,"0分到",time+1,"点0分的出站人数为",outnum," ","进站人数为",innum,"\n") } } }
通过以上过程,我们可以将整理后的数据输出到对应的文件中:
以及交通路线的可视化过程