先对出租车GPS数据进行清洗及预处理。对海量出租车GPS数据进行数据清洗,并基于几何地图匹配算法对原始有偏差的GPS数据进行校准。
第二步对城市交通时空特征的提取。使用Spark SQL技术对预处理后的数据进行统计,使用特定的密度聚集算法对特征数据进行分析,产生载客热点;对比DBSCAN聚类算法和点聚合产生的载客热点,提取居民出行的时空特征。
最后是出租车轨迹信息的全局性展示。首先运用已知算法分别计算密度的聚类然后对结果进行展示;其次使点聚合方式,对数据进行载客点的存储,然后在地图上进行展示,并通过控制地图大小来进行控制数据项。