摘要:本发明涉及数据挖掘技术领域,公开了一种面向大规模过车数据的伴随车辆的识别方法。本发明中,包括将过车数据转换为伴随数据,并将伴随数据上传至HDFS;运用基于Spark的矩阵剪枝并行频繁项集挖掘算法对伴随数据进行挖掘,以得到伴随车辆组合。本发明相对于现有技术而言,使得伴随车辆识别的效率得到提高,并可降低伴随车辆识别的成本。
- 专利类型发明专利
- 申请人上海市计算技术研究所;
- 发明人陈瑶;马云龙;卢超;孙源;袁函;王华;
- 地址200040 上海市静安区愚园路546号
- 申请号CN201610318801.1
- 申请时间2016年05月13日
- 申请公布号CN106021412A
- 申请公布时间2016年10月12日
- 分类号G06F17/30(2006.01)I;