摘要:本申请提供了一种Hadoop平台下的数据处理方法,属于数据处理领域,包括:获取Hadoop平台存量数据的Hive表结构信息,将待存储数据的结构信息与所述Hive表结构信息进行比较,获得数据结构变化信息;根据获得的所述数据结构变化信息和获取的所述存量数据的Hive表结构信息,更新Hive表结构;按照更新后的Hive表结构格式化所述待存储数据,并存储格式化后的所述待存储数据。采用本申请公开的方法,有效地保证了存储数据的数据结构的兼容性,在需要对归档存储的数据进行分析和查询时,不需要对数据格式进行统计和转换,不仅节省了计算资源,还可以快速反馈分析、查询结果,提高数据查询和分析效率。
- 专利类型发明专利
- 申请人北京先进数通信息技术股份公司;
- 发明人朱大勇;完献忠;滕一勤;
- 地址100089 北京市海淀区车道沟1号滨河大厦D座六层
- 申请号CN201510892226.1
- 申请时间2015年12月07日
- 申请公布号CN105447172A
- 申请公布时间2016年03月30日
- 分类号G06F17/30(2006.01)I;