基于Hadoop的气象数据分布式存储技术研究

被引:7
|
作者
周笑天 [1 ]
冯勇 [1 ]
陈益玲 [1 ]
陈澍 [1 ]
机构
[1] 山东省气象信息中心
关键词
气象数据存储; Hadoop; Row Key; 文件合并;
D O I
10.13274/j.cnki.hdzj.2022.01.013
中图分类号
P413 [数据处理]; TP311.13 []; TP333 [存贮器];
学科分类号
0706 ; 070601 ; 081201 ; 1201 ;
摘要
针对目前气象数据存储所面临的海量扩张、高并发读写、结构化和非结构化数据并存以及长时间序列和大数据集检索效率低下等问题,提出了以Hadoop开源框架为基础的气象数据分布式存储方案。通过对气象数据自身属性和特点进行分析,得出了气象数据在经过充分优化的基础上,在分布式存储框架中具有很强的适应性和规模化应用的潜力;并在HBase数据库中的Row Key设计和小文件合并策略方面做了创新。最后针对气象数据中广泛存在的结构化和非结构化这两种主要数据类型,以自动气象站数据和雷达产品数据为具体实例,给出了详细的设计思路和实现方法。
引用
收藏
页码:68 / 74
页数:7
相关论文
共 15 条
  • [1] 基于Hadoop的小文件存储优化方案
    李孟
    曹晟
    秦志光
    [J]. 电子科技大学学报, 2016, (01) : 141 - 145
  • [2] 全国自动气象站实时观测资料三级质量控制系统研制
    任芝花
    张志富
    孙超
    刘一鸣
    李俊
    鞠晓慧
    赵煜飞
    李志鹏
    张玮
    李洪康
    曾行吉
    任晓炜
    刘莹
    王海军
    [J]. 气象, 2015, 41 (10) : 1268 - 1277
  • [3] Hadoop在气象数据密集型处理领域中的应用
    肖卫青
    杨润芝
    胡开喜
    林润生
    刘立明
    谷军霞
    [J]. 气象科技, 2015, (05) : 823 - 828
  • [4] Hadoop云计算及其关键技术
    常广炎
    [J]. 软件导刊, 2015, 14 (09) : 7 - 9
  • [5] 基于Hadoop/Hive的气象数据分布式处理研究
    陈效杰
    张金泉
    [J]. 软件导刊, 2015, 14 (08) : 11 - 13
  • [6] HiBase:一种基于分层式索引的高效HBase查询技术与系统
    葛微
    罗圣美
    周文辉
    赵頔
    唐云
    周娟
    曲文武
    袁春风
    黄宜华
    [J]. 计算机学报, 2016, 39 (01) : 140 - 153
  • [7] 基于气象应用的私有云存储方案
    樊宇虹
    冯永祥
    马志强
    刘利民
    李雷孝
    [J]. 计算机工程与设计, 2015, 36 (02) : 426 - 430
  • [8] 气象高性能计算应用服务环境适应性研究
    魏敏
    [J]. 气象, 2015, 41 (01) : 92 - 97
  • [9] 基于MapReduce计算模型的气象资料处理调优试验
    杨润芝
    沈文海
    肖卫青
    胡开喜
    杨昕
    王颖
    田伟
    [J]. 应用气象学报, 2014, (05) : 618 - 628
  • [10] 基于HBase的气象地面分钟数据分布式存储系统
    陈东辉
    曾乐
    梁中军
    肖卫青
    [J]. 计算机应用, 2014, 34 (09) : 2617 - 2621