使用BulkLoad从HDFS批量导入数据到HBase


在向Hbase中写入数据时,常见的写入方法有使用HBase API,Mapreduce批量导入数据,使用这些方式带入数据时,一条数据写入到HBase数据库中的大致流程如图。
数据发出后首先写入到雨鞋日志WAl中,写入到预写日志中之后,随后写入到内存MemStore中,最后在Flush到Hfile中。这样写数据的方式不会导致数据的丢失,并且道正数据的有序性,但是当遇到大量的数据写入时,写入的速度就难以保证。所以,介绍一种性能更高的写入方式BulkLoad。使用BulkLoad批量写入数据主要分为两部分:
一、使用HFileOutputFormat2通过自己编写的MapReduce作业将HFile写入到HDFS目录,由于写入到HBase中的数据是按照顺序排序的,HFileOutputFormat2中的configureIncrementalLoad()可以完成所需的配置。
二、将Hfile从HDFS移动到HBase表中,大致过程如图
实例代码pom依赖:实例数据在Hbase shell 中创建表打包后执行
“`hadoop jar BulkLoadDem 香港云主机o-1.0-SNAPSHOT.jar com.yangshou.BulkLoadDriverexport HADOOP_CLASSPATH=$HBASE_HOME/lib/*

相关推荐: windows10电脑的壁纸要如何才能设置成功

这篇文章将为大家详细讲解有关windows10电脑的壁纸要如何才能设置成功,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。选择什么尺寸的壁纸 香港云主机在电脑桌面上右击鼠标打开【显示设置】;在分辨率中查看当前电脑的分辨率,使用…

免责声明:本站发布的图片视频文字,以转载和分享为主,文章观点不代表本站立场,本站不承担相关法律责任;如果涉及侵权请联系邮箱:360163164@qq.com举报,并提供相关证据,经查实将立刻删除涉嫌侵权内容。

(0)
打赏 微信扫一扫 微信扫一扫
上一篇 07/23 17:38
下一篇 07/23 17:38

相关推荐