软件开发hbasehdfs数据

请问 HDFS数据怎么入Hbase?

参与20

8同行回答

百分点百分点技术总监百分点
HDFS数据导入到HBase有三种方式:1、可以通过普通的MR程序,在Map或者Reduce里面通过HTable的对象来写入到HBase2、直接通过MR程序,用HBase的TableMapper和TableReducer方法,然后用TableMapReduceUtil类来执行MR,和1类似3、如果数据量大,建议使用bulkload的方式,通过HfileOutputFo...显示全部
HDFS数据导入到HBase有三种方式:
1、可以通过普通的MR程序,在Map或者Reduce里面通过HTable的对象来写入到HBase
2、直接通过MR程序,用HBase的TableMapper和TableReducer方法,然后用TableMapReduceUtil类来执行MR,和1类似
3、如果数据量大,建议使用bulkload的方式,通过HfileOutputFormat方法生成HFile格式的数据,再通过LoadIncrementalHfile的方法把结果加载到HBase收起
互联网服务 · 2015-07-03
浏览1889
百分点百分点技术总监百分点
回复 8# han11jiji    一般来说我们是将非结构化数据转换为结构化的再导入到HBase中,百分点有一个产品Formatter完成这项工作,它读取JSON数据,然后:1. 将JSON记录中的每个字段清洗为Hive或HBase接受的类型2. 将所有记录拼接为一条或几条记录,这是看JSON中是否有嵌套...显示全部
回复 8# han11jiji


   一般来说我们是将非结构化数据转换为结构化的再导入到HBase中,百分点有一个产品Formatter完成这项工作,它读取JSON数据,然后:1. 将JSON记录中的每个字段清洗为Hive或HBase接受的类型
2. 将所有记录拼接为一条或几条记录,这是看JSON中是否有嵌套字段(数组、Map)决定的
3. 将拼接出的记录导入到指定的Hive表或HBase中
这个产品通过配置即可完成上述操作,不需要写代码。收起
互联网服务 · 2015-07-04
浏览1878
michaelhugangmichaelhugang产品总监星环科技
如果是性能要求高,就用BULKLOAD方式;1.解压文件并上传至HDFS目录(解压以更好地给Mapper分配任务)2.在原始数据集中抽样 sampling,更均匀地切分Mapper的任务,使得Mapper任务数量小于但接近于系统的最大Mapper数;3.估算每个region含有的记录数:根据总region数和总记录数估计,region...显示全部
如果是性能要求高,就用BULKLOAD方式;
1.解压文件并上传至HDFS目录(解压以更好地给Mapper分配任务)
2.在原始数据集中抽样 sampling,更均匀地切分Mapper的任务,使得Mapper任务数量小于但接近于系统的最大Mapper数;
3.估算每个region含有的记录数:根据总region数和总记录数估计,region数据估计为CPU核数的4倍
经验:在运行bulkload时,reduce的数量接近系统最大的reduce槽数
4.运行genSplitKey.sh可以生成splitKeySpec
5.根据估算的每个mapper读入数据量,调整conf.properties中的splitSize参数;如果有相同数据的重复导入,可以设置recurrence;
6.运行runBulkLoad.sh即可。收起
软件开发 · 2015-07-03
浏览1802
han11jijihan11jiji数据库运维工程师中科软科技股份有限公司
回复 7# 百分点 如果不会写代码,想把HDFS中的非结构化的数据,入到HBASE里,有其它方法吗?显示全部
回复 7# 百分点
如果不会写代码,想把HDFS中的非结构化的数据,入到HBASE里,有其它方法吗?收起
保险 · 2015-07-03
浏览1826
徐攀登徐攀登项目经理中国电信江西公司
BULKLOAD方式批量导入数据到hbase性能最高了。首先生成hfile。然后加载到hbase表。显示全部
BULKLOAD方式批量导入数据到hbase性能最高了。
首先生成hfile。然后加载到hbase表。收起
电信运营商 · 2015-07-03
浏览1827
尘世随缘尘世随缘技术总监上海某互联网金融公司
可以通过MR程序解析HDFS上的文件,然后写入Hbase中。显示全部
可以通过MR程序解析HDFS上的文件,然后写入Hbase中。收起
互联网服务 · 2015-07-03
浏览1739
han11jijihan11jiji数据库运维工程师中科软科技股份有限公司
我也有这种问题显示全部
我也有这种问题收起
保险 · 2015-07-03
浏览1799
wanxyzxhwanxyzxh软件开发工程师中科软
您好,请问 HDFS数据怎么入Hbase 谢谢显示全部
您好,请问 HDFS数据怎么入Hbase 谢谢收起
软件开发 · 2015-07-03
浏览1834

提问者

wanxyzxh
软件开发工程师中科软

相关问题

相关资料

问题状态

  • 发布时间:2015-07-03
  • 关注会员:0 人
  • 问题浏览:6521
  • 最近回答:2015-07-04
  • X社区推广