岩手县小森的博客

努力将眼前的每一天过得精彩


  • 首页

  • 标签

  • 分类

  • 归档

HBase表数据倾斜治理_HFile结构与Snapshot结构

发表于 2022-05-21 | 分类于 HBase
HBase表数据倾斜治理_HFile结构与Snapshot结构1.HFile结构1.1 HFile逻辑结构hfile v2在逻辑上的结构主要分为四个部分: 扫描时会被读取的部分; 扫描时不会被读取的部分; regionserver启动时会被加载到内存中的部分; 尾部:主要记录hfile的版本信息、各部分的offset。 1.2 HFile物理结构hfile在物理存储上被切分成一个个大小相等的 ...
阅读全文 »

HBase表数据倾斜治理_Zookeeper在HBase中的作用

发表于 2022-05-18 | 分类于 HBase
HBase表数据倾斜治理_Zookeeper在HBase中的作用1.Zookeeper基础概念1.1集群角色在zookeeper中有leader、follower、observer三种角色。一个zookeeper集群在一个时刻只会有一个leader,由所有follower参与的选举产生。 1.2会话(Session)在ZooKeeper中,一个客户端连接是指客户端和ZooKeeper服务器之间的T ...
阅读全文 »

HBase表数据倾斜治理_HBaseConfiguration配置参数

发表于 2022-05-15 | 分类于 HBase
HBase表数据倾斜治理_HBaseConfiguration配置参数1.HBaseConfiguration配置文件加载过程Configuration是hadoop作业的配置信息类,可以实现再多个mapper和多个reducer任务之间共享信息。当我们要通过java代码创建hbase client,首先要创建配置对象: 1Configuration conf = HBaseConfigurati ...
阅读全文 »

HBase表数据倾斜治理_读取export snapshot并bulkload到不同结构hbase表中

发表于 2022-05-13 | 分类于 HBase
HBase表数据倾斜治理_读取export snapshot并bulkload到不同结构hbase表中1.SnapshotScanMR方法读取hbase快照的两种使用场景前文我们提到snapshot的主要作用就是帮助我们在扫描HBase表数据时绕过RegionServer直接从HDFS中读取Hfile文件数据,减轻RegionServer的压力。 实际上SnapshotScanMR可以读取的快照有 ...
阅读全文 »

HBase表数据倾斜治理_读取hbase表数据并bulkload到不同结构hbase表中

发表于 2022-04-28 | 分类于 HBase
HBase表数据倾斜治理_读取hbase表数据并bulkload到不同结构hbase表中在HBase表数据倾斜治理(2)中我们实现了读取HBase表数据并保存成字符串文件,在HBase表数据倾斜治理(3)中我们实现了读取字符串文件并bulkload到HBase表,那么将两部分结合即可达到读取HBase表数据并重新组装rowkey再放回Hbase中的目的。 1.项目背景以前的数据保存到HBase中的 ...
阅读全文 »

HBase表数据倾斜治理_采用rowkey反转策略的bulkload

发表于 2022-04-23 | 分类于 HBase
HBase表数据倾斜治理_采用rowkey反转策略的bulkload在HBase表数据倾斜治理(1)_shell命令实现bulkload中已经介绍bulkload的原理以及使用shell命令实现bulkload的方法。 数据存储到HBase当中非常容易发生数据倾斜,也就是各个region当中存储的数据数量差距较大。常用于避免HBase表数据倾斜的方法是:预分区+随机散列。此处不再赘述如何实现预分区 ...
阅读全文 »

HBase表数据倾斜治理_Scan读取Hbase表与Hbase表快照

发表于 2022-04-18 | 分类于 HBase
HBase表数据倾斜治理_Scan读取Hbase表与Hbase表快照HBase获取数据的方式1.HBase数据查询分类HBase查询数据的方式主要有get和scan两种方式,其中get用于按照指定rowkey获取唯一一行数据。scan主要用于批量查询,可以通过添加过滤器实现分页等条件查询功能。 scan有三种常见用法:ScanAPI(Scan和SnapScan)、TableScanMR、Snaps ...
阅读全文 »

HBase表数据倾斜治理_shell命令实现bulkload

发表于 2022-04-14 | 分类于 HBase
HBase表数据倾斜治理_shell命令实现bulkloadBulkload原理HBase底层物理存储是以HFile文件的形式将数据存储在磁盘上的。 将数据加载到HBase表中最直接的方法可以使用HBase提供的shell api或者java api进行数据导入,这种采用HBase api的方式主要过程:预写日志,将数据的操作信息和数据信息写入WAL;将数据放入RegionServer的内存Mem ...
阅读全文 »

【随手小记】_Windows_IntelliJ_IDEA快捷键合集

发表于 2021-11-21 | 分类于 转码学习
【随手小记】_Windows IntelliJ IDEA快捷键合集1.Editing(编辑) 快捷键 介绍 Ctrl +Space 基本代码补全,输入字母按后列出匹配的词组 Ctrl+Shift+Space 智能代码补全,列出与预期类型一致的方法或变量 Ctrl+Alt+Space 补全类名 Ctrl+Shift+Enter 补全语句 Ctrl+P 显示方法参数 Ct ...
阅读全文 »

【二三方】_基于线程池的直充接口异步响应

发表于 2021-08-18 | 分类于 二三方
基于线程池的直充接口异步响应基于线程池的直充接口异步响应由于拼多多要求虚拟产品直充接口在500ms内返回响应,所以采用异步响应的模式:创建任务,用于调用后续权益下发等接口,并将该任务提交到线程池中。 1.创建实现Runnable接口的任务类重写run()方法,完成后续权益下发等逻辑,并回调拼多多的接口告诉拼多多充值成功与否。多线程Runable任务的参数一般是以对象实例对象的形式配置的,通过构造方 ...
阅读全文 »
1…111213…18
zju岩手县小森

zju岩手县小森

看的远固然重要 但是走好眼前的路才是关键

176 日志
15 分类
143 标签
Instagram Bilibili
© 2025 zju岩手县小森