Hbase 使用经验

momo00 2012-06-22

Hbase 使用经验。

1、单条rowkey下虽然能支持百万列，但是建议不要这么做，因为真正一个rowkey下挂了这么多数据时会在两个地方出现问题，一是查询时单行记录数据量过大，client超时；第二个问题是regionserver做compact的过程有可能被单条rowkey的数据塞满内存造成OOM

2、datanode的handler的数量不要默认值，太少，要在100左右，另外regionserver的handler的数量在200左右比较合适

3、resultScannser使用完毕记得关闭

4、HTablePool可以管理HTable。查询结束后直接用HTablePool.put(HTable t)来回收，入库结束后记得table.flushCommit()后再回收

5、mapred.local.dir这个参数是mapreduce会在机器的硬盘上做临时文件的存放，如果挂载的多块盘请将每个盘都配上，提升总体性能

6、map阶段的输出可以配置LZO压缩，这样能有效节省map->reduce阶段的网络带宽，不过会提高cpu的占用率

7、多网卡绑定能有效提高Hadoop体系的网络带宽

8、bulkload目前测试的性能在单节点51GB/小时左右，希望其他有做过的同学能交流一下bulkload方面的问题。

: momo00

相关推荐

Centos RedHat 网络带宽监控

SAR这个工具RHEL iso里包含，它是一个优秀的性能监控工具，不仅仅监控网络，它可以显示cpu，运行队列，磁盘i/o，分页(交换区)，内存，CPU中断等性能数据。Sar命令在sysstat包中，我公司系统没有安装此包，所以要安装它，才有sar命令。命令

xylin 0喜欢 / 0评论 2015-05-19

Linux 下安装使用 bmon 网络带宽监控调试工具

bmon是一种功能强大的基于文本的网络带宽监控和调试工具，适用于基于Linux的操作系统。bmon是一个监视和调试工具，用于捕获与网络相关的统计信息并以可视化的方式准备它们。运行以下命令安装bmon网络带宽监控和调试工具。sudo yum install

hengxie00 0喜欢 / 0评论 2019-08-26

技术分享 | 网络带宽如何影响 MySQL 性能

网络是数据库基础架构的主要部分。但是，通常性能基准测试是在本地计算机上完成的，客户端和服务器并置在一起。这样做是为了简化结构并排除一个以上的变量，但是我们也忽略了网络对性能的影响。对于像 MySQL Group Replication 这样的产品集群来说，

林大鹏 0喜欢 / 0评论 2019-09-05

在网络流量暴涨的时态下怎么提高网络运维管理能力?

当下情况下一些大数据的传输严重导致了广域网传输的困难，面对这样的挑战我们应该提高网络服务质量，提高网络运维管理能力，一起来看看怎么解决吧。公司网络带宽资源有限，如何合理利用有限的带宽资源?随着安全热潮的兴起，东华

HiPhone运维之道 0喜欢 / 0评论 2016-07-14

NetHogs——Linux下按进程实时统计网络带宽利用率

网上有很多适用于Linux操作系统的开源网络监视工具.比如说,你可以用命令iftop来检查带宽使用情况. netstat用来查看接口统计报告,还有top监控系统当前运行进程.但是如果你想要找一个能够按进程实时统计网络带宽利用率,那么NetHogs就是你所需

lienfeng 0喜欢 / 0评论 2014-04-06

Linux 下使用Trickle限制下载/上传带宽

你有没有遇到过一个程序占用了你所有的网络带宽的情况？不管你是一个系统管理员还是一名普通Linux用户，您都应该学习如何控制应用的上传和下载速度来确保你的网络带宽不会被一个程序耗光。Trickle是一款带宽控制供给，用来限制如Firefox, FTP , S

adminming 0喜欢 / 0评论 2013-12-15

运维工程师必备的18个网络带宽监控常用命令

本文介绍了一些可以用来监控网络使用情况的Linux命令行工具。这些工具可以监控通过网络接口传输的数据，并测量目前哪些数据所传输的速度。入站流量和出站流量分开来显示。一些命令可以显示单个进程所使用的带宽。这些工具使用不同的机制来制作流量报告。nload等一些

dragonSV 0喜欢 / 0评论 2017-08-21

Ubuntu 终端下Nethogs 命令查看网络带宽

Nethogs 是一个终端下的网络流量监控工具，它的特别之处在于可以显示每个进程的带宽占用情况，这样可以更直观获取网络使用情况。它支持 IPv4 和 IPv6 协议、支持本地网卡及 PPP 链接。Top 可以查看进程占用的 cpu、内存等信息，可以随时监测

89550393 0喜欢 / 0评论 2010-08-30

Linux服务器上监控网络带宽的18个常用命令

一些命令可以显示单个进程所使用的带宽。这样一来，用户很容易发现过度使用网络带宽的某个进程。这些工具使用不同的机制来制作流量报告。nload等一些工具可以读取"proc/net/dev"文件，以获得流量统计信息；而一些工具使用pcap库来

Doraemonmeowmeow 0喜欢 / 0评论 2014-04-11

4K电视和VR对大网络带宽需求，将催生新的云计算技术

网心科技CEO、迅雷联席CEO陈磊在2015钛媒体T-EDGE峰会以「如何颠覆一个成熟的市场」为主体的演讲中表示，云计算行业才刚刚起步，亚马逊的成功实际上也就是五六年的事情。陈磊在来网心创业之前曾是腾讯云的总裁，也在做云计算。是因为看到了市场上的一个很重要

AVR虚拟现实游戏 0喜欢 / 0评论 2015-12-16

详解云计算关键技术中的三个技术

为了提高云环境中虚拟机的部署速度，我们需要考虑并行部署和协同部署。例如，在网络带宽有限的情况下，云部署服务器同时运行多个部署任务，这些任务就会争抢网络带宽，当网络带宽被占满后，部署速度就不能再被进一步提高。在这种情况下，协同部署技术可以用来进一步提高部署速

fjqabc 0喜欢 / 0评论 2010-03-16

防止用户利用PHP代码DOS造成用光网络带宽

echo \"Packet complete at \".time.\" with $packets packets averaging \". round . \" packets/s \\n\&quo

PHP100 0喜欢 / 0评论 2019-03-27