Deepgreen与Greenplum TPC-H性能测试对比(使用VitesseData脚本)

guodaoying 2017-06-14

前两天发了一篇基于[德哥测试脚本]的测试对比文章《Deepgreen与Greenplum TPC-H性能测试对比(使用德哥脚本)》,由于测试数据量少,两个数据库有几轮测试都是1秒持平,但是大多数测试Deepgreen均优于Greenplum,有的甚至快至百倍,感兴趣的朋友可以再回头看看。

今天分享一下Deepgreen提供的TPC-H测试脚本,这个脚本分为浮点类型、数值类型两类进行22轮测试,更加细化,并且结果值更加中肯。

一、测试环境

服务器 IP 节点

二、TPC-H脚本安装

脚本放在github上,有3种方式可以下载,为方便大家,分别介绍一下:

1. 如果已经与github主机建立ssh互信(点此访问建立方法):

# 使用语句克隆repo:

2.如果懒得建立ssh互信,但是本机装有git工具:

# 克隆bench:

3. 如果你机器上什么都没有,或者不能直接访问外网:

访问 - https://github.com/vitessedata/bench,点击右侧clone or download按钮

三、执行测试

1. 登录服务器重新编译:

cd bench/tpch-dbgen

2. 生成测试文件、初始化数据库、加载数据:

[dgadmin@linux1 bench]$ python create.py 10f

备注:create.py脚本解读:

  • 该脚本用于创建测试数据文件、创建数据库、初始化表、初始化试图、加载数据文件到数据库表、Analyze数据库。

  • 它接受一个参数,用于指定测试的数据类型及数据量,具体如下:

  • 1f: scale 1 with float8 type

  • 1n: scale 1 with numeric type

  • 10f: scale 10 with float8 type

  • 10n: scale 10 with numeric type

3. 执行测试:

[dgadmin@linux1 bench]$ python run.py 10f

备注:run.py脚本解读:该脚本用于执行测试,脚本接受一个参数,指定测试类型及数据量,与create.py脚本参数一致。

四、对比结果

最终结果分四列展示,分别为:查询编号、Greenplum查询耗时、Deepgreen查询耗时、加速倍数。下面为10G数据量解释结论:

1. float8:

1 13514 2399 5.63

Deepgreen与Greenplum TPC-H性能测试对比(使用VitesseData脚本)

2. numeric:

[dgadmin@linux1 bench]$ python run.py 10n

Deepgreen与Greenplum TPC-H性能测试对比(使用VitesseData脚本)

End~

相关推荐