Apache Zeppelin在Apache Trafodion上的可视化

在旅途 2019-06-30

介绍

Apache Trafodion和EsgynDB（Esgyn的商业版）支持数据可视化工具（例如，Apache Zeppelin和Tableau），具有标准JDBC/ODBC连接。本文重点介绍如何实现Apache Zeppelin在Trafodion上的可视化。

Apache Zeppelin基于web，数据专家可以通过该工具进行大规模数据挖掘和可视化的协作。大规模数据分析的工作流包括多个步骤，例如数据获取、预处理、可视化……。通过Zeppelin，用户可以在不同的执行块/段中创建这些步骤。这一套步骤/工作流称为Notebook。各段由解释器进行处理。Zeppelin具有几个默认的解释器。我们可以使用shell解释器、PostgreSQL解释器或JDBC解释器实现Trafodion或EsgynDB与Zepplin的集成。

架构

Zeppelin UI（客户端）连接到Zeppelin Server，然后与一个或多个解释器进行交互，以执行段落中的命令。

对于Trafodion/EsgynDB集成，我们可以使用JDBC解释器或Postgres解释器运行SQL命令，使用shell解释器在Trafodion/EsgynDB实例上运行shell命令。

Apache Zeppelin在Apache Trafodion上的可视化

为Trafodion/EsgynDB配置Zeppelin

1.将Trafodion T4 JDBC驱动器（jdbcT4.jar）复制到Zeppelin安装文件夹下的lib目录。
2.将jdbcT4.jar的所有权更改为zeppelin的用户id。使用HDP/Ambari时，会单独创建一个Zeppelin用户id。在您的系统上，检查zeppelin lib文件夹中其他jar文件的所有权，将这些所有权设置为与jdbcT4.jar相同。
3.重启Zeppelin。如果您使用Ambari安装Zeppelin，则可以使用Ambari Web控制台进行重启。
4.打开浏览器，登录http://myhost:9995。在默认情况下，Zeppelin在9995端口上运行。查看您的Ambari配置，了解详细信息。
5.您应该可以看到欢迎页面，状态应显示为已连接。

Apache Zeppelin在Apache Trafodion上的可视化

6.首先，配置JDBC解释器，连接到Trafodion/EsgynDB。单击菜单中的Interpreter。

Apache Zeppelin在Apache Trafodion上的可视化

7.单击Create。
8.根据显示的内容，填写详细信息。单击Save，创建解释器。
1) 输入您解释器的名称。
2) 在解释器的下拉菜单中，选择JDBC。
3) 填写Trafodion JDBC驱动器的详细信息，指定与您Trafodion实例匹配的JDBC URL。

default.driver org.trafodion.jdbc.t4.T4Driver
default.url jdbc:t4jdbc://myhost:23400/:
default.user trafodion
default.password traf123

Apache Zeppelin在Apache Trafodion上的可视化

9.通过Notebook -> Create new note菜单，创建一个新的notebook。
10.选择新创建的notebook。
11.单击notebook右上角的Interpreter Binding图标。
12.选择您添加的新Trafodion解释器，拖动到解释器列表的顶部，单击Save。

Apache Zeppelin在Apache Trafodion上的可视化

13.输入一个sql命令（例如，get schemas），单击Run。您应该可以看见您的Trafodion/EsgynDB数据库所有可用的schema列表。

Apache Zeppelin在Apache Trafodion上的可视化

14.如果执行失败，出现连接错误或套接字错误：

查看HBase和Trafodion/EsgynDB是否正常启动并运行。
查看用户名和密码是否正确。
如果解释器超时一段时间，可能出现套接字连接错误。重启解释器，修复该错误。

15.如果依然存在异常，您可以检查zeppeliln的log文件夹中的zeppelin server和jdbc解释器的日志消息。
注意：
在默认情况下，如果没有执行查询（或Zeppelin UI闲置），解释器会关闭与数据库的连接。再次运
行查询之前，请重启解释器。

示例DDL/获取/报告工作流

您可以使用一系列段落，在Zeppelin中创建工作流，每个段落分别负责执行您工作流中的一个步骤。下例使用SQL DDL语句创建一个新表，然后加载数据，最后运行一个已加载数据的报告。这些步骤分别使用notebook中的不同段落。

1.创建目标Trafodion表。
使用JDBC解释器运行CREATE DDL语句。

Apache Zeppelin在Apache Trafodion上的可视化

2.使用HBase Shell命令，查看表的HBase属性。
使用shell解释器，运行hbase shell命令。

Apache Zeppelin在Apache Trafodion上的可视化

3.使用ODB和CSV文件，将数据加载到表。
使用shell解释器，在EsgynDB实例上运行ODB工具。

Apache Zeppelin在Apache Trafodion上的可视化

4.运行已加载数据的报告。
使用JDBC解释器，运行SQL查询。

Apache Zeppelin在Apache Trafodion上的可视化

: 在旅途

相关推荐

Apache Zeppelin UI

Apache Zeppelin 0.7.0 Documentation: Generic JDBC Interpreter for Apache Zeppelinhttps://zeppelin.apache.org/docs/0.7.0/interpre

登峰小蚁 0喜欢 / 0评论 2020-06-10

Data Solution 2019(3)Run Zeppelin in Single Docker

Solution:. Startingdatanodes. Solution:. RUNssh-keygen-q-trsa-N''-f/root/.ssh/id_rsa. #startsshservice. Solution:. exportJAVA_HO

dumarkee 0喜欢 / 0评论 2019-02-26

Spark/Hadoop/Zeppelin Upgrade(1)

>java-version. javaversion"1.8.0_77". 2MAVENInstallation. >mvn--version. >sudoapt-getinstallunzip. >sudoap

andyshar 0喜欢 / 0评论 2016-03-29

Apache Zeppelin(2)Zeppelin and Spark Yarn Cluster

zeppelin-interpreter-spark-carl-carl-mac.local.log. >mvncleanpackage-Pspark-1.4-Dhadoop.version=2.6.0-Phadoop-2.6-Pyarn-Dskip

Oeljeklaus 0喜欢 / 0评论 2015-07-02

Apache Zeppelin(1)Build and Installation

>mvninstall-DskipTests-Dspark.version=1.3.1-Dhadoop.version=2.6.0. >mvncleanpackage-Pspark-1.3-Phadoop-2.4-Pyarn-DskipTest

Andrewtao00 0喜欢 / 0评论 2015-06-03

zeppelin 配置 spark

修改zeppelin 配置文件在zeppelin-env.sh中添加spark路径和hadoop配置文件路径。export HADOOP_CONF_DIR=/usr/lib/hadoop修改spark interpreter参数。mesos://host:

链块学院 0喜欢 / 0评论 2018-09-14

Zeppelin0.7.2结合hive解释器进行报表展示

右上角anonymous --> interpreter --> +Create新建一个叫做hive的集成环境。填写Dependencies相关属性2个hive依赖包，一个mysql依赖包，不用mysql可以不用写mysql jdbc包填好后点

zlsdmx 0喜欢 / 0评论 2018-11-24

CentOS 6.5中部署Zeppelin并配置账号密码验证

在安装Zeppelin之前，你需要在部署的服务器上安装Oracle JDK 1.7或以上版本, 并配置好相应的JAVA_HOME环境变量。以CentOS为例，具体操作过程如下：。b)配置环境变量。在/etc/profile文件结尾添加：。这说明Zeppel

AlvinPanda 0喜欢 / 0评论 2018-11-24

Cittio推出首款云计算管理客户端Zeppelin

根据国外媒体报道，周一 Cittio公司推出了Zeppelin项目，这是第一款开源的云计算管理和监控客户端。该公司希望这项新技术可以让大型IT商店更多的采用云计算。该公司官方把Zeppelin计划看作是他们实现其目标的第一步。Cittio公司声称，Zepp

bjlishigui 0喜欢 / 0评论 2009-03-11