Jupyter配置Spark开发环境

hanyingjun 2016-10-09

兄弟连大数据培训（www.lampbrother.net

）和大家一起探究Jupyter配置

Spark

开发环境

简介

为Jupyter配置Spark开发环境，可以安装全家桶–SparkKernel或Toree，也可按需安装相关组件。

考虑到一般人更喜欢一步到位，并且Toree将会代替SparkKernel，故直接且仅需安装Toree即可，不过下面还是给出了所有的安装方法。

SparkKernel的安装

参照SparkKernel支持的语言，安装好SparkKernel后，其默认可以支持Scala，Python，R，SQL，对应的Spark实现分别是ScalawithSpark，PythonwithPySpark，RWithSparkR，SparkSQL。

参照上述链接，要切换语言时，只需简单的在语句前面加上%%scala/%%pyspark即可。当然，什么都不加时，默认语言为Scala。

另外，启动Jupyter后，可直接在http://localhost:4040/jobs/监控所有作业。

SparkKernel(旧的项目)

参照下面的安装步骤进行即可，就是有些繁琐。

GettingStartedwiththeSparkKernel

GuidetoIntegratingtheSparkKernelwithJupyter

Toree(新项目)

根据SparkKernel的介绍，自从SparkKernel变成Apache的孵化项目后，其最新仓库已经迁移到了incubator-toree。

安装时，参照QuickStartWhatisApacheToree，仅需两条命令即可完成安装。

pipinstalltoree

jupytertoreeinstall--spark_home=your-spark-home12

值得注意的是:

Toree虽然还在孵化中，但已经能完成上述SparkKernel的全部功能，即可支持PySpark，SparkSQL等。

该kernel安装在/usr/local/share/jupyter/kernels/apache_toree_scala目录下

Spark组件单独安装

除了安装上面的方法安装Spark的全家桶外，还可以按需对各组件进行安装。

ScalaKernel的安装

参照jupyter-scala安装即可。

PySpark的安装

PySpark:HowtoinstallandIntegratewiththeJupyterNotebook

IntegrateApacheSparkwithlatestIPythonNotebook(Jupyter4.x)

RunningSparkApplicationsUsingIPythonandJupyterNotebooks

: hanyingjun

相关推荐

VS Code 中 Python 扩展的部分功能重构，支持 R 和 Julia

11 月 12 日，微软将 Jupyter Notebook 支持从 Python 扩展中独立出来，发布新的 Jupyter 扩展，支持智能感知，调试等功能的交互式编程和计算。Jupyter 扩展通过新的“ Native Notebooks Experi

weiiron 0喜欢 / 0评论 2020-11-16

出色代码成就机器学习：数据科学的软件工程技巧和最佳实践

如果你对数据科学感兴趣，那么可能对这个工作流程很熟悉：通过运行Jupyter notebook开启一个项目，然后开始编写python代码、运行复杂的分析甚至训练模型。随着notebook文件的函数、类、图和日志的大小不断增长，你会发现自己面前堆积了巨大的

yonezcy 0喜欢 / 0评论 2020-09-27

用 Jupyter Notebook 教 Python

有了 Jupyter、PyHamcrest，用一点测试的代码把它们连在一起，你就可以教任何适用于单元测试的 Python 内容。关于 Ruby 社区的一些事情一直让我印象深刻，其中两个例子是对测试的承诺和对易于上手的强调。是的，使用Jupyter Note

liwg0 0喜欢 / 0评论 2020-09-24

好用到飞起的12个jupyter lab插件

jupyter lab作为jupyter notebook的升级改造版，除了更加人性化的交互界面以及更多的用户自主定制功能之外，最吸引人的就是其丰富多样的拓展插件，使得每个使用jupyter lab的人都可以按照自己所需挑选安装插件，组合出自己心中的完

lff 0喜欢 / 0评论 2020-08-23

使用jupyter notebook运行python和R的步骤

一个图形化的交互式运行环境，对于编程语言的学习和开发，特别是可视化方面，提供了极大的便利。比如在window上使用R语言进行绘图，在R语言自带的交互环境中，可以实时观测到代码的可视化效果，从而方便的进行参数调整。jupyter notebook是一款基于浏

xhgWanderingsoul 0喜欢 / 0评论 2020-08-16

jupyter notebook 同时存在python3.5 和python3.6

# 更改里面的kernel.json文档中Python的路径调用，改为所需要的Python版本

巩庆奎 0喜欢 / 0评论 2020-07-21

在Window和Mac 下安装Python3 和Jupyter notebook

下载之后安装勾选PATH，自动添加到系统环境变量。Jupyter notebook 是一个基于网页的交互式应用程序，我们可以在网页上直接编写Python代码和运行代码，也可以编写说明文档。如果要关闭直接Ctrl+C关闭服务，关闭之前记得保存哦。

liangzhouqu 0喜欢 / 0评论 2020-07-07

python安装jupyter notebooks（windows下）

以3.8为例子，在安装的时候有个这个勾选项，Add Python 3.8 to PATH，勾上就好，没有的话。就把python下的scripts 路径加入到path即可。打开命令提示窗，切换到python3.8的安装目录下的Scripts文件夹。在安装An

assastor 0喜欢 / 0评论 2020-07-05

jupyter notebook使用技巧--命令行模式以及在Markdown模式使用的操作（4）

D3哥在德国 2018-06-09 08:50:40 33450 收藏 44展开正常情况，jupyter notebook的cell是绿色的，我们可以在绿色cell里输入代码。但如果我们将鼠标点击cell框的左侧，点击，会发现cell变成蓝色的，很奇妙~当

tenvainvi 0喜欢 / 0评论 2020-06-09

Python 代码编辑器怎么选？PyCharm、VS Code、Jupyter Notebook 都各有特色

Python 代码编辑器怎么选？PyCharm、VS Code、Jupyter Notebook 都各有特色，Jupyter 适合做数据分析这些需要可视化的操作，PyCharm 更适合做完整的 Python 项目。然而，因为交互式操作，很少会有开发者想到用

wuguangbin0 0喜欢 / 0评论 2020-04-24

Jupyter notebook中的Cell and Line Magics

　　首先，Cell and Line Magics是什么？最常见的就是%matplotlib inline和%%time了，功能大家应该都清楚。前者是控制直接在Jupyter console中绘图，而后者能够方便记录一个cell的运行时间，还有就是我经常直

JannaShen 0喜欢 / 0评论 2020-04-11

基础教程：运用JupyterNotebooks在VS代码中完成入门级开发

VS Code现在通过Python插件对Jupyter Notebooks提供本地支持。概述其主要功能的简单示例如下。尽管许多程序员选择使用IDE并通过坚持使用而真正了解它，但包括笔者在内的其他程序员却喜欢探索不同的IDE选项。这不仅是因为笔者想了解每个流

iOampDagWatu 0喜欢 / 0评论 2020-03-23

Jupyter command `jupyter-contrib` not found

解决打开cmd进入如下目录此目录下有。cmd执行下面命令手动安装。重新启动jupyter notebook 发现已安装成功

始终不够 0喜欢 / 0评论 2020-03-05

云计算教程入门视频：如何安装运行和连接Jupyter Notebook

在IT行业，可以说云计算已经渗入到各个角落，无论是从事什么语言的编程人员，对云计算应该都要有所了解。下面，千锋就为大家分享最新视频教程，帮助新手快速入门。下面教给大家如何安装运行和连接Jupyter Notebook：。来自Project Jupyter的

colin00 0喜欢 / 0评论 2020-02-14

python Jupyter Notebook插件

Nbextensions是一个非常有用的插件，集合了很多插件。————————————————常用的插件：。Code prettify：它能重新调整代码块内容的格式并进行美化。Printview：这个扩展会添加一个工具栏按钮，可为当前笔记本调用 jupyt

zhuquan0 0喜欢 / 0评论 2020-02-11

jupyter server

使用 $ which python2 , $ which python3 查看，一般会返回 /usr/bin/python2 , /usr/bin/python3 ，如果没有，那么就用 $ sudo apt-get install python2 来安装

MrNineteen 0喜欢 / 0评论 2020-02-09

jupyter server

使用 $ which python2 , $ which python3 查看，一般会返回 /usr/bin/python2 , /usr/bin/python3 ，如果没有，那么就用 $ sudo apt-get install python2 来安装

liying00 0喜欢 / 0评论 2020-02-09

jupyter文档

https://www.cnblogs.com/heenhui2016/p/10637746.html ：jupyter notebook 与lab区别https://www.zhihu.com/question/46309360 作用 https:/

julien 0喜欢 / 0评论 2020-02-03

Jupyter Notebook小技巧

保存，重启Notebook后生效。感谢离宫2提示这个技巧。但如果你的目的是数据分析、算法研究等方面的工作，那么Jupyter Notebook 最适合你，因为它足够简单，让你可以专注于数据和算法的逻辑而不是工具。唯一麻烦的就是需要你注册并实名认证。但

chenxihou 0喜欢 / 0评论 2020-01-28

机器学习开篇——编译器的选择

最初大家都推荐用pycharm，我下载了专业版，的确很帅气，语法高亮看着很舒服，代码自动补全很科学，File explorer层次也很清晰，是一款不可多得的上乘IDE。Jupyter Notebook，代码可以分块执行，同一文件下的变量可保留，重复执行同一

vshacker 0喜欢 / 0评论 2020-01-28

jupyter调教

而公司spark集群上都是py2的解释器。因此jupyter上运行时需要使用py2的kernel. 前提：使用py2的kernel需安装py2的ipython和kernel。而目前使用的jupyter版本过高，和py2的ipython和kernel不匹配，

taxuexunmeixi 0喜欢 / 0评论 2019-12-29

Python编程神器Jupyter Notebook使用的28个秘诀（附代码）

本文总结了28种Jupyter Notebook的使用技巧。[ 导读 ]最近做实验一直是用Jupyter Notebook编程，有一种打草稿的便捷感，在dataquest上看到一篇博客总结了28种Jupyter Notebook的使用技巧。希望大家在用Ju

lizhou 0喜欢 / 0评论 2019-12-28

3、Python的IDE之Jupyter的使用

Jupyter Notebook 的本质是一个 Web 应用程序，便于创建和共享文学化程序文档，支持实时代码，数学方程，可视化和 markdown。注意：Jupyter安装需要Python 3.3或更高版本，或Python 2.7。

GhostLWB 0喜欢 / 0评论 2019-12-12

一款帮助你学习Python机器学习的工具

Jupyter Notebook 不知道大家了解不？他非常的强大，学过 Python 的同学应该都知道。Jupyter Notebook 是以网页的形式打开，可以在网页页面中直接编写代码和运行代码，代码的运行结果也会直接在代码块下直接显示的程序。如在编程过

muashy 0喜欢 / 0评论 2019-12-04

配置访问公网主机上的jupyter notebook

# yum -y install zlib-devel bzip2-devel openssl-devel ncurses-devel sqlite-devel readline-devel tk-devel gdbm-devel db4-devel li

千锋 0喜欢 / 0评论 2019-12-02

数据分析常用Jupyter而不是直接使用Python脚本或Excel原因在哪？

数据分析和传统的MVC软件开发的最大区别在于，数据分析存在一个data flow, 我们是在不断的做计算，并且画图。这里存在一个大致的“顺序”，比如。这有点类似做应用题。而这是传统的IDE 没有办法做到的。而Notebook做这个要更方便，结果直接产生在

CSDNDRAGON 0喜欢 / 0评论 2019-11-22

Netflix开源Polynote：对标Jupyter，一个笔记本运行多种语言

使用类似 Jupyter Notebook 进行数据分析和机器学习是近来较为方便灵活的开发方式，但是 Jupyter Notebook 缺乏对多种语言的原生支持，在管理笔记本内的依赖、数据可视化等方面有所欠缺。近日，NetFlix 公司将其数据分析和机器学

bluecarrot 0喜欢 / 0评论 2019-11-11

关于如何往Jupyter notebook添加可选的kernel

关于如何安装Anaconda，这里就不再一一赘述，安装完Anaconda,接下来我们就可以用Anaconda来创建我们一个个独立的python环境了.activate能将我们引入anaconda设定的虚拟环境中,如果你后面什么参数都不加那么会进入anaco

zhangpan 0喜欢 / 0评论 2019-11-12

GitHub标星2.6K！Jupyter“慌了”！Netflix发布新开发工具Polynote

近日，Netflix宣布开源Polynote，Polynote是Netflix自家使用的多语言笔记本环境，Polynote为数据科学家和机器学习研究人员提供了一个笔记本环境，允许他们将基于JVM的ML平台与Python生态系统中流行的机器学习和可视化库无缝

cooldatabase 0喜欢 / 0评论 2019-11-08

增强Jupyter Notebook的功能，这里有四个妙招

本文介绍了一些自定义功能，帮助你使用 Jupyter notebook 更高效地写代码。Jupyter Notebook 是所有开发者共享工作的神器，它为共享 Notebooks 提供了一种便捷方式：结合文本、代码和图更快捷地将信息传达给受众。目前，Jup

青松 0喜欢 / 0评论 2019-11-08

Tip : windows下修改jupyter notebook默认启动浏览器

保存，终端输入 jupyter notebook 启动 chrome网页。

程序员俱乐部 0喜欢 / 0评论 2019-11-06

官宣：VS Code Python全新发布，提供 Jupyter Notebook 原生支持

北京时间9月21日，PyCon China 2019 于上海举行，当天下午微软资深研发工程师做了关于《Python 与 Visual Studio Code 在人工智能应用中的最佳 Azure 实践》的演讲。微软官宣VS Code Python全新插件，同

fly00love 0喜欢 / 0评论 2019-11-05

VSCode支持Jupyter的原生编辑模式，最强数据科学编辑工具诞生

VSCode的文件管理、代码管理、工具集成以及自动补全都非常强大，但是对于数据科学家来说，它不能交互式地编程、实验，有一点遗憾。Jupyter的交互式编程非常棒，但是对于成规模的项目来说，它又太简单了，缺少必要的项目工具。有没有什么工具能够集成双方的优点，

野先生 0喜欢 / 0评论 2019-10-12

Centos 7.4 安装 Jupyter NoteBook + TensorFlow 教程

于是乎我想着，自己买的服务器闲着也是闲着就拿出来装一个，这样的话可以“云”使用。不知道的大家可以去看一下这篇文章《Centos 7.4 多版本Python以及虚拟环境安装》。创建一个 Python v3.6.9 的虚拟环境，并进入环境。右上角那里有个 Ne

AI技术研究院 0喜欢 / 0评论 2019-11-03

Aanconda+虚拟环境+jupyter notebook配置

点击安装包，前面是选择安装路径，一步一步点击确认下来。打开Windows的cmd，在cmd中输入jupyter notebook --generate-config如下图：。可以看到路径为D:\Users……## The directory to use

jacktangj 0喜欢 / 0评论 2019-10-27

在 Fedora 上搭建 Jupyter 和数据科学环境

在过去，神谕和魔法师被认为拥有发现奥秘的力量，国王和统治者们会借助他们预测未来，或者至少是听取一些建议。如今我们生活在一个痴迷于将一切事情量化的社会里，这份工作就交给数据科学家了。数据科学家通过使用统计模型、数值分析，以及统计学之外的高级算法，结合数据库里

84433568 0喜欢 / 0评论 2019-07-14

Linux下搭建Spark 的 Python 编程环境

Spark 可以独立安装使用，也可以和 Hadoop 一起安装使用。在安装 Spark 之前，首先确保你的电脑上已经安装了 Java 8 或者更高的版本。访问Spark 下载页面，并选择最新版本的 Spark 直接下载，当前的最新版本是 2.4.2 。下载

千锋 0喜欢 / 0评论 2019-06-12

7步搞定Python数据可视化，大牛出品教程，Jupyter、Colab版都有

打开Excel，自动就可以生成各种各样的图表。结合真实地理数据，展现美国每个县的失业率。全球自然灾害统计，类型、规模、时间，一目了然。甚至还有可爱的表情符号画风，生动的展现出英美两国的养殖业状况。要是用在客户招标会上，手握预算的客户也能清醒的认识到这单生意

chuckchen 0喜欢 / 0评论 2019-08-28

Python numpy 数组中冒号的使用（Jupyter Notebook）

下面的验证基于Azure提供的免费 Jupyter Notebook，如果对Jupyter Notebook 不熟悉的，可以参考如下链接：。下面看看具体的实例，首先定义一个2维数组。思考一下 a[0:2] 输出结果是什么？查看 b 和 b.shape，输出

Python开发者 0喜欢 / 0评论 2019-07-10

在Fedora上搭建Jupyter和数据科学环境

在过去，神谕和魔法师被认为拥有发现奥秘的力量，国王和统治者们会借助他们预测未来，或者至少是听取一些建议。如今我们生活在一个痴迷于将一切事情量化的社会里，这份工作就交给数据科学家了。数据科学家通过使用统计模型、数值分析，以及统计学之外的高级算法，结合数据库里

zhouqinxiong 0喜欢 / 0评论 2019-07-08

对 Python 开发者而言，IPython 仍然是 Jupyter Notebook 的核心

Jupyter 项目提供的魔法般的开发体验很大程度上得益于它的 IPython 基因。最近刚刚写过我为什么觉得觉得 Jupyter 项目提供了一种魔法般的 Python 开发体验。在研究这些不同项目之间的关联的时候，我回顾了一下 Jupyter 最初从

MrNineteen 0喜欢 / 0评论 2019-07-06

基于Jupyter Notebook 快速体验Python和plot()绘图方法

Jupyter Notebook 是一个非常强大的工具，可以体验交互式编程。%pylab inline每次创建一个新的Notebook，或者创新重新打开一个Notebook，运行画图代码之前，都需要先运行这行命令。%matplotlib inline 是一

ddxygq 0喜欢 / 0评论 2019-07-01

是程序员，就用python导出pdf

能不用就不用，我个人特别崇尚极简风。谁让我们是程序员呢，所以就爱上了Jupyter写课件，讲道理markdown也是个非常不错的写书格式啊。安装Jupyter其实非常简单，你会python就应该会用jupyter，起码简单的 pip install jup

wzginspur 0喜欢 / 0评论 2019-07-01

[python][jupyter notebook]之菜鸟安装[pyecharts]中Geo或Map显示问题

作为菜鸟，在学习使用pyecharts模块进入jupyter notebook的时候，又遇到了问题——那就是，可以使用一下代码，导入Geo和Map模块，但是弄了之后看不见地图。from pyecharts import Map所以，我有开始了寻找解决方法之

yunsaiqing 0喜欢 / 0评论 2019-07-01

[python]之菜鸟安装[pyecharts]进入[jupyter notebook]

第一步：升级python作为一个进军python的新菜鸟，我遇到了一个问题，在Jupyter Notebook里面我无法使用pyecharts，所以需要安装，我百度了一个常用方法，在win10下，管理员运行cmd，然后输入：pip install pyec

预则立 0喜欢 / 0评论 2019-06-30

为什么要用IPython/Jupyter?

python里面调试确实有点烦恼，尤其是在vim里，想要尝试一些简单的编码问题，实在是有点麻烦，不想到命令行模式一行一行执行，也不想再新建一个文件测试一个简单的功能。所以这时候才想到好像前阵子看到youtube视频里别人用IPython，是那种又能轻松编辑

鸣一 0喜欢 / 0评论 2019-06-30

安装并使用Jupyter Noterbook

Jupyter Notebook是一个交互式笔记本，支持运行 40 多种编程语言。笔者在写博客文章时，常常需要贴代码，一贴就是一大堆代码，这样不便于读者阅读，而使用Jupyter Notebook后，能一边贴代码，一边讲解代码，非常适合用于交互。本文代码将

zcabcd 0喜欢 / 0评论 2019-06-29

JUPYTER 服务的 NGINX 配置

proxy_set_header Connection "upgrade";JUPYTER 服务的 NGINX 配置 - Agentd

yongzhang 0喜欢 / 0评论 2019-06-28

Jupyter Notebook 下安装 PHP 内核

我最近被强烈安利了 Jupyter Notebook 这个交互式笔记本。然后试用了它自带的 Python 内核后，这个应用整体给我的感觉很不错，就去搜索了下它所支持的其它内核 Jupyter Kernels。我在下面内容介绍下该应用下如何安装 PHP 内

wzginspur 0喜欢 / 0评论 2019-06-28