搬瓦工中Ubuntu 安装Apache Spark小白使用教程

搬瓦工中Ubuntu 安装Apache Spark小白使用教程
Apache Spark

Apache Spark 是什么?

Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。几年钱在学术界异常火爆,最近几年可能不是那么火了,因为能研究的问题似乎都已经被研究的差不多了, 属于稳定期了;
Apache  Spark 是一个高效、通用的并行计算框架平台,其通过多种开发语言和丰富的高级 API,提供了一套统一整合的大数据计算引擎。同时,Spark 支持多种应用场景的使用,如面向结构化语言和结构化数据处理的 Spark SQL,面向机器学习的 MLlib,面向图处理的 GraphX 以及面向流式处理的 Streaming。 本文重点介绍一下如何在 ubuntu 20.00 Linux操作系统上面如何安装 Apache Spark , 包括如何安装 Java、安装 Apache Spark、以及通过 Apache Spark Web 界面访问的教程。Apache Spark 是一个用于大规模数据处理的开源、通用、多语言分析引擎。通过利用集群中的 RAM 对大量数据执行快速数据查询,它可以在单个和多个节点上工作。它提供批处理数据处理和实时流式传输,并支持 Python、SQL、Scala、Java 或 R 等语言的高级 API。该框架提供内存技术,使其能够将查询和数据直接存储在集群节点的主存储器。

Apache Spark 安装准备工作

1.root 权限的非 root 账户

2. JDK安装包(推荐使用openJDK, 避免法律问题)

Apache Spark 安装教程

更新系统包:
$ sudo apt update

安装JDK:

你也可以上传你自己的JDK到服务器解压后安装

$ sudo apt install default-jdk -y

确认JDK安装成功:

$ java -version

安装必要Spark的包(前置动作已完成):

最新Spark下载地址: https://spark.apache.org/downloads.html;

$ sudo apt install curl mlocate git scala -y
#远程获取安装包
$ curl -O https://archive.apache.org/dist/spark/spark-3.2.0/spark-3.2.0-bin-hadoop3.2.tgz

解压获取到的安装包

$ sudo tar xvf spark-3.2.0-bin-hadoop3.2.tgz

创建Spark安装目录:

$ sudo mkdir /opt/spark

移动文件到安装目录:

$ sudo mv spark-3.2.0-bin-hadoop3.2/* /opt/spark

修改目录权限:

#我们这里给的是最高权限, 你可以看情况给到指定权限
$ sudo chmod -R 777 /opt/spark

编辑 bashrc 配置文件,将 Apache Spark 安装目录添加到系统路径:

$ sudo nano ~/.bashrc

将下面两行代码添加到文件末尾保存即可:

export SPARK_HOME=/opt/spark
export PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin

刷新修改的配置:

$ source ~/.bashrc

启动Spark服务:

$ start-master.sh

最后: 启动成功,我们可以通过访问 http://ServerIPaddress:8080 从仪表板中查找您的服务器主机名。

访问你的服务: http://192.0.2.10:8080

搬瓦工VPS服务套餐列表

搬瓦工VPS使用KVM虚拟,1Gbps带宽,存储高速SSD,自带分配一个全球IPv4地址,便捷一键转译机房只需要在后台找到“Migrate to another DC”,点击一下,可以自动一键转移到其他某个机房(当然不包括CN2 GIA 和 香港机房);

VPS的全称是Virtual Private Server,中文翻译过来就是虚拟专用服务器,是相对于独立的服务器来说的。一台独立服务器,可以划分为n台VPS,每台VPS都可分配独立公网IP地址、独立操作系统,可以像独立服务器一样,重装操作系统,安装程序,单独重启服务器。因为VPS的价格更低,适合个人用户使用,所以我们搭建SSR一般都是在VPS上进行。 适合人群: 个人站长, wordpress建站, 个人程序系统搭建 小提示: VPS只是一个统称,在各商家的具体叫法可能各不相同。一般来说,与服务器相关的,只要商家没有明确标注是独服,就可以认为是VPS了。 VPS的特征: KVM虚拟,CN2 GT 网络,1Gbps带宽,每个VPS默认自带一个IPv4,支持支付宝付款,后台可以一键安装:快照备份、(VPS、VPS等等)

6.8折优惠码: 68083

内存(RAM)CPU(个)SSD(G)流量(T)价格($)购买地址
512M1核10G500G30$/年购买地址
1G1核20G1T50$/年购买地址
2G1核40G2T100$/年购买地址
4G2核80G3T20$/月购买地址
8G2核160G5T40$/月购买地址
16G3核320G8T80$/月购买地址
搬瓦工云服务器VPS列表

注意: 如果你在国内网站无法打开搬瓦工vps的网站, 那大概是被屏蔽了.你可以用搬瓦工做一个SS服务可以解决这个问题!

版权声明 1、本网站名称:顶级主机评测
2、本站永久网址:https://www.djzjpc.com
3、本网站内容均属于原创, 如需转载请著名原文出处链接: https://www.djzjpc.com/4282.html
4、本站一切资源不代表本站立场,并不代表本站赞同其观点和对其真实性负责。
5、本站一律禁止以任何方式发布或转载任何违法的相关信息,访客发现请向站长举报
6、本站资源大多存储在云盘,如发现链接失效,请联系我们我们会第一时间更新。
(2)
上一篇 2022年5月6日 下午11:40
下一篇 2022年5月10日 下午7:26

相关推荐

  • Downkyi开源B站视频免费下载工具

    Downkyi是什么? 大家好欢迎来到顶级主机评测网, 今天向大家推荐一个好用的B站视频下载工具Downkyi; Downkyi别名哔哩下载姬是一个大家公认的小白也可以使用的简单易用的哔哩哔哩视频下载工具(主要是免费且好用),downkyi的操作界面十分简洁,操作起来也非常舒服。哔哩下载姬(downkyi)目前几乎可以下载所有现有的B站视频(直播视频, 不允…

    2022年6月20日
    41900
  • Linux系统VPS远程连接-新手简单教程

    Linux系统的VPS, 其实与普通的Liunx系统对于我们大众来说感知上是不存在差异的, 管理Linux VPS的操作基本都是基于命令行的, 这里的VPS连接图文教程展示下新手如何通过FinalShell工具远程连接Linux VPS; 顺带分享一下国产免费FinalShell, Linux工具, 国产版Xshell, 再也不用到处寻找破解的Xshell;…

    2022年5月15日
    33000
  • VPS服务器是什么?VPS的能干嘛?-专业讲解

    VPS最近很火的一个词, 以前大家一定听过云计算, 云服务器, 阿里云, 腾讯云, 华为这些与云相关的词汇吧, 其实VPS也算是云计算中的一种, VPS全称翻译过来就是Virtual Private Server, 翻译成中文就是: 虚拟专用服务器。VPS可以简单理解成一台远程电脑,它具有普通电脑具备的一些组件, 对于我们来说我们可以简单的把他看做是一台电脑…

    2022年5月16日
    16200
  • 搬瓦工VPS多端口多用户密码手动配置教程-Shadowsocks(SS)

    在学习本文前请确认你的搬瓦工服务器已经安装好Shadowsocks服务, 在此基础上才能配置多用户账户使用, 多端口使用! 本文主要讲解shadowsocks简称ss设置多端口多密码方式,以搬瓦工VPS为例,演示系统环境为CentOS6.8。 想必大家用过搬瓦工VPS的都知道, 搬瓦工的VPS服务自带有一键设置ss功能非常方便, 一键设置的过程我就不说了, …

    2022年4月30日
    1.7K00
  • 什么是云主机?云主机能干嘛有什么用?-顶级国外服务器评测网

    什么是云主机? 说起云主机一定有很多人会想起云计算,云电脑,移动云,云服务器,云桌面等等这些与云主机相关的东西, 如果你是一个互联网从业者基本多多多少都会接触过云主机, 可能只是有时你没注意, 今天顶级主机评测网就为大家来简单科普一下什么是云主机! 云主机科普:你看到的云主机就是这一排排的大铁柜里面放着的一个个像抽屉一样的电脑主机 云主机是新一代的主机租用服…

    2022年5月10日
    18100

发表评论

您的电子邮箱地址不会被公开。

联系我们

tt.ckuiry@foxmail.com

在线咨询: QQ交谈

邮件:tt.ckuiry@foxmail.com

工作时间:周一至周五,9:30-18:30,节假日休息