dmz社区

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 12040|回复: 158

[Spark/Scala] 全面掌握Spark性能优化炼成真正的Spark高手 Spark高级视频教程 spark性能优化

  [复制链接]

该用户从未签到

17

主题

18

帖子

0

积分

终身会员[A]

Rank: 7Rank: 7Rank: 7

积分
0

发表于 2017-11-26 01:17:15 | 显示全部楼层 |阅读模式

本站资源全部免费,回复即可查看下载地址!

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
课程目标
  • 大数据性能调优的本质
  • Spark 性能调优要点分析
  • Spark 资源使用原理流程
  • Spark 资源调优最佳实战
  • Spark 更高性能的算子

课程简介
我们谈大数据性能调优,到底在谈什么,它的本质是什么,以及 Spark 在性能调优部份的要点,这两点让在进入性能调优之前都是一个至关重要的问题,它的本质限制了我们调优到底要达到一个什么样的目标或者说我们是从什么本源上进行调优。希望我们的课程能为同学们带出以下的启发:
  • 了解大数据性能调优的本质
  • 了解 Spark 性能调优要点分析
  • 了解 Spark 在资源优化上的一些参数调优
  • 了解 Spark 的一些比较高效的 RDD 操作算子


大数据性能调优的本质
编程的时候发现一个惊人的规律,软件是不存在的!所有编程高手级别的人无论做什么类型的编程,最终思考的都是硬件方面的问题!最终思考都是在一秒、一毫秒、甚至一纳秒到底是如何运行的,并且基于此进行算法实现和性能调优,最后都是回到了硬件!
在大数据性能的调优,它的本质是硬件的调优!即基于 CPU(计算)、Memory(存储)、IO-Disk/ Network(数据交互) 基础上构建算法和性能调优!我们在计算的时候,数据肯定是存储在内存中的。磁盘IO怎么去处理和网络IO怎么去优化。

Spark 性能调优要点分析
在大数据性能本质的思路上,我们应该需要在那些方面进行调优呢?比如:
  • 并行度
  • 压缩
  • 序例化
  • 数据倾斜
  • JVM调优 (例如 JVM 数据结构化优化)
  • 内存调优
  • Task性能调优 (例如包含 Mapper 和 Reducer 两种类型的 Task)
  • Shuffle 网络调优 (例如小文件合并)
  • RDD 算子调优 (例如 RDD 复用、自定义 RDD)
  • 数据本地性
  • 容错调优
  • 参数调优



大数据最怕的就是数据本地性(内存中)和数据倾斜或者叫数据分布不均衡、数据转输,这个是所有分布式系统的问题!数据倾斜其实是跟你的业务紧密相关的。所以调优 Spark 的重点一定是在数据本地性和数据倾斜入手。
  • 资源分配和使用:你能够申请多少资源以及如何最优化的使用计算资源
  • 关发调优:如何基于 Spark 框架内核原理和运行机制最优化的实现代码功能
  • Shuffle调优:分布式系统必然面临的杀手级别的问题
  • 数据倾斜:分布式系统业务本身有数据倾斜
  • Spark 资源使用原理流程

这是一张来至于官方的经典资源使用流程图,这里有三大组件,第一部份是 Driver 部份,第二就是具体处理数据的部份,第三就是资源管理部份。这一张图中间有一个过程,这表示在程序运行之前向资源管理器申请资源。在实际生产环境中,Cluster Manager 一般都是 Yarn 的 ResourceManager,Driver 会向 ResourceManager 申请计算资源(一般情况下都是在发生计算之前一次性进行申请请求),分配的计算资源就是 CPU Core 和 Memory,我们具体的 Job 里的 Task 就是基于这些分配的内存和 Cores 构建的线程池来运行 Tasks 的。

游客,如果您要查看本帖隐藏内容请回复

温馨提示:
1、本站所有内容均为互联网收集或网友分享或网络购买,本站不破解、不翻录任何视频!
2、如本帖侵犯到任何版权问题,请立即告知本站,本站将及时予与删除并致以最深的歉意!
3、本站资源仅供本站会员学习参考,不得传播及用于其他用途,学习完后请在24小时内自行删除.
4、本站资源质量虽均经精心审查,但也难保万无一失,若发现资源有问题影响学习请一定及时点此进行问题反馈,我们会第一时间改正!
5、若发现链接失效了请联系管理员,管理员会在2小时内修复
6、如果有任何疑问,请加客服QQ:1300822626 2小时内回复你!
回复

使用道具 举报

该用户从未签到

21

主题

7719

帖子

998

积分

终身会员[A]

Rank: 7Rank: 7Rank: 7

积分
998

发表于 2018-6-28 21:04:49 | 显示全部楼层
学习了,谢谢分享、、、

该用户从未签到

22

主题

7875

帖子

990

积分

终身会员[A]

Rank: 7Rank: 7Rank: 7

积分
990

发表于 2018-7-8 00:31:34 | 显示全部楼层
么有分,谁能送我点积分啊::>_<::

该用户从未签到

23

主题

7814

帖子

1023

积分

终身会员[A]

Rank: 7Rank: 7Rank: 7

积分
1023

发表于 2018-7-10 22:26:45 | 显示全部楼层
学习了,谢谢分享、、、

该用户从未签到

32

主题

7817

帖子

974

积分

终身会员[A]

Rank: 7Rank: 7Rank: 7

积分
974

发表于 2018-7-29 15:54:55 | 显示全部楼层
小手一抖,钱钱到手!
  • TA的每日心情
    奋斗
    2021-8-5 09:02
  • 签到天数: 45 天

    [LV.5]常住居民I

    0

    主题

    169

    帖子

    508

    积分

    终身会员[A]

    Rank: 7Rank: 7Rank: 7

    积分
    508

    发表于 2018-7-29 22:23:13 | 显示全部楼层
    啥也不说了,感谢楼主分享哇!

    该用户从未签到

    0

    主题

    71

    帖子

    168

    积分

    终身会员[A]

    Rank: 7Rank: 7Rank: 7

    积分
    168

    发表于 2018-8-2 10:42:33 | 显示全部楼层
    Thank you man Thank you man Thank you man Thank you man

    该用户从未签到

    17

    主题

    7958

    帖子

    986

    积分

    终身会员[A]

    Rank: 7Rank: 7Rank: 7

    积分
    986

    发表于 2018-8-15 12:00:38 | 显示全部楼层
    找到好贴不容易,我顶你了,谢了

    该用户从未签到

    94

    主题

    8057

    帖子

    1006

    积分

    终身会员[A]

    Rank: 7Rank: 7Rank: 7

    积分
    1006

    发表于 2018-8-22 10:51:06 | 显示全部楼层
    正需要,支持楼主大人了!

    该用户从未签到

    20

    主题

    7940

    帖子

    1037

    积分

    荣誉会员

    积分
    1037

    发表于 2018-8-22 22:50:40 | 显示全部楼层
    我是来刷分的,嘿嘿
    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    QQ|Archiver|小黑屋|本站代理|dmz社区

    GMT+8, 2024-4-25 19:24 , Processed in 0.266511 second(s), 37 queries .

    Powered by Discuz! X3.4 Licensed

    Copyright © 2001-2021, Tencent Cloud.

    快速回复 返回顶部 返回列表