dmz社区

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 4809|回复: 123

[大数据] Spark+ClickHouse实战企业级数据仓库,进军大厂必备(前6章)

  [复制链接]
  • TA的每日心情
    奋斗
    2023-8-25 08:46
  • 签到天数: 29 天

    [LV.4]偶尔看看III

    92

    主题

    127

    帖子

    599

    积分

    荣誉会员

    积分
    599

    发表于 2023-8-2 09:00:04 | 显示全部楼层 |阅读模式

    本站资源全部免费,回复即可查看下载地址!

    您需要 登录 才可以下载或查看,没有帐号?立即注册

    x
    image.png


    第1章 从0到1搭建项目开发环境,快速上手大数据开发 试看7 节  55分钟
    本章将从0到1搭建大数据开发环境,通过IDEA+Maven构建多module项目,实现源码、启动脚本、配置等自动构建打包。

    第2章 项目关键技术准备,学习通用的数据处理技术13 节  88分钟
    本章对项目所用到关键技术进行封装,通过Spark UDF整合IP地址相关的转换功能、二分查找算法、通用Grok数据解析器等,并通过rewrite方式修改Grok组件源码,学习源码整合的思路。

    第3章 项目数据准备,操练基于Spark的数据开发与优化8 节  61分钟
    本章主要是基于Spark,模拟生成项目所需要的基础数据和安全访问日志数据,操练基于Spark对数据进行处理与优化技术。

    第4章 初识OLAP数仓架构5 节  17分钟
    本章主要介绍构建数仓的主流数据技术架构,以及基于ClickHouse的OLAP架构相比典型大数据架构的优势。

    第5章 详解数据仓库基础理论,掌握数据仓库的实施流程10 节  48分钟
    本章介绍数仓的基础理论、数据仓库的架构以及建模方法。基于当前主流的维度建模,学习数据仓库的构建流程以及分层模型的划分。

    第6章 【项目实战第一篇】项目业务流程与ODS层数据同步8 节  57分钟
    本章首先介绍项目的业务流程与实现的效果。根据项目ODS层的规划,封装基于HDFS API同步工具,搭配多线程,实现高性能的数据同步。 针对业务数据库,封装了通用的关系型数据库的数据同步,实现将任意的库表数据同步至HDFS,可指定任意的文件格式、配置项。...

    第7章 快速上手OLAP分析引擎ClickHouse10 节  64分钟
    本章将介绍clickhouse的主要特性和架构,并通过搭建单机版本的clickhouse,快速学习掌握ClickHouse的基本使用。同时,分享了ClickHouse学习的几点建议,以帮助同学们更深入地学习和掌握clickhouse。

    第8章 基于Spark源码自定义ClickHouse外部数据源,简化数据写入流程6 节  90分钟
    本章将带领大家,自定义Spark的ClickHouse外部数据源,实现类似Spark的文件和JDBC数据源的功能,屏蔽底层实现细节,极大简化数据写入流程。

    第9章 数仓高级之维度模型设计10 节  54分钟
    本章将系统地介绍维度设计的流程以及如何进行维度的模型设计, 通过具体的案例分析如何进行维度的整合、拆分,如何处理缓慢变化的维度, 维度的层次模型如何设计、优化,以及几种常见的维度模型等。

    第10章 【项目实战第二篇】构建项目公共维度层9 节  59分钟
    本章基于维度模型设计的理论,采用反规范化、维度合并、维度拆分以及维度层次扁平化等维度设计方法,建立项目的公共维度层的表模型,实现易用性和性能提升,并保证维度模型的稳定性。

    第11章 ClickHouse的MergeTree系列引擎原理、实践与优化25 节  162分钟
    本章对ClickHouse MergeTree引擎进行了深入的解析,重点介绍了MergeTree系列引擎的主要特性和使用。 通过模拟大数据量的场景,实践了跳数索引以及Projection两大性能优化利器对性能提升的效果。针对MergeTree不擅长更新删除的特点, 介绍了如何对数据进行实时的更新和删除的方案...

    第12章 数仓高级之事实表模型设计9 节  45分钟
    本章系统地介绍了数据仓库的六种类型的事实表以及事实表的四步设计过程。从实践应用的角度出发,详细介绍如何根据业务过程建模和分析主题建立各类事实表模型。

    第13章 【项目实战第三篇】数据清洗加工,构建项目数据明细层13 节  94分钟
    本章根据安全访问日志的业务处理过程,面向业务过程建模,建立事务事实表、周期性快照事实表、累积快照事实表的模型。在大数据量的场景下, 优化Spark数据处理的性能。通过Projection以及视图封装周期性快照事实表,提升性能。...

    第14章 构建ClickHouse分布式集群,掌握分布式环境的数据查询、写入优化方案9 节  54分钟
    本章详细演示了如何从零开始,构建一个分布式的ClickHouse的集群,并验证集群的高可用、容错等功能。详细解析在分布式环境下,如何对clickhouse进行数据的写入和查询的优化的实践方案。

    第15章 【项目实战第四篇】负载均衡与高可用方案实践,自定义Spark写本地分片表策略15 节  85分钟
    本章从JDBC代码、Nginx反向代理、CHProxy、Spark等几个方面实践数据负载均衡可高可用。Spark的负载均衡和高可用支持通过自定义本地表的数据写入,支持轮询、随机等更灵活地分片写入策略。在集群环境,演示大数据量的数据写入与优化。...

    第16章 【项目实战第五篇】如何选择合适的维度表存储方案21 节  108分钟
    本章介绍几种常见的表引擎以及ClickHouse的字典,确定在不同的场景下,如何选择维度表的存储方案。

    第17章 【项目实战第六篇】数据汇总层与应用查询优化14 节  69分钟
    面向主题建模,生成数据仓库数据汇总层(DWS)的表。在集群环境,对超千万级的项目数据进行分析、SQL优化、参数调优,演示调优前后的效果。

    第18章 【项目实战第七篇】基于轻量级BI工具的数据展示与可视化监控13 节  58分钟
    本章将实现在BI工具Superset和Granfana中创建Dashboard,实现可视化的面向应用的展示。 同时,在Granfana中,通过集成ClickHouse的系统表以及Prometheus两种方式,对clickhouse进行监控。

    第19章 数仓管理之调度系统DolphinScheduler 3.x18 节  153分钟
    本章使用DolphinScheduler构建分布式、易扩展的可视化DAG工作流任务调度平台。主要介绍DolphinScheduler的源码编译、部署,工作流是如何管理的,参数的分类、传递以及优先级,如何实现文件资源的管理,如何实现告警的配置,并通过项目实践,配置工作流调度。 ...

    第20章 构建现代数据技术栈的元数据管理平台14 节  87分钟
    本章介绍元数据管理的体系架构以及演进过程,通过DataHub搭建元数据管理系统,基于项目实践MySQL、ClickHouse、可视化BI平台等数据实体的元数据发现、摄取、血缘链路的建立以及自定义基于元数据事件的实时响应流程,充分发掘、利用数据的价值。...

    第21章 通用数据质量管理实践13 节  93分钟
    本章将介绍数据质量的评估标准、管理架构与数据模型,从零实现了一个通用的数据质量管理工具,通过具体的案例实践单表和多表的数据质量检查,数据质量检查的的指标和执行结果写入数据库,异常等需要进一步分析的明细数据写入HDFS等文件系统...


    下载地址:

    游客,如果您要查看本帖隐藏内容请回复

    温馨提示:
    1、本站所有内容均为互联网收集或网友分享或网络购买,本站不破解、不翻录任何视频!
    2、如本帖侵犯到任何版权问题,请立即告知本站,本站将及时予与删除并致以最深的歉意!
    3、本站资源仅供本站会员学习参考,不得传播及用于其他用途,学习完后请在24小时内自行删除.
    4、本站资源质量虽均经精心审查,但也难保万无一失,若发现资源有问题影响学习请一定及时点此进行问题反馈,我们会第一时间改正!
    5、若发现链接失效了请联系管理员,管理员会在2小时内修复
    6、如果有任何疑问,请加客服QQ:1300822626 2小时内回复你!

    本帖被以下淘专辑推荐:

    回复

    使用道具 举报

  • TA的每日心情

    2024-4-17 22:42
  • 签到天数: 146 天

    [LV.7]常住居民III

    1

    主题

    248

    帖子

    1045

    积分

    技冠群雄

    Rank: 6Rank: 6

    积分
    1045

    发表于 2023-8-3 12:36:20 | 显示全部楼层
    文件夹是空的
    回复 支持 1 反对 0

    使用道具 举报

  • TA的每日心情
    擦汗
    7 小时前
  • 签到天数: 494 天

    [LV.9]以坛为家II

    3

    主题

    1243

    帖子

    4498

    积分

    傲视群雄

    Rank: 8Rank: 8

    积分
    4498

    发表于 2023-8-2 09:14:05 | 显示全部楼层
    啥也不说了,感谢楼主分享哇!
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    无聊
    前天 08:03
  • 签到天数: 553 天

    [LV.9]以坛为家II

    0

    主题

    977

    帖子

    3584

    积分

    终身会员[A]

    Rank: 7Rank: 7Rank: 7

    积分
    3584

    发表于 2023-8-2 09:19:10 | 显示全部楼层
    啥也不说了,感谢楼主分享哇!
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    13 小时前
  • 签到天数: 1762 天

    [LV.Master]伴坛终老

    4

    主题

    4722

    帖子

    1万

    积分

    超凡入圣

    Rank: 10Rank: 10Rank: 10

    积分
    14698

    发表于 2023-8-2 09:25:53 | 显示全部楼层
    啥也不说了,感谢楼主分享哇!
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    擦汗
    11 小时前
  • 签到天数: 915 天

    [LV.10]以坛为家III

    0

    主题

    1177

    帖子

    4845

    积分

    傲视群雄

    Rank: 8Rank: 8

    积分
    4845

    发表于 2023-8-2 10:11:13 | 显示全部楼层
    确实是难得好帖啊,顶先
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    无聊
    半小时前
  • 签到天数: 634 天

    [LV.9]以坛为家II

    0

    主题

    767

    帖子

    3384

    积分

    傲视群雄

    Rank: 8Rank: 8

    积分
    3384

    发表于 2023-8-2 11:17:22 | 显示全部楼层
    Spark+ClickHouse实战企业级数据仓库,进军大厂必备
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2024-4-18 00:17
  • 签到天数: 566 天

    [LV.9]以坛为家II

    1

    主题

    1566

    帖子

    4714

    积分

    傲视群雄

    Rank: 8Rank: 8

    积分
    4714

    发表于 2023-8-2 14:15:24 | 显示全部楼层
    啥也不说了,感谢楼主分享哇!
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    擦汗
    前天 16:13
  • 签到天数: 435 天

    [LV.9]以坛为家II

    0

    主题

    1304

    帖子

    3785

    积分

    傲视群雄

    Rank: 8Rank: 8

    积分
    3785

    发表于 2023-8-2 14:24:21 | 显示全部楼层
    正需要,支持楼主大人了!
    回复 支持 反对

    使用道具 举报

  • TA的每日心情

    前天 10:29
  • 签到天数: 797 天

    [LV.10]以坛为家III

    1

    主题

    4258

    帖子

    1万

    积分

    终身会员[A]

    Rank: 7Rank: 7Rank: 7

    积分
    10605

    发表于 2023-8-2 16:37:44 | 显示全部楼层
    啥也不说了,感谢楼主分享哇!
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    奋斗
    1 小时前
  • 签到天数: 1259 天

    [LV.10]以坛为家III

    0

    主题

    3613

    帖子

    1万

    积分

    超凡入圣

    Rank: 10Rank: 10Rank: 10

    积分
    10659

    发表于 2023-8-2 17:20:53 | 显示全部楼层
    啥也不说了,感谢楼主分享哇!
    回复 支持 反对

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    QQ|Archiver|小黑屋|本站代理|dmz社区

    GMT+8, 2024-4-28 21:37 , Processed in 0.099977 second(s), 46 queries .

    Powered by Discuz! X3.4 Licensed

    Copyright © 2001-2021, Tencent Cloud.

    快速回复 返回顶部 返回列表