「Data Engineering Zoomcamp」免费 9 周数据工程课程:从 Docker、BigQuery、dbt 到 Spark 和 Kafka

Data Engineering Zoomcamp 课程架构图

Data Engineering Zoomcamp 是 DataTalks.Club 开放的免费 9 周数据工程课程,目标是带学习者从零搭一条端到端数据管道。它不是只讲概念的课程仓库,而是把 Docker、Terraform、GCP、BigQuery、dbt、Spark、Kafka、数据摄取和最终项目都放进一个连续训练路径里。

2026 cohort 的开始时间是 2026 年 1 月 12 日,但所有材料也可以自学。课程要求并不夸张:有基础编程经验、熟悉 SQL,会一点 Python 更好,但不要求已有数据工程背景。这让它很适合作为转向数据工程岗位或补齐工程化数据栈的第一套系统材料。

课程结构覆盖得很完整:第一模块是 Docker、PostgreSQL 和 Terraform;后面进入工作流编排、数据摄取、BigQuery 数据仓库、dbt 与 analytics engineering、Bruin 数据平台、Spark batch processing、Kafka streaming,最后用真实项目做 peer review。相比零散教程,它的价值在于把工具链串成一条可执行路线。

README 里也能看到社区属性:Slack、YouTube playlist、FAQ、Telegram announcements 都是课程入口的一部分。很多 testimonials 提到这门课帮助他们进入数据领域或建立数据工程基础,这类长期社区课程的优势,往往就在于遇到问题时有人一起走。

仓库当前约 41.6k stars,主要内容是 notebooks、课程文档和项目材料。GitHub 仓库元数据没有显示 license 字段,使用或转载内容前最好查看具体目录说明。对想系统学习现代数据工程的人来说,这个仓库很适合收藏,尤其适合作为“从会 SQL 到能搭 pipeline”的路线图。

项目地址

官网:https://datatalks.club/faq/data-engineering-zoomcamp.html
项目地址:https://github.com/DataTalksClub/data-engineering-zoomcamp

原创文章,如若转载,请注明出处:https://wefound.cc/p/4164.html

(0)
「Project N.O.M.A.D.」离线优先生存知识服务器:把 Wikipedia、AI、地图和教育资源装进本地设备
上一篇 4天前
「Requestly」开源 HTTP 拦截器:在浏览器和桌面应用里改写请求、Mock API、调试流量
下一篇 4天前

相关推荐