强曰为道
与天地相似,故不违。知周乎万物,而道济天下,故不过。旁行而不流,乐天知命,故不忧.
文档目录

ClickHouse 教程

ClickHouse 是开源的列式 OLAP 数据库,专为海量数据实时分析而设计,具备极高的查询性能和数据压缩比。本教程共 28 章,从安装部署到生产实战,全面掌握 ClickHouse。

🟢 基础入门(第 1-10 章)

章节 标题 难度
01 ClickHouse 简介与架构 🟢
02 安装与部署 🟢
03 数据类型详解 🟢
04 表引擎:MergeTree 家族 🟢
05 SQL 基础(SELECT/INSERT) 🟢
06 分区与排序键设计 🟡
07 索引系统(主键/跳数索引) 🟡
08 数据压缩与编码 🟡
09 数据导入(CSV/JSON/Parquet) 🟢
10 集合函数与窗口函数 🟡

🟡 进阶开发(第 11-18 章)

章节 标题 难度
11 表引擎深入(Replacing/Summing/Aggregating) 🟡
12 JOIN 详解 🟡
13 物化视图与投影 🟡
14 数据库引擎(Atomic/Memory/Lazy) 🟡
15 分布式表与集群 🔴
16 副本与数据一致性 🔴
17 数据 TTL 与生命周期管理 🟡
18 事务与并发控制 🔴

🔴 高级运维与实战(第 19-28 章)

章节 标题 难度
19 性能优化与调优 🔴
20 查询分析(EXPLAIN/Query Log) 🟡
21 用户权限与安全 🟡
22 监控与告警(Prometheus/Grafana) 🟡
23 备份与恢复 🟡
24 ClickHouse 与 Kafka 实时导入 🔴
25 ClickHouse 与数据湖(S3/HDFS) 🔴
26 ClickHouse Keeper(替代 ZooKeeper) 🔴
27 Docker/Kubernetes 部署 🟡
28 实战:构建实时分析平台 🔴

核心特性速查

特性 说明
列式存储 按列存储,高压缩比,OLAP 查询极快
向量化执行 SIMD 指令加速,CPU 利用率高
MergeTree 引擎 核心引擎,支持分区/排序/索引/TTL
数据压缩 LZ4/ZSTD,默认压缩比 10:1 以上
分布式查询 分片+副本,支持分布式 JOIN
实时写入 支持高吞吐实时写入(百万行/秒)
SQL 兼容 类 SQL 语法,支持 JOIN/子查询/窗口函数

参考资源