随着公司业务数据量日益增长,数据处理场景日趋复杂,急需一种具有高可用性和高性能的数据库来支持业务发展,ClickHouse是俄罗斯的搜索公司Yandex开源的MPP架构的分析引擎,号称比事务数据库快100-1000倍,最大的特色是高性能的向量化执行引擎,而且功能丰富、可靠性高。
  在过去的一年中,杭研DBA团队已经支撑网易集团内部多个事业部上线使用,集群规模共计十几套,CPU近3000核,每日近千亿数据入库,千亿级别表查询可在秒级完成,大大提升了业务原有OLAP架构的效能,覆盖的业务场景包括:用户行为日志分析,进行PV、UV、留存、转化漏斗和操作,包括游戏反外挂数据统计分析;用户画像,人群圈定和问卷投放;AB实验数据的实时计算与分析;机器和业务日志的分析、监控、查询等。
- 导读
- 概述
- 第一章 安装部署
- 1.1. docker安装clickhouse
- 第二章 使用实践与规范
- 2.1. ClickHouse应用场景
- 2.2. 表引擎选择
- 2.2.1. MergeTree表引擎
- 2.2.2. ReplicatedMergeTree表引擎
- 2.2.3. ReplacingMergeTree表引擎
- 2.2.4. SummingMergeTree表引擎
- 2.2.5. Aggregatingmergetree表引擎
- 2.3. 开发规范
- 2.4. 集群架构
- 2.4.1. 常用架构
- 2.4.2. zookeeper的关键作用
- 2.4.3. chproxy
- 2.5. 客户端工具选择
- 2.6. 可用性说明
- 2.7. 集群配置参数调优
- 第三章 数据类型&语法以及常用函数
- 3.1. 基础数据类型
- 3.2. SQL函数
- 3.3. DDL与DML基本语法
- 3.4. UPDATE 和 DELETE操作
- 3.4.1. 数据UPDATE和DELETE操作示例
- 3.4.2. 数据的实时更新操作(Real-time UPDATE)
- 第四章 clickhouse实战篇
- 4.1. JDBC操作clickhouse
- 4.2. clickhouse集成mybatis