**1\. 写在前面** (1)如果你的业务预算或机器资源有限,强烈不推荐使用clickhouse,因为这套架构成本比较高。 (2)最小集群部署所需机器:ck节点需要2台256G内存/40c cpu物理机,磁盘使用SSD,加上3台zookeeper和2台chproxy应用主机或者云主机。 (3)Clickhouse自带了丰富的功能来应对复杂的业务场景和大数据量,所以在使用期间需要运维和开发侧都投入人力对这些功能(表引擎类型)学习和掌握。 **2\. 业务在数据层的表现** (1)业务大多数是读请求,存储宽表,无大字段,较少的并发(单台100-200qps左右)。 (2)数据批写入(1000条以上,线上业务建议5w-10w),不修改或少修改已添加的数据。 (3)无事务要求,对数据一致性要求低。 (4)对于简单查询,允许延迟大约50毫秒,每一个查询除了一个大表外都很小。 (5)处理单个查询时需要高吞吐量(每个服务器每秒高达数十亿行)。 **3.具体业务场景** (1)用户行为分析,精细化运营分析:日活,留存率分析,路径分析,有序漏斗转化率分析,Session分析等; (2)实时日志分析,监控分析; (3)实时数仓。