-
大数据ClickHouse进阶(二):MergeTree表引擎
在所有的表引擎中,最为核心的当属MergeTree系列表引擎,这些表引擎拥有最为强大的性能和最广泛的使用场合。对于非MergeTree系列的其他引擎而言,主要用...
Lansonli 2023-01-02466 0 0 -
大数据ClickHouse进阶(三):TTL深入了解
TTL即Time To Live ,表示数据存活的时间。在MergeTree中,可以为某个列字段或整张表设置TTL。当时间到达时,如果是列字段级别的TTL,则会...
Lansonli 2023-01-02446 0 0 -
大数据ClickHouse进阶(五):副本与分片
ClickHouse数据存储时支持副本和分片,副本指的就是一份数据可以在不同的节点上存储,这些节点上存储的每份数据相同,数据副本是增加数据存储冗余来防止数据丢失...
Lansonli 2023-01-02462 0 0 -
大数据ClickHouse进阶(四):ClickHouse的索引深入了解
在MergeTree中PRIMARY KEY 主键并不用于去重,而是用于索引,加快查询速度,MergeTree会根据index_granularity间隔(默认...
Lansonli 2023-01-02440 0 0 -
大数据ClickHouse进阶(六):Distributed引擎深入了解
Distributed引擎和Merge引擎类似,本身不存放数据,功能是在不同的server上把多张相同结构的物理表合并为一张逻辑表。
Lansonli 2023-01-02447 0 0 -
大数据ClickHouse进阶(七):ClickHouse 数据查询
可以从官网下载官网提供的数据集hits_v1和visits_v1,对应的下载路径为:
Lansonli 2023-01-02441 0 0 -
大数据ClickHouse进阶(九):ClickHouse的From和Sample子句
From子句表示从何处读取数据,支持2种形式,由于From比较简单,这里不再举例,2种使用方式如下:
Lansonli 2023-01-02434 0 0 -
大数据ClickHouse进阶(八):ClickHouse的with子句
可以访问select子句中的列字段,并调用函数做进一步处理,处理之后的数据可以在select子句中继续使用。
Lansonli 2023-01-02439 0 0 -
大数据调度平台Airflow(三):Airflow单机搭建
Airflow是基于Python的,就是Python中的一个包。安装要求Python3.6版本之上,Metadata DataBase支持PostgreSQL9...
Lansonli 2023-01-02442 0 0 -
大数据ClickHouse进阶(十):ClickHouse的Array Join子句
Array join 子句允许在数据表的内部,与数组类型的字段进行join操作,从而将一行数组展开为多行。
Lansonli 2023-01-02443 0 0