-
湖仓一体电商项目(十六):业务实现之编写写入ODS层业务代码
由于本业务涉及到MySQL业务数据和用户日志数据,两类数据是分别采集存储在不同的Kafka Topic中的,所以这里写入ODS层代码由两个代码组成。
Lansonli 2023-01-02445 0 0 -
湖仓一体电商项目(二十二):实时任务执行流程
这里默认HDFS、Hive、HBase、Kafka环境已经准备,启动maxwell组件监控mysql业务库数据:
Lansonli 2023-01-02448 0 0 -
大数据架构系列:Apache Kylin 4.0
身处于大数据时代,即使我们使用的大规模并发对数据进行查询,由于数据量的原因,用户想快速的对数据进行分析还是较为困难的;预计算是其中一个比较直观的解决方案,提前将...
jhonye 2023-01-02481 0 0 -
Flink CDC 新一代数据集成框架
主要讲解了技术原理,入门与生产实践,主要功能:全增量一体化数据集成、实时数据入库入仓、最详细的教程。Flink CDC 是Apache Flink的一个重要组件...
小马哥学JAVA 2023-01-02454 0 0 -
【腾讯云ES】Elasticsearch 分布式架构剖析及扩展性优化
Elasticsearch 是一个实时的分布式搜索分析引擎,简称 ES。一个集群由多个节点组成,节点的角色可以根据用户的使用场景自由配置,集群可以以节点为单位自...
黄华 2023-01-02456 0 0 -
【腾讯云ES】ElasticSearch在微信支付金融领域实践
用户通过微信支付完成交易,商户通过微信支付完成收款后,可能会出于不同目的来查看此前的交易记录,并且查询条件可能会有很大的差异;为了能够满足这里的功能需求,目前选...
HaveTryTwo 2023-01-02446 0 0 -
Flink入门——DataSet Api编程指南
Apache Flink 是一个兼顾高吞吐、低延迟、高性能的分布式处理框架。在实时计算崛起的今天,Flink正在飞速发展。由于性能的优势和兼顾批处理,流处理的特...
小马哥学JAVA 2023-01-02455 0 0 -
大数据面试题(一):HDFS核心高频面试题
1)客户端向namenode请求上传文件,namenode检查目标文件是否已存在,父目录是否存在。
Lansonli 2023-01-02438 0 0 -
大数据面试题(二):Hadoop的联邦机制核心高频面试题
采用多台NN组成联邦。NN是独立的,NN之间不需要相互调用。NN是联合的,同属于一个联邦,所管理的DN作为block的公共存储。
Lansonli 2023-01-02442 0 0 -
Flink CDC 新一代数据集成框架
主要讲解了技术原理,入门与生产实践,主要功能:全增量一体化数据集成、实时数据入库入仓、最详细的教程。Flink CDC 是Apache Flink的一个重要组件...
小马哥学JAVA 2023-01-02453 0 0