
MaxCompute SQL 调优之 Join Hint
在 MaxCompute SQL 中处理大数据量表时,数据倾斜是一个常见的性能瓶颈。当两张大表进行 JOIN 操作时,如果关联键分布不均,某些节点可能会承担过多的数据处理任务,导致任务执行效率低下。为了解决这一问题,需要从 JOIN 键的选择、技术手段的...
在 MaxCompute SQL 中处理大数据量表时,数据倾斜是一个常见的性能瓶颈。当两张大表进行 JOIN 操作时,如果...

数仓拉链表原理、设计以及在 ODPS 中的实现
数据仓库拉链表是一种特殊的表结构,用于记录数据的历史变化、支持数据版本管理、提供数据追溯功能。其中,数据版本管理是数据仓库拉链表的一个关键功能。数据版本管理使得每一条记录都带有其生效和失效的时间戳,这样可以追踪到每条记录在某个时间点的状态。通过这种方式,...
数据仓库拉链表是一种特殊的表结构,用于记录数据的历史变化、支持数据版本管理、提供数据追溯功能。其中,数据版本管理是数据仓库...

数据仓库一致性维度和一致性事实
在 Kimball 的维度建模的数据仓库中,关于多维体系结构(MD)有三个关键性概念: 总线架构(Bus Architecture), 一致性维度(Conformed Dimension) , 一致性事实(Conformed Fact) 。
在 Kimball 的维度建模的数据仓库中,关于多维体系结构(MD)有三个关键性概念: 总线架构(Bus Architec...

数据仓库模型中的度量
在数据仓库模型中,度量是指用于分析的数值数据、通常与业务相关、可以进行聚合计算、帮助量化业务绩效。在数据仓库中,度量是关键的组成部分,因为它提供了对业务活动的量化描述。例如,在销售数据分析中,销售金额、销售数量和折扣就是常见的度量。
在数据仓库模型中,度量是指用于分析的数值数据、通常与业务相关、可以进行聚合计算、帮助量化业务绩效。在数据仓库中,度量是关键...

数仓建模的本质是什么
所谓的数据仓库建模,听着很高大,我们要透过现象看本质。其实本质就是解决如何管理组织企业中的数据,并将其用于业务用户的决策制定过程中的方法体系;从企业来说就是数据如何更好地商业智能(BI),从技术角度来说就是如何合理化管理企业数据的存储和计算。
所谓的数据仓库建模,听着很高大,我们要透过现象看本质。其实本质就是解决如何管理组织企业中的数据,并将其用于业务用户的决策制...
- Django Web 开发 4
- Oracle 数据库开发 9
- Oracle 性能优化 12
- Python 基础知识 8
- 开发工具配置 5
- Oracle 数据库管理 2
- Oracle 索引技术 2
- Python 数据分析 6
- Hive 1
- DataWorks/MaxCompute 16
- MySQL 5
- Greenplum/AnalyticDB 8
- PyODPS 3
- 数据湖仓 10