自我接触数仓以来,数仓建模就是最为核心的工作,而数仓建模的主要目的是建立公共层,但在长期的数仓公共层运营实践中中,我发现公共层的表现不总是沿着我们设想的轨迹演进。......
2022-08-15 关键字:超大规模数据仓库平台供应商Ocient发布了一份新的报告《超越大数据:超大规模数据的崛起》。该报告发现,85%的C级领导认为其组织的财务成功与更快的数据分析之间有着密切关系。......
2022-08-12 关键字:很多同学跟我一样,对于数据湖充满好奇,也许还读了不少数据湖文章,有不觉明历的,也有认为是概念炒作的,但无论别人怎么说,你还是会觉得难以把握数据湖的本质。......
2022-08-02 关键字:从字面意义上讲就是宽表就是字段比较多的数据库表,多应用于DWD层或报表应用层,将很多维度、事实、指标等关联汇总成一张数据表。区别于DWS层,宽表往往是跨主题的,且字段较多(宽表之宽),所以非常适合用来......
2022-07-14 关键字:虽然添加类别和子类别作为规范化工作可能是有意义的,但额外的关系层通常会混淆数据库优化器,从而导致查询执行时间大大降低。所以请避免snowflaking。......
2022-06-30 关键字:有读者问了一个问题:“公司集群机器下线,数据仓库如何应对资源不足,导致核心任务一直延迟的问题?” 这种故障很常见,今天就来讲讲一般的解决套路,一共9招,按着顺序去做吧。......
2022-06-27 关键字: