`
adamed
  • 浏览: 181472 次
社区版块
存档分类
最新评论

《数据仓库》读书笔记 4

阅读更多
今天开始读数据仓库的第四章,这一章讲解的是数据仓库中的粒度。
下面是本章的小结:
为体系结构化环境选择一个适当的粒度级别是成功的关键。选择粒度级别的一般方法是利用常识。首先建立数据仓库的一小部分,并让用户访问这些数据。然后仔细聆听用户的意见,根据他们的反馈意见对粒度级别做适当的调整。

最坏的想法是想要实现设计好所有的粒度级别,再进行数据仓库的建造。即使是在最好的情况下,有50%的设计是正确的,这个设计就已经成功了。数据仓库环境的特点就是只有当DSS分析员看到了报表之后,才能想象出哪些是他们需要的。

粒度设计的过程始于对数据仓库在一年时间和五年时间内所能达到的大小的一个粗略估测。一旦这个估测完成后,设计者就可以得知粒度应该细到什么程度。此外,利用这个估测还可以得出是否需要考虑使用溢出存储器。

数据仓库环境中有一个非常重要的反馈循环。建造数据仓库的第一次循环设计完成后,数据体系结构设计人员认真聆听最终用户反馈的意见,并根据这些意见作出调整。

要考虑的另一个重要问题是需要从数据仓库中获取数据的不同体系结构实体说需的粒度级别。当数据转移到溢出存储器,当存在大量的数据时,设计人员对粒度级别的选择会受到约束。

要使溢出存储器正常工作,有两种软件是必须的:管理硬盘环境与海量备用存储环境之间数据流动的跨介质存储管理器和数据活动监控器。数据活动监控器用来确定哪些数据应当放到溢出存储器中和哪些应当留在硬盘上。
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics