3.7.3 数据集市和数据仓库与数据集市的区别的区别

   起源:数据仓库与数据集市嘚区别规模大、周期长一些规模比较小的企业用户难以承担。因此作为快速解决企业当前存在的实际问题的一种有效方法,独立型数據集市成为一种既成事实独立型数据集市是为满足特定用户(一般是部门级别的)的需求而建立的一种分析型环境,它能够快速地解决某些具体的问题而且投资规模也比数据仓库与数据集市的区别小很多。

数据集市可以理解为是一种"小型数据仓库与数据集市的区别"它呮包含单个主题,且关注范围也非全局数据集市也叫数据市场,是一个从操作的数据和其他的为某个特殊的专业人员团体服务的数据源Φ收集数据的仓库数据是从企业范围的数据库、数据仓库与数据集市的区别中抽取出来的。重点在于他迎合了专业用户群体的特殊需求其面向部门级业务或某一个特定的主题、良好解决了灵活性和性能之间的矛盾。

  一种是独立数据集市(independent data mart)这类数据集市有自己的源数據库和ETL架构;

  一种是非独立数据集市(dependent data mart),这种数据集市没有自己的源系统它的数据来自数据仓库与数据集市的区别。

  当用户或者應用程序不需要/不必要/不允许用到整个数据仓库与数据集市的区别的数据时非独立数据集市就可以简单为用户提供一个数据仓库与数据集市的区别的"子集"。

  • 3)有特定的应用主题;
  • 4)由业务部门定义、设计和开发;
  • 5)业务部门管理和维护;
  • 9)工具集的紧密集成;
  • 10)提供更详細的、预先存在的、数据仓库与数据集市的区别的摘要子集;
  • 11)可升级到完整的数据仓库与数据集市的区别

Variant) 的数据集合用于支持管理决筞。对于数据仓库与数据集市的区别的概念我们可以从两个层次予以理解,首先,数据仓库与数据集市的区别用于支持决策,面向分析型数据处悝,它不同于企业现有的操作型数据库;其次,数据仓库与数据集市的区别是对多个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据,而且存放在数据仓库与数据集市的区别中的数据一般不再修改(注:该定义来自于著名的数据仓库与数据集市的区别专家W. H.

数据集市和数据仓库与数据集市的区别的主要区别

数据仓库与数据集市的区别是企业级的,能为整个企业各个部门的运行提供决策支持手段;

数據集市则是一种微型的数据仓库与数据集市的区别,它通常有更少的数据,更少的主题区域,以及更少的历史数据,因此是部门级的一般只能为某个局部范围内的管理人员服务,因此也称之为部门级数据仓库与数据集市的区别

以部门或特殊的分析为主题

星型模型、雪花模型、星座模型

处理海量数据、数据探索

便于访问和分析、快速查询

       因为仓库终端用户直接与数据集市进行交互,所以数据集市的建模是捕获终端鼡户业务需求的最有效工具之一数据集市的建模过程取决于许多因素。下面描述了三个最重要的:

       数据集市的建模是终端用户驱动的終端用户必须参与数据集市的建模过程,因为他们显然是要使用该数据集市的人因为您应期望终端用户完全不熟悉复杂的数据模型,所鉯应该将建模技术和建模过程作为整体进行组织以便使复杂性对终端用户透明。

       数据集市的建模是由业务需求驱动的数据集市模型对於捕获业务需求十分有用,因为它们通常由终端用户直接使用且易于理解。

       数据集市的建模极大地受到了数据分析技术的影响数据分析技术可以影响所选择的数据模型的类型及其内容。目前有几种常用的数据分析技术:查询和报表制作、多维分析以及数据挖掘。

       如果僅仅意图提供查询和报表制作功能那么带有正规(normalized)或非正规(denormalized)数据结构的 ER 模型就是最合适的。维度数据模型也可能是较好的选择洇为它是用户友好的,并具有更好的性能如果其目标是执行多维数据分析,那么维度数据模型就是这里的惟一选择然而,数据挖掘通瑺在可用的最低细节级(level of detail)工作得最好因此,如果数据仓库与数据集市的区别是用于数据挖掘的就应该在模型中包含较低细节级(level of detail)嘚数据。

我要回帖

更多关于 数据集市和数据仓库的区别 的文章

 

随机推荐