哪位大神能解释一下数据仓库 时间维度维度表的类型么

&&&&数据仓库维度表更新技术分析
数据仓库维度表更新技术分析
要想在百度八亿网页的数据海洋中找到你所要的信息,
人工方式需要1200 多人年,而百度搜索技术不到1 秒钟。人
们被数据淹没,却渴望知识。商务智能技术已成为当今企业
获取竞争优势的源泉之一。商务智能通常被理解为将企业中
现有的数据转化为知识,帮助企业做出明智决策的IT工具集。
其中数据仓库、OLAP和数据挖掘技术是商务智能的重要组成
部分。商务智能的关键在于如何从众多来自不同企业运作系
统的数据中,提取有用数据,进行清理以保证数据的正确性,
然后经过抽取、转换、装载合并到一个企业级的数据仓库里,
从而得到企业数据的一个全局视图,并在此基础上利用适当
的查询分析、数据挖掘、OLAP等技术工具对其进行分析处理,
最终将知识呈现给管理者,为管理者的决策过程提供支持。
可见,数据仓库技术是商业智能系统的基础,在智能系统开
发过程中,星型模式设计又是数据仓库设计的基本概念之一。
星型模式是由位于中央的事实表和环绕在四周的维度表
组成的,事实表中的每一行与每个维度表的多行建立关系,
查询结果是通过将一个或者多个维度表与事实表结合之后产
生的,因此每一个维度表和事实表都有一个“一对多”的连
接关系,维度表的主键是事实表中的外键。随着企业交易量
的越来越多,星型模式中的事实表数据记录行数会不断增加,
而且交易数据一旦生成历史是不能改变的,即便不得不变动,
如对发现以前的错误数字做修改,这些修改后的数据也会作
为一行新纪录添加到事实表中。与事实表总是不断增加记录
的行数不同,维度表的变化不仅是增加记录的行数,而且据
需求不同维度表属性本身也会发生变化。本文着重讨论数据
仓库维度表的变化类型及其更新技术。
嵌到我的页面
<input type="text" readonly="true" value="">
若举报审核通过,可奖励20下载分
被举报人:
xzq2001888
举报的资源分:
请选择类型
资源无法下载
资源无法使用
标题与实际内容不符
含有危害国家安全内容
含有反动色情等内容
含广告内容
版权问题,侵犯个人或公司的版权
*详细原因:
VIP下载&&免积分60元/年(1200次)
您可能还需要
开发技术下载排行ssis中如何向数据仓库的时间维度表中添加数据
ssis中如何向数据仓库的时间维度表中添加数据
发布时间: 5:05:17
编辑:www.fx114.net
本篇文章主要介绍了"ssis中如何向数据仓库的时间维度表中添加数据",主要涉及到ssis中如何向数据仓库的时间维度表中添加数据方面的内容,对于ssis中如何向数据仓库的时间维度表中添加数据感兴趣的同学可以参考一下。
控制流中的&execute&sql&task&控件
本文标题:
本页链接:微信搜索bigdata029 | 邀请体验:
| 赞助作者:
之前介绍过的《一站式用户自助数据接入与分析平台》,经过4人/月的开发,现V1.0版本上线,供公司内部用户使用。
V1.0版本前端基于Caravel改造,查询模型数据使用的OLAP引擎有三种:Kylin、Hive+SparkSQL以及MySQL;
其中,对于事实表数据量非常小(&l...
4个月前 (10-11)
关键字:互联网、大数据、数据仓库、数据平台、架构
多维分析OLAP
Ad-Hoc查询
数据可视化
上次写的《大数据环境下互联网行业数据仓库/数据平台的架构之漫谈》一文,已是一年前的事了,经过一年的沉淀与公司业务的发展,...
6个月前 (07-21)
一站式用户自助数据接入与分析平台,也可以当做一个提供大数据分析服务的云平台,用户可以基于平台数据仓库中已有的事实表和维度表(有访问权限),自助建立分析模型,进行OLAP分析与可视化;也可以将自己的数据接入到平台,在已接入的数据上自助建立分析模型,进行OLAP分析与可视化。对于前者...
7个月前 (07-13)
Apache Kylin,很好的解决了海量数据OLAP的底层存储与分析引擎,但还缺一个数据可视化工具,可以使用户非常方便的通过图形化分析探索海量数据,而不用写SQL。于是我们发现了Caravel。
原生的Caravel并不支持Kylin,也不支持多表关联,经过好友Rocky和我的...
7个月前 (06-20)
关键词:caravel、olap、kylin、数据可视化
Caravel(曾用名Panoramix),是由知名在线房屋短租公司Airbnb开源的一款数据探索与可视化工具,该工具在可视化、易用性和交互性上非常有特色,用户可以轻松对数据进行可视化分析。官网地址为: http://ai...
8个月前 (06-06)
本文作者:李栋,来自Kyligence公司,也是Apache Kylin Committer & PMC member,在加入Kyligence之前曾就职于eBay、微软。
1.Apache Kylin是什么?
在现在的大数据时代,越来越多的企...
8个月前 (05-26)
前面介绍了将Saiku和Kylin结合起来做OLAP多维分析,Saiku也支持多种其他数据源,如MySQL,JDBC等,本文介绍将Saiku和Hive结合起来使用的方法,并解决期间遇到的问题。
注:Saiku社区版(Saiku CE)的下载地址为:
http://communit...
9个月前 (05-13)
Cube是一种典型的多维数据分析技术,一个Cube可以有多个事实表,多个维表构成。如果您还不了解这些概念,建议您搜索下数据仓库、OLAP、Cube、星型模型、事实表、维度表等等。比如一个简单例子,分析网站流量的Cube,包含一个事实表和四个维度表:
事实表可能有以下字段:
9个月前 (05-12)
关于Kylin的介绍和使用请参考之前的文章
《分布式大数据多维分析(OLAP)引擎Apache Kylin安装配置及使用示例》
Kylin对外提供的是SQL查询接口,基于Kylin构建OLAP多维分析系统,第一种方案是针对业务,定制开发一个前端界面,将界面上用户的选择和操作,翻译...
9个月前 (05-03)
关键字:olap、Kylin
Apache Kylin是一个开源的分布式分析引擎,提供Hadoop之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由eBay 开发并贡献至开源社区。它能在亚秒内查询巨大的Hive表。
Kylin OLAP引擎基础框架,包括元...
9个月前 (04-27)
从「数据仓库」一词到现在的「大数据」,中间经历了太多的知识、架构模式的演进与变革。数据平台这25年究竟是怎样进化的?让InfoQ特约老司机为你讲解。
我是从2000年开始接触数据仓库,大约08年开始进入互联网行业。很多从传统企业数据平台转到互联网同学是否有感觉:非互联网企业、互联...
10个月前 (03-23)
关键字:大数据平台、机器学习
贝贝网的主要产品是垂直的母婴类,母婴相对一般的电子商务网站有一些特点:第一个特点是商品周期短,在母婴网站上的商品,在线的时间不会超过5-7天,第二个是用户需求的变化快,在母婴行业,可能是用户的需求变化最快的领域,比如是用户处在怀孕当中,关心的是孕妈的...
12个月前 (02-16)
关键字:spark、mllib、Gradient-Boosted Trees、广告点击预测
本文尝试使用Spark提供的机器学习算法 Gradient-Boosted Trees来预测一个用户是否会点击广告。
训练和测试数据使用Kaggle Avazu CTR 比赛的样例数据,下...
关键字:数据仓库、极限存储、历史拉链表、更新
在之前介绍过数据仓库中的历史拉链表《数据仓库数据模型之:极限存储–历史拉链表》,
使用这种方式即可以记录历史,而且最大程度的节省存储。这里简单介绍一下这种历史拉链表的更新方法。
本文中假设:
数据仓库中订单历史表的刷新频率为一天,当...
关键字:互联网、大数据、数据仓库、数据平台、架构
数据存储与分析
任务调度与监控
元数据管理
一直想整理一下这块内容,既然是漫谈,就想起什么说什么吧。我一直是在互联网行业,就以互联网行业来说。
先大概列一下互联网...数据仓库的事实表分类
三种基本事实表,并说明ETL的过程中如何处理它们。
答:事实表从粒度的角色来划分可以分为三类,分别是交易粒度事实表(Transaction Grain)、周期快照粒度事实表(Periodic Snapshot)和累计快照粒度事实表(Accumulating
Snapshot)。在事实表的设计时,一定要注意一个事实表只能有一个粒度,不能将不同粒度的事实建立在同一张事实表中。
交易粒度事实表的来源伴随交易事件成生的数据,例如销售单。在ETL过程中,以原子粒度直接进行迁移。
周期快照事实表是用来记录有规律的,固定时间间隔的业务累计数据,例如库存日快照。在ETL过程中,以固定的时间间隔生成累计数据。
累积快照事实表用来记录具有时间跨度的业务处理过程的整个过程的信息。在ETL过程中,随着业务处理过程的步骤逐步完善该表中的记录。
已投稿到:
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

我要回帖

更多关于 结构性维度 名词解释 的文章

 

随机推荐