|
|
Sybase的商业智能解决方案广告 Sybase的商业智能解决方案
Sybase数据仓库概述 ● 设计组件。用于协助数据建模人员和系统设计人员建立信息架构。 ● 管理组件。用于协助元数据管理人员和数据管理人员,在系统运行的过程中对信息试题的全部演变历史进行控制、同步、记录和存档。 ● 数据管理组件。为用户提供一种分布式的或集中式的数据管理环境,以便于对数据实施有效的访问和高效率的交互式分析。 ● 转换组件。用于协助应用开发人员在收集数据仓库中的各种信息时进行必要的集成与转换。 ● 可视化组件。帮助用户浏览数据仓库中的内容,订阅所需要的数据并对信息资源实施正确的分析。 利用上述工具组件,Sybase还推出了行业数据仓库解决方案。该方案在数据模型、元数据和工具方面都是开放的,全面支持Sybase、Oracle、Microsoft、Informix和IBM的关系数据库管理系统。另外,行业数据仓库解决方案 还拥有数据仓库可任选的ETL(抽取/转换/加载)功能和高速大量数据存储功能。它的核心是一组集成化的商业智能一股脑用,内容涉及商业活动分析、客户忠诚性分析、销售分析、客户关注分析、商业行为分析以及收益性分析等。支撑这些商业智能应用的是一组集成化的逻辑数据模型与物理数据模型。这些模型是从关键性业务功能中归纳和提炼出来的,其内容涉及到促销与活动、客户关系、客户联络、销售以及赢利等。 Warehouse Studio的组件成员 1.Warehouse Architect。为了能够使用最通用的关系数据库和多维数据库的设计方法建立数据仓库模型,Sybase专门开发了数据仓库设计工具Warehouse Architect。这个工具为设计人员建立了一个非常友好而单一的环境,能让数据建模人员和系统设计人员很方便地处理数据仓库设计中特殊的应用需求。Warehouse Architect为数据仓库的设计提供了三大类功能,即: ● 多维建模: 在WarehouseArchitect 环境中,设计人员可以使用针对数据仓库问题的所有常用的设计方法,可以获得处置数据多维特性的功能支持。在这个环境中,可以使用自顶向下的建模方法或者是使用自底向上的建模方法获得各种设计。 ● 设计向导: WarehouseArchitect所提供的设计向导,可以帮助设计人员生成数据的多维层系结构、可以为聚合、分割 、导入处理而优化的数据结构,还可以用逆向工程的方法获得源数据的结构。 ● 优化代码的生成: Warehouse Architect 能够生成最流行的目标数据仓库和应用环境的目录信息所需要的代码,对不同的环境所生成的代码自然也不同,包括:最为流行的关系数据库环境(Sybase,Oracle,Informix,DB2等)、特定的查询处理引擎(Adaptive Server IQ , Red Brick)、在线分析处理(OLAP)环境 ( PowerDimensions、Arbor EssBase、Oracle Express以及Cognos PowerPlay )及特定的查询环境(Cognos 公司的Cognos Impromptu 等)。 除此而外,WarehouseArchitect 还提供了一批相当通用的设计功能,包括:业务规则的定义与捕获、可定制的报告生成、逻辑建模与物理建模、域的定义、子模型复用、实体继承模式、物理特性的定义与规模估算、可追踪性映射以及组模型 (team model)管理工具。 总之,借助于Warehouse Architect,数据建模人员能够快速有效地设计出一种优化的和完备的数据仓库结构,一种集管理、集成和可视化功能组件于一体的数据仓库结构。 2.Warehouse Control Center。无论要建立数据仓库还是数据集市,总的目的都是帮助用户更好和更有根据地做出决策。在数据仓库的建设中,将数据加载到数据仓库只是完成了整个工作的很小的一部分。因此,Sybase特意提供了Warehouse Control Center。通过对元数据的运用和管理,Warehouse Control Center在信息系统与数据仓库的用户间架起了一座桥梁。 元数据是指“关于数据的数据”,是数据仓库环境中的关键部分,它决定了数据仓库信息的设计方式和构造方式。元数据还确定了外部源数据与数据仓库模型之间的对应以及当初抽取/聚合源数据时所用的算法。 Warehouse Control Center诞生于Sybase在很多大型机构中实施数据仓库的具体实践,是实践经验的结晶。Sybase清楚地看到,在数据仓库建成并投入运行后,管理方面仍然面临巨大的挑战。因此,我们在Warehouse Control Center中提供了一系列工具,这些工具在对数据仓库中的元数据进行捕获、同步和控制方面的功能是独一无二的。Warehouse Control Center为设计者提供了以下功能: * 记录并追踪设计活动. Warehouse Control Center对元数据的管理采取全程追踪的策略,管理的起点是数据源处曾使用过的工具,包括逻辑设计工具抽取/转换工具和企业信息库。同时,Warehouse Control Center还保证元数据在历经各种有关工具(前端查询工具、分析工具、报告工具以及OLAP工具等)处理时的一致性。通过对元数据处理全过程的追踪,Warehouse Control Center能够提供由数据仓库所管理的所有实体的完整历史资料。 * 浏览与订购服务. Warehouse Control Center向用户提供直观的信息目录,通过这类目录用户可以浏览和搜索他所需要的内容并确定它们在数据仓库或数据集市中的位置。用户可以在浏览时通过订购服务而取得自己所需要的数据。订购活动由IT人员来管理,系统经由各种前端查询与分析工具提交用户所需要的信息与服务。 * 根据业务需要正确运用IT技术. Warehouse Control Center 使用户能够很容易利用和访问整个企业的数据仓库环境。对于数据集市中的数据,既可以用适合于业务人员的方式去访问,亦可以用适合于IT人员的方式去访问。用户可以按自己之所需,在访问中选择不同的详略程度。利用系统所提供的搜索功能,用户可以在数据仓库的元数据中找到所指定内容的全部出处。在Warehouse Control Center中,用户可以订购信息与服务,但IT的专业支持人员可以同意订购也可以拒绝订购。因此,最好的方法是按照自己的需要扩展数据仓库,将主动权牢牢掌握在自己手里。 由Warehouse Control Center所建立和维护的元数据信息库,是将技术人员和业务人员连接起来的关键。Warehouse Studio 所包含的每一个组件(设计组件、集成组件、管理组件等)都能够将对企业具有战略意义的元数据收集到这个元数据信息库中,业务人员则可以利用Warehouse Control Center所提供的浏览器,订购数据仓库中已有的或者新的信息与服务。这类订购活动也可用于将用户所需的有关仓库数据的信息交由Warehouse Studio的可视化工具或者Warehouse Control Center的合作者的产品去处理,从而使用户的查询活动可以多渠道进行。 Warehouse Control Center使来自设计组件、源数据结构、集成组件和目标数据结构的所有元数据保持一致。用户可以通过浏览这个一体化的元数据信息库,利用很多常用的分析工具以可视化的方式从数据仓库中取得所需的信息与服务。 Warehouse Control Center通过无缝地集成和维护能够快速生成用户驱动的数据集市的元数据,帮助企业最终建成用户驱动的数据仓库。Warehouse Control Center 最初是力图以多种方式帮助企业建立数据仓库而设计的,包括简化管理数据仓库的过程,从集中的数据仓库向数据集市传送数据,或者将多个数据集市的数据整合到数据仓库中来等等。 今天,无论是商业环境的变化还是技术环境的变化,都给企业带来很大的压力。Warehouse Control Center 通过让企业快速适应这类变化而保持在市场上的竞争优势。在向企业提供解决方案时,灵活性、功能、效率和代价都是要考虑的因素,但最终目标则是运用信息取得竞争优势。 在数据仓库运行的整个过程中,保持元数据的精确和一致,才能保证提供给用户的是高质量的和可以信赖的数据。另外,Warehouse Control Center的很多自动化特性,使数据仓库管理员能够将精力更多地集中到为用户产生能够满足后续需要的新的信息形式上。 在可选的组件中,Adaptive Server IQ起着非常重要的作用。为了支持数据仓库应用中大量交互式的和无定型的查询处理的需要,Sybase特意设计了数据仓库的存储和管理系统Adaptive Server IQ。在IQ的支持下,用户在查询时有极大的灵活性。用户可以提任何问题,可以针对任何数据提问题,可以在任何时间提问题。无论提的是什么问题,都能快速得到回答。Adaptive Server IQ 是数据管理领域和传统数据管理技术中各种创新技术(其中很多是Sybase具有专利权的技术)的集中体现,它所提交的DBMS对于用户日常的业务运作没有任何妨碍。Adaptive Server IQ 突破了传统技术的很多限制,为在多用户环境下的交互式分析提供了统一而高效的支持功能: * 纵向划分:Adaptive Server IQ 是按列而不是按行存储和访问数据的。大多数决策支持查询所访问的是相对少量的列,但要跨越大量的行。因此按列查询就消除了很多不必要的I/O操作。在这种处理方式下,最坏的情况是需要Adaptive Server IQ扫描整个列的内容。相对而言,传统数据库系统则需要作整个表的扫描。 * 压缩: 比较而言,列比行易于压缩,因为列具有相同的数据类型,而每个行不仅有多个不同的数据类型而且其中还包含列之间的分隔成分。按照Adaptive Server IQ 的存储方式,对同一批行数据,实际在硬盘上占用的空间只是传统存储方法所占空间的40%到50%,这样既大幅度减少了对存储空间的占用,又减少了查询处理中所需的I/O操作。 * 操作系统级的并行化处理:对于诸如排序、位映射处理以及I/O等操作, Adaptive Server IQ将其分解为可由操作系统独立调度和处置的一些操作。这样,在数据和/或用户增加时,系统就具备了很强的伸缩能力。另外,为了更充分地利用可以得到的处理机资源,在加载数据或补充数据时,Adaptive Server IQ进一步对加载过程实施并行处理。 * 对企业级异构环境的支持: Adaptive Server IQ提供了支持企业环境最需要的功能与技术,其中包括JAVA存储过程以及对一批常用的数据管理工具与集成工具(包括DB2、Informix、Microsoft、Oracle、Teradata 、AS/400、VSAM 等)的支持。Adaptive Server IQ还使企业在处理能力上拥有极大的伸缩性,它能够同时支持从几百到几千个并发用户,一个表所拥有的行数可以高达281 万亿行,一个表所拥有的列数可以高达16000个,可以支持总容量达128 TB的超大数据库(VLDB)。 * 预连接和即兴式随机连接: Adaptive Server IQ容许设计者在处理中充分利用表之间已知的连接关系,为此只需在相关的表之间预先定义好这类连接并建立索引即可。有这些连接索引,即可减少查询时所需的处理的总量。连接索引加上在查询执行中动态选择的各种连接算法,即可大幅度改善即兴式表连接的效率。 * DSS查询处理器: 这是一个查询处理的智能软件,它可以根据对每个查询的分析,选择最适合的存取方法与算法。Adaptive Server IQ能很有效地对决策支持分析中大量典型而复杂的查询进行处理。因此,使用Adaptive Server IQ时,已无须数据库管理员进行人工干预,或优化查询的执行过程,他们可以将精力放到更重要的事情上去。 * 多丛结构 : Adaptive Server IQ可以将多个NT节点和UNIX节点组织在一个应用系统中,它所提供的伸缩性和所花的代价只是海量并行处理机系统(MPP)或者其他查询方法的若干分之一。还有,具有多丛结构的Adaptive Server 能够同时支持数千个用户,这是任何其他关系数据库系统都难以做到的事。 通过Adaptive Server IQ,Sybase提交了特意为满足交互式决策支持系统要求而建立的数据管理环境。用户可以从这个标准的、基于SQL的技术中,获得以下好处: * 高效而代价合理:将所需处理的数据结构减少到只及常规数据库所需处理量的20%左右,从而减少了硬盘开销。 * 快速反应: I/O操作的大规模减少,消除了大多数决策支持查询处理中固有的瓶颈问题,同时提供了快速反应能力。针对Adaptive Server IQ的数据结构而优化的各种数据处理操作,能够充分利用硬件方面的很多已有成果,包括快速处理机、大内存高速缓冲区以及多处理机体系结构的最新成果。 * 快速反应查询灵活:存取方法只与数据有关而与查询无关,因此正确的数据结构在数据加载时就能够预期得到。因此,数据仓库的用户可以随心所欲地提出查询要求而无须数据库管理员作任何干预。能够以增量方式对任何数据结构加载数据,而无须对这些结构重新建立或重新组织。这样就能确保快速地访问当前信息和实施快速而有效的加载与更新处理。 除上述组件外,该数据仓库解决方案还含有许多其它可选组件,包括数据管理软件和分析软件等。这些组件可进一步完善Warehouse Studio的功能。 Warehouse Studio的应用
如果您希望与本文章的作者或其所在机构,进一步交流,请联系:畅享网 姜小姐 jill.jiang@amteam.org | 021-51096826-102 | 在线联系 |
|
|
|