本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正
书名: | DW2.0:下一代数据仓库的构架[图书]|196487 |
图书定价: | 45元 |
图书作者: | (美)William H. Inmon;Derek Strauss;Genia Neushloss |
出版社: | 机械工业出版社 |
出版日期: | 2010/3/1 0:00:00 |
ISBN号: | 9787111288268 |
开本: | 16开 |
页数: | 218 |
版次: | 1-1 |
作者简介 |
W.H.Inmon:数据仓库之父。他已编写了49本著作,并被译成9种语言。Bill创建了世界上*个ETL软件公司。他在大多数主要的行业期刊上发表了1000多篇论文。除南极洲之外,Bill在各大洲都组织过研讨会并在各种会议上发言。他拥有九项软件专利。他*新成立的一个公司是Forest Rim Technology公司,该公司致力于非结构化数据的存取并将其整合到结构化环境中。每月有超过1 000 000人访问Bill的网站:inmoncif.com。他在beyenetwork.com上的每周通讯已经在业界被广泛阅读,每周有75 000个订阅者。Derek Strauss:Gavroshe公司的创始人、CEO和首席顾问。他拥有28年IT界从业经验和22年信息资源管理及商业智能/数据仓库领域的从业经验。Derek发起并管理了许多企业项目,他倡导运用商业智能、数据仓库来改善数据质量。Bill Inmon的CIF(Corporate Information Factory)理论及John Zachman的EAF(Enterprise Architecture Framework)理论是Derek的工作的基石。Derek同时也是一名专家研讨会主持人,他曾多次在国内及国际的数据仓库会议中演讲。另外,他还是DW2.0认证的构架师和培训师。Genia Neushloss:Gavroshe公司的联合创始人和首席顾问。30多年来,她在保险业、金融业、制造业、采矿业及电信业都拥有相当深厚的管理及技术经验。Genia曾举办JAD/JRP和系统再造培训课程,是系统再造方法集的编码开发者之一。她拥有22年规划、分析、设计和构建数据仓库的专业经验。Genia多次在欧洲、美国和非洲等与观众见面。另外,她也是DW2.0认证的构架师和培训师。 |
内容简介 |
本书是数据仓库和商业智能领域的又一部经典著作,讲述了整个生命周期各个环节的具体工作,从业务需求的视角,引导读者全面认识下一代数据仓库系统的构架。本书包含了DW20详细的定义和描述,此外,书中对数据仓库的结构、内容及其前景进行了介绍。 本书主要面向数据仓库的业务分析人员、信息构架师、系统开发人员、项目经理、数据仓库技术人员、数据库管理员、数据建模人员、数据管理员等。 |
目录 |
出版者的话 译者序 前言 关于作者 第1章数据仓库简史及*代数据仓库 1.1数据库管理系统 1.2在线应用 1.3个人电脑和4GL技术 1.4蜘蛛网环境 1.5企业角度的演化 1.6数据仓库环境 1.7什么是数据仓库 1.8整合数据——一个痛苦的经历 1.9数据的量 1.10一种不同的开发方法 1.11演变到DW2.0环境 1.12数据仓库的商业影响 1.13数据仓库环境的各种组件 1.13.1ETL——抽取/转换/装载 1.13.2ODS——操作数据存储 1.13.3数据集市 1.13.4探索仓库 1.14数据仓库的演变——从企业的角度 1.15关于数据仓库的其他观念 1.16主动数据仓库 1.17联合数据仓库方法 1.18星状模式方法 1.19数据集市数据仓库 1.20建立一个“真正的”数据仓库 1.21总结 第2章DW2.0简介 2.1DW2.0——一种新的范式 2.2DW2.0——从企业的角度 2.3数据的生命周期 2.4设置不同区的原因 2.5元数据 2.6数据访问 2.7结构化数据/非结构化数据 2.8文本分析 2.9“废话” 2.10术语问题 2.11特定文本/一般文本 2.12元数据——一个主要组成部分 2.13本地元数据 2.14基础技术 2.15不断变化的业务需求 2.16DW2.0中的数据流 2.17数据量 2.18实用应用程序 2.19DW2.0和参照完整性 2.20DW2.0的报告 2.21总结 第3章DW2.0组成部分——关于不同区 3.1交互区 3.2整合区 3.3近线区 3.4归档区 3.5非结构化处理 3.6企业用户的观点 3.7总结 第4章DW2.0中的元数据 4.1数据和分析的可复用性 4.2DW2.0中的元数据 4.3主动知识库/被动知识库 4.4主动知识库 4.5企业元数据 4.6元数据和记录系统 4.7分类 4.8内部分类/外部分类 4.9归档区元数据 4.10维护元数据 4.11举例说明如何使用元数据 4.12终端用户的观点 4.13总结 第5章DW2.0技术基础设施的流动性 5.1技术基础设施 5.2快速的业务改变 5.3环状改变 5.4打破循环 5.5缩短IT响应时间 5.6语义暂态、语义常态数据 5.7语义暂态数据 5.8语义稳定的数据 5.9混合语义稳定和不稳定数据 5.10分离语义稳定和不稳定数据 5.11减缓业务的改变 5.12创建数据快照 5.13历史记录 5.14数据划分 5.15终端用户的观点 5.16总结 第6章DW2.0的方法与途径 6.1螺旋式方法——主要特点综述 6.2七流法——总览 6.3企业参考模型流 6.4企业知识协调流 6.5信息工厂开发流 6.6数据归档定位流 6.7数据纠正流(旧称数据清理流) 6.8基础设施流 6.9整体信息质量管理流 6.10总结 第7章统计处理和DW2.0 7.1两种类型的处理 7.2使用统计分析 7.3比较的完整性 7.4启发式分析 7.5冻结的数据 7.6探索型处理 7.7分析频率 7.8探索工具 7.9探索型处理数据的来源 7.10更新探索数据 7.11基于项目的数据 7.12数据集市和探索工具 7.13数据回流 7.14在内部使用探索数据 7.15企业分析员的观点 7.16总结 第8章数据模型与DW2.0 8.1智能路线图 8.2数据模型和企业 8.3整合范围 8.4区别粒状型数据和概括型数据 8.5数据模型的层次 8.6数据模型和交互区 8.7企业数据模型 8.8模型转化 8.9数据模型和非结构化数据 8.10企业用户的观点 8.11总结 第9章监视DW2.0环境 9.1监视DW2.0环境 9.2事务监视 9.3数据质量监视 9.4数据仓库监视 9.5事务监视——响应时间 9.6高峰期处理 9.7ETL数据质量监视 9.8数据仓库监视工具 9.9休眠数据 9.10企业用户的观点 9.11总结 第10章DW2.0与安全 10.1保护访问数据 10.2加密技术 10.3缺点 10.4防火墙 10.5使数据脱机 10.6限制性加密 10.7直接转储 10.8数据仓库监视 10.9检测攻击 10.10近线区数据的安全 10.11企业用户的观点 10.12总结 第11章时间相关数据 11.1DW2.0中的所有数据——与时间相关 11.2交互区中的时间相关性 11.3DW2.0其他部分中的数据相关 11.4整合区中的事务处理 11.5离散数据 11.6连续时间段数据 11.7一个记录序列 11.8非重叠记录集 11.9开始和结束一个记录序列 11.10数据的连续性 11.11时间瓦解数据 11.12归档区中的时间相关变量 11.13企业用户的观点 11.14总结 第12章DW2.0的数据流 12.1贯穿整个构架的数据流 12.2进入交互区 12.3ETL的角色 12.4进入整合区的数据流 12.5进入近线区的数据流 12.6进入归档区的数据流 12.7下降的数据访问概率 12.8数据的异常流 12.9企业用户的观点 12.10总结 第13章ETL处理与DW2.0 13.1转换数据状态 13.2ETL适用范围 13.3应用数据到企业数据的转换 13.4ETL工作模式 13.5源和目标 13.6ETL映射 13.7状态转换——实例 13.8更加复杂的转换 13.9ETL与吞吐量 13.10ETL与元数据 13.11ETL与审核记录 13.12ETL与数据质量 13.13创建ETL 13.14代码创建或参数驱动的ETL 13.15ETL与丢弃 13.16变化数据的捕获 13.17ELT 13.18企业用户的观点 13.19总结 第14章DW2.0与粒度管理器 14.1粒度管理器 14.2提高粒度级别 14.3过滤数据 14.4粒度管理器的功能 14.5本地与第三方粒度管理器的比较 14.6粒度管理器的并行化 14.7作为副产品的元数据 14.8企业用户眼中的粒度管理器 14.9总结 第15章DW2.0和性能 15.1好的性能——DW2.0的基石 15.2在线响应时间 15.3分析响应时间 15.4数据的流动 15.5队列 15.6启发式处理 15.7分析的生产率和响应时间 15.8索引 15.9移除休眠数据 15.10终端用户培训 15.11监控环境 15.12容量规划 15.13元数据 15.14批处理的并行 15.15事务处理的并行 15.16工作负荷量的管理 15.17数据集市 15.18探索工具 15.19将事务分为不同的类 15.20服务标准协议 15.21保护交互区 15.22数据分割 15.23选择合适的硬件 15.24区分“农民”和“探索者” 15.25数据的物理分组 15.26检查自动产生的代码 15.27企业用户的观点 15.28总结 第16章迁移 16.1房屋和城市 16.2在一个完美情况中迁移 16.3完美情况几乎永远不会发生 16.4增量式添加组件 16.5添加归档区 16.6建立企业元数据 16.7建立元数据基础结构 16.8“吞没”源系统 16.9作为缓冲器的ETL 16.10迁移到非结构化的环境 16.11企业用户的观点 16.12总结 第17章成本验证和DW2.0 17.1DW2.0的成本值吗 17.2宏观层次的价值验证 17.3微观层次的价值验证 17.4公司B拥有DW2.0 17.5生**的分析 17.6按步骤执行 17.7总成本是多少 17.8考虑公司B 17.9考虑DW2.0的成本 17.10信息的现实情况 17.11DW2.0真正的经济效益 17.12信息的时间价值 17.13整合的价值 17.14历史信息 17.15*代DW和DW2.0——在经济效益上的比较 17.16企业用户的观点 17.17总结 第18章DW2.0中的数据质量 18.1DW2.0中的数据质量工具集 18.2数据分析工具和逆向工程数据模型 18.3数据模型种类 18.4数据分析不一致对自上而下建模的挑战 18.5总结 第19章DW2.0和非结构化数据 19.1DW2.0和非结构化数据 19.2文本读取 19.3在哪里进行文本分析处理 19.4文本整合 19.5简单编辑 19.6无用词 19.7同义词替换 19.8同义词串联 19.9同形异义解析 19.10建立主题 19.11外部术语表/分类法 19.12分词 19.13替换拼写 19.14跨语言的文本 19.15直接搜索 19.16间接搜索 19.17术语 19.18半结构化数据/值=名称数据 19.19准备数据所需的技术 19.20关系数据库 19.21结构化/非结构化连接 19.22企业用户的观点 19.23总结 第20章DW2.0与记录系统 20.1其他记录系统 20.2企业用户的观点 20.3总结 第21章多方面的话题 21.1数据集市 21.2数据集市带来的便利 21.3转换数据集市数据 21.4监视DW2.0 21.5在数据集市间移动数据 21.6不合格数据 21.7用以平衡的条目 21.8重新设置值 21.9数据修正 21.10数据移动的速度 21.11数据仓库工具 21.12总结 第22章DW2.0环境中的处理 第23章管理DW2.0环境 23.1数据模型 23.2构架管理 23.2.1确定什么时候需要归档区 23.2.2确定是否需要近线区 23.3元数据管理 23.4数据库管理 23.5数据管理 23.6系统和技术管理 23.7DW2.0环境管理人员的管理 23.7.1优化及优先冲突 23.7.2预算 23.7.3进度表和里程碑的确定 23.7.4资源分配 23.7.5管理咨询人员 23.8总结 |