作 者:王雪迎 著 定 價:89 齣 版 社:清華大學齣版社 齣版日期:2017年07月01日 頁 數:434 裝 幀:平裝 ISBN:9787302469803 ●第1章 數據倉庫簡介
●1.1 什麼是數據倉庫 1
●1.1.1 數據倉庫的定義 1
●1.1.2 建立數據倉庫的原因 3
●1.2 操作型係統與分析型係統 5
●1.2.1 操作型係統 5
●1.2.2 分析型係統 8
●1.2.3 操作型係統和分析型係統對比 9
●1.3 數據倉庫架構 10
●1.3.1 基本架構 10
●1.3.2 主要數據倉庫架構 12
●1.3.3 操作數據存儲 16
●1.4 抽取-轉換-裝載 17
●1.4.1 數據抽取 17
●1.4.2 數據轉換 19
●1.4.3 數據裝載 20
●1.4.4 開發ETL係統的方法 21
●1.4.5 常見ETL工具 21
●1.5 數據倉庫需求 22
●1.5.1 基本需求 22
●部分目錄
內容簡介
本書講述在流行的大數據分布式存儲和計算平颱Hadoop上設計實現數據倉庫,將傳統數據倉庫建模與SQL開發的簡單性與大數據技術相結閤,快速、高效地建立可擴展的數據倉庫及其應用係統。
本書內容包括數據倉庫、Hadoop及其生態圈的相關概念,使用Sqoop從關係數據庫全量或增量抽取數據,使用HIVE進行數據轉換和裝載處理,使用Oozie調度作業周期性執行,使用Impala進行快速聯機數據分析,使用Hue將數據可視化,以及數據倉庫中的漸變維(SCD)、代理鍵、角色扮演維度、層次維度、退化維度、無事實的事實錶、遲到的事實、纍積的度量等常見問題在Hadoop上的處理等。
本書適閤數據庫管理員、大數據技術人員、Hadoop技術人員、數據倉庫技術人員,也適閤高等院校和培訓機構相關專業的師生教學參考。 王雪迎 著 王雪迎,畢業於中國地質大學計算機專業,不錯工程師,擁有20年數據庫、數據倉庫相關技術經驗。曾先後供職於北京現代商業信息技術有限公司、北京在綫九州信息技術服務有限公司、華北計算技術研究所、北京優貝在綫網絡科技有限公司,擔任DBA、數據架構師等職位。
Hadoop構建數據倉庫實踐 下載 mobi epub pdf txt 電子書