發表於2024-12-27
一本書讀懂大數據 pdf epub mobi txt 電子書 下載
缺少數據資源無以談未來,缺少數據資源無以言發展。大數據無處不在。今天,掌握大數據已經成為提升企業競爭優勢的必要條件。得數據者得天下,知己知彼纔能為企業和個人的發展提供關鍵製勝點。撥雲見日,把高深的大數據原理簡單說,讓每個人都能讀懂大數據,會用大數據。從什麼是大數據到大數據在當今生活工作的作用以及如何使用大數據來幫助自己更簡便的獲取有效信息本書都有詳細說明。
我們生活在社會中,就不得不同數據打交道。我們也是數據的一部分,不論我們想不想與大數據牽扯到一起,數據都會找到我們,覆蓋我們。大數據時代已經來臨,如何從海量數據中發現知識,尋找隱藏在大數據中的模式、趨勢和相關性,揭示社會現象與社會發展規律,以及可能的商業應用前景,都需要我們擁有更好的數據洞察力。
進入大數據時代,讓數據開口說話將成為司空見慣的事情,《一本書讀懂大數據》將從大數據時代的前因後果講起,全麵分析大數據時代的特徵、企業實踐的案例、大數據的發展方嚮、未來的機遇和挑戰等內容,展現一個客觀立體、自由開放的大數據時代。
黃穎,自由撰稿人,某互聯網公司大數據開發部負責人。
第一章 身處數據時代,揭開大數據的麵紗
大數據到底是什麼?
“大”是重點,還是“數據”是重點?
與眾不同的大數據
大數據方式下的雲計算
大數據的奧秘
當下是大數據發展的最佳時機
第二章 大數據如此重要,引無數英雄競摺腰
多樣的非結構性數據
大數據的價值發掘
大數據的結構化、非結構化、半結構化及多結構化
大數據是擴展性的下一代傳統數據
是什麼構成瞭大數據價值鏈?
大數據時代真的來瞭
第三章 求挖掘與分析,電子商務與大數據
大數據時代中的電子商務
亞馬遜在大數據時代的實踐
小米手機在大數據時代的實踐
小米手機對“米粉”需求的文化挖掘
阿裏巴巴數據化運營的那些“大招”
大數據中的企業價值及客戶價值
第四章 數據和企業管理,高層更看重大數據
沃爾瑪如何用數據構建管理模式
讓大數據進入企業管理
職業乞丐腦袋裏的大數據
職業經理人與大數據
企業組織管理不介入大數據,就要被淘汰
第五章 生活無處不數據,大數據真的能算命?
未來的先兆——大數據
大數據帶來的經營理念的轉變
大數據的輿情服務
大數據預測你的下一步行動
數據也會騙人,從人的動作推導數據
網絡數據背後的價值
第六章 顛覆與重塑思維,大數據與思維革命
大數據時代的綜閤人纔
飛利浦的大數據營銷策略
阿裏小貸的“不可能的任務”
第三方支付業務的另一種思路
P2P網絡藉貸動瞭誰的奶酪
大數據帶來的智能化與柔性化
生活、工作、思維的顛覆重構
第七章 得數據者得天下,商業競爭中的大數據
大型公司的垂直一體化趨勢
客戶形象的豐富源於對客戶的全麵理解
量化奠定瞭數據化的內核
文字的數據化進程
地理位置的數據化構建
數據化的溝通方式
企業競爭力的關鍵——大數據
第八章 讓數據張口說話,管理決策中的大數據
客觀數據最具發言權
挖掘潛力股的數據化進程
時代因大數據而變革
大數據時代的風險規避策略
企業文化的數據化構建
第九章 更自由,更開放,大數據的機遇和挑戰
人機結閤的未來發展趨勢
數據時代,引發時代大變革
數據可以錶示世間萬物,會帶來驚喜
數據化帶來的挑戰前所未有
第一章
身處數據時代,揭開大數據的麵紗科技的迅速發展,互聯網金融的興起和繁榮,把數據推到瞭所有金融元素的核心位置。越來越多的企業逐漸認識到隻有掌握正確的數據並看透數據背後的故事,纔能夠獲得源源不斷的財富。大數據時代伴著鏗鏘有力的節奏引領瞭世界的新潮流。
002
一本書讀懂大數據
大數據到底是什麼 ?
如果要追溯“大數據”這個專業術語最初的齣處的話,就必然要提及apache org的開源項目Nutch。在那個時候,大數據的意思是更新網絡搜索索引,同時還需要批量處理和分析大量的數據集。榖歌的Map Reduce和GoogleFile System(GFS)發布瞭之後,大數據的定義中除瞭涵蓋大量數據之外,還包括數據處理的速度。
研究機構Gartner曾給大數據(Big data)下過這樣的定義:大數據是一種基於新的處理模式而産生的具有強大的決策力、洞察力以及流程優化能力的多樣性的、海量的且增長率高的信息資産。
大數據一詞源於英文的“Big Data”一詞,以往也有類似的詞語,如“信息爆炸”“海量數據”等等似乎都很難去準確描述這個詞的具體內涵。麥肯锡全球研究所所做的《大數據:創新、競爭和生産力的下一個前沿》(James,2011)是這麼定義“大數據”的:大數據通常指的是大小規格超越傳統數據庫軟件工具抓取、存儲、管理和分析能力的數據群。這個定義也有很強的主觀色彩,因為究竟什麼樣規格的數據纔是大數據,這沒有統一的標準,也就是無法確定超過多少TB(1000GB)的數據纔是大數據。隨著時間的推移和技術的發展,我們必須知
003
第一章 身處數據時代,揭開大數據的麵紗
道“大數據”的量會越來越大。還有一點,這定義也會因為部門的差異而發生標準的變化,這和通用的是什麼軟件以及特定行業數據集的大小有密切的關係。所以,現有各行業的大數據可以是幾十TB,也可以是幾韆TB。按照EMC的界定,特指的大數據一定是指大型數據集,規模大概在10TB。通過多用戶將多個數據集集閤在一起,能構成PB的數據量。
在IBM2011IOD大會上,負責IBM軟件和硬件兩大集團的高級副總裁SteveMills曾說過:“分析已經成為必要的能力,不再隻是一個工具,是一種能讓業務流程運轉的智慧能力。企業要轉化信息的洞察力為行動,而不是僅僅去爭取競爭的優勢,要將其轉換為生存的根本。”
IBM公司概括大數據時有三個V,也就是大量化(Volume),多樣化(Variety)和快速化(Velocity),此外它們還針對客戶有瞭“大數據解決方案”的服務。IBM公司對大數據所概括齣的三個V,其實也說明大數據潛藏的另一個V——價值(Value)。就這麼說的話,大數據確實具備這四個V的基本特徵。
大數據的第一個特徵是數據的量大。電腦的數據運算和儲存單位都是字節(byte),1KB(kilobyte)等於1024B,就是韆字節。除此之外還有更高的單位MB(Megabyte兆字節),GB(Gigabyte,吉字節),TB(Trillion byte,太字節)、PB(Pet byte,拍字節),EB(Exabyte,艾字節),ZB(Zettabyte,澤它字節)和YB(Yotta byte,堯字節)。每一級之間的換算關係是1024。到瞭2009年,幾乎每一個美國企業,隻要是雇員人數超過1000人的,它的數據存儲量大概都超過瞭200TB,這是十年前沃爾瑪公司數據倉庫存儲量的2倍還多。在不少經濟部門當中,企業平均的數據存儲量甚至都達到瞭1PB。2010年歐洲組織的存儲總量大概為11EB,這個數字幾乎是整個美國數據總量(16EB)的70%。2010年全球企業在硬盤上的數據存儲量已經超過瞭7EB,而在PC和筆記本電腦等設備上的個人存儲量也超過瞭6EB。美國國會
004
一本書讀懂大數據
圖書館當時存儲的數據大概隻是1EB的4000分之一(James,2011)。硬件技術的發展速度遠遠趕不上數據容量的增長速度,為此數據存儲和處理的危機應運而生。巨大數量的數據被處理掉,例如醫療衛生提供商會將它們90%的數據給處理掉(這其中包括幾乎所有在手術過程中産生的實時視頻和圖像資料)。
隻不過,大數據不單純隻是大。海量數據存儲危機的産生不僅僅是由於數據量爆炸性的增長,還有數據類型的改變帶來的,這就是第二個V,多樣化。此前的數據庫用二維錶結構存儲方式就可以儲存數據,譬如常見的Excel軟件中處理的數據,這稱為結構化數據。可是現在隨著互聯網多媒體應用的齣現,像是聲音、圖片和視頻等等非結構化的數據所占的比重在日益增多。有統計錶明,全世界非結構化數據的增加率是63%,相對而言結構化數據增長率隻有32%。2012年,非結構化數據在整個互聯網數據中的占比已經超過瞭75%。
Informatica中國區的首席産品顧問但彬就提到過,大數據裏有海量數據的含義,但它又大於海量數據的定義。簡單來說,海量數據加上其他復雜類型的數據就是大數據的概念瞭。但彬還提到,所有交易和交互數據集都屬於大數據,它的規模和復雜程度早已在依據閤理成本和時限進行捕捉、管理和處理數據集的傳統技術的能力之上。
簡而言之,三種主要技術趨勢匯聚成瞭大數據:其一是海量交易數據,包括半結構化和非結構化信息,在從ERP應用程序到基於數據倉庫應用程序的在綫交易處理(OLTP)和分析係統的過程當中總在不斷增長。企業很多的數據和業務流程也在不斷走嚮公共和個人雲轉移,將造成更為復雜的局麵。其二是海量交互數據。因為Facebook、Twitter、LinkedIn以及其他更多的社交媒體的興起,這一部分數據誕生瞭海量的交互數據,其中涵蓋瞭呼叫詳細記錄(CDR)、設備和傳感器信息、GPS和地理定位映射數據,還有利
005
第一章 身處數據時代,揭開大數據的麵紗
用管理文件傳輸(Manage File Transfer)協議傳送的海量圖像文件、Web文本和點擊流數據、科學信息、電子郵件,等等。其三就是海量數據處理。隨著大數據的湧現,已經有很多用於密集型數據處理的架構應運而生,比如Apache Hadoop,它具有開放源碼以及在商品硬件群中運行的特性。此外還有能以可靠、高效、可伸縮的方式分布式處理大數據的軟件框架Hadoop。它之所以可靠,是因為它能夠提前假定計算元素和存儲失敗,所以它能夠維護多個工作數據副本,用並行處理的方式來加快處理能力和速度。Hadoop也是可伸縮的,PB級的數據它也可以處理。另外,Hadoop因為依賴於社區服務器,所以它的成本很低,不論是誰都可以使用。對企業來說,最難的在於如何通過成本效益的方式從Hadoop中存取數據。Hadoop最知名的用戶是臉譜。通過Hadoop,像臉譜這一類的網站,也就可以自由地處理海量的數據,同時獲得
……
世界的萬韆變化一直超乎人們的預測,自2012年以來,大數據一詞成瞭人類生活的代名詞。如今,數據幾乎已經滲透到瞭每一個行業的每一個領域之中,成瞭不可或缺的生産因素。每一天,互聯網都會繁衍齣無數的數據,這些內容足以刻滿2億張光碟;而手機客戶端發齣的帖子和郵件總數可達到3000萬億……如此驚人的數據使得對海量數據的挖掘和分析,成瞭企業發展的重要內容。大數據的數量大、類型多、時效快、價值密度低的特點,讓這個嶄新的時代充滿瞭變數和樂趣。
數據迅速地膨脹,讓差彆細微的算法就足以決定企業的發展方嚮。很多企業在大數據時代紛紛進行瞭多種多樣的嘗試,這是一場偉大的革命,龐大的數據資源的衝擊,讓商界、學術界等所有領域都開始瞭量化的流程,積極探索大數據時代的奧秘。
這本書中,我們能夠揭開大數據的麵紗,挖掘和分析大數據整個流程的重要關卡,掌握大數據的多種特性和價值特徵,對其結構有精準的把握。同
時,我們將大數據和小數據時代進行對比,讓讀者更加清晰地認識我們生活的時代。
電子商務界乘著大數據的狂風,掀起瞭人們生活的數據風暴。國內外的企業使盡渾身解數,在大數據的海洋裏摸爬滾打。從市場來看,阿裏巴巴、小米、亞馬遜的行動最為迅速、高效。任何企業,隻有把握住瞭大數據時代的機遇、接受大數據時代的挑戰,企業纔能擁有瞭縮短發展時間、完成飛躍的籌碼。
大數據和企業的生存發展息息相關,企業的管理層需要全麵的數據源來確定正確的航嚮,全麵的數據源搜索和分析需要專業人纔,專業的人纔需要經曆商業氣息的洗禮。這一切都成瞭企業在大數據時代直接麵臨的機遇和巨大挑戰。得數據者得天下不再是一句標語,企業的整個商務鏈條都需要數據的支撐來保駕護航,失之毫厘謬以韆裏的教訓時時刻刻都可能發生。重視大數據、對大數據瞭解詳盡的企業高管纔有可能帶著企業在正確的路上,獲得競爭優勢。
進入大數據時代,讓數據開口說話將成為司空見慣的事情,本書將從大數據時代的前因後果講起,全麵分析大數據時代的特徵、企業實踐的案例、大數據的發展方嚮、未來的機遇和挑戰等內容,展現一個客觀立體、自由開放的大數據時代。
喜歡有深度的思考,
評分包裝完好,京東圖書都是正版,質量不錯,一次買瞭幾十本放書櫃裏,很有效果。
評分圖書真心不錯,值得擁有,值得品味,值得珍藏。
評分書本包裝很好,派送迅速,值得購買和選購,包裝很好,值得購買
評分不錯的!!雖然有這知識已經不是最新的瞭,但是發現趣味還是可以的!隻是包裝稍微簡陋瞭一些!
評分物美價廉,印刷質量好,包裝嚴實,好好學習。
評分最近很流行大數據技術,買本書先瞭解一下,剛好做活動,內容還不錯,算是科普,全五分好評
評分好的吧嗯嗯嗯嗯嗯嗯嗯嗯嗯嗯嗯嗯嗯嗯嗯嗯嗯嗯嗯嗯嗯嗯嗯嗯嗯嗯嗯嗯嗯嗯嗯嗯嗯嗯嗯嗯嗯嗯嗯嗯嗯嗯嗯嗯
評分活動買的,300減180,還行,學習
一本書讀懂大數據 pdf epub mobi txt 電子書 下載