編輯推薦
零基礎學習爬蟲技術,從Python和Web前端基礎開始講起,由淺入深,包含大量案例,實用性強。
從靜態網站到動態網站,從單機爬蟲到分布式爬蟲,涵蓋Scrapy和PySpider框架的運用、去重方案的設計和分布式爬蟲的搭建等。
這是一本實戰性很強的書,書中共有9個爬蟲項目,以係統的實戰項目為驅動,由淺及深地講解爬蟲開發中所需的知識和技能。從靜態網站到動態網站,從單機爬蟲到分布式爬蟲,既包含基礎知識點,又講解瞭關鍵問題和難點分析,包含從入門到進階的所有知識。讀者認真學習完本書之後不再是個菜鳥,可以自主地開發Python爬蟲項目。
內容簡介
隨著大數據時代到來,網絡信息量也變得更多更大,基於傳統搜索引擎的局限性,網絡爬蟲應運而生,本書從基本的爬蟲原理開始講解,通過介紹Pthyon編程語言和Web前端基礎知識引領讀者入門,之後介紹動態爬蟲原理以及Scrapy爬蟲框架,最後介紹大規模數據下分布式爬蟲的設計以及PySpider爬蟲框架等。
主要特點:
l 由淺入深,從Python和Web前端基礎開始講起,逐步加深難度,層層遞進。
l 內容詳實,從靜態網站到動態網站,從單機爬蟲到分布式爬蟲,既包含基礎知識點,又講解瞭關鍵問題和難點分析,方便讀者完成進階。
l 實用性強,本書共有9個爬蟲項目,以係統的實戰項目為驅動,由淺及深地講解爬蟲開發中所需的知識和技能。
難點詳析,對js加密的分析、反爬蟲措施的突破、去重方案的設計、分布式爬蟲的開發進行瞭細緻的講解。
作者簡介
範傳輝,資深網蟲,Python開發者,參與開發瞭多項網絡應用,在實際開發中積纍瞭豐富的實戰經驗,並善於總結,貢獻瞭多篇技術文章廣受好評。研究興趣是網絡安全、爬蟲技術、數據分析、驅動開發等技術。
Python爬蟲開發與項目實戰 下載 mobi epub pdf txt 電子書