編輯推薦
深入剖析現代編譯器運用的算法和技術
強調代碼優化和代碼生成
體現編譯原理教學的理念
內容簡介
1952年一個編譯器誕生,至今已經過去瞭半個多世紀,編譯器的發展日臻成熟,關於編譯器設計的著作也齣版瞭不少,但既關注設計細節,又具備大局觀的經典之作鳳毛麟角,《編譯器設計(第2版)》即是這樣一本難得的佳作。
兩位作者多年來一直奮戰在研發和教學一綫,理論和實踐上的豐厚經驗都凝結在瞭《編譯器設計(第2版)》中。書中論述瞭一係列構建現代編譯器必需的核心技術,分析瞭編譯器設計者需要麵對的諸多問題,闡釋瞭解決這些問題所用到的一些知識點。第2版是時隔8年之後全新修訂的版本,充分展現瞭編譯器構造技術的進展。作者重寫瞭書中全部示例,並特彆改進瞭闡述順序,使得章與章之間的內容更具連續性,也更適閤專業人士將這本高校教材作為參考書。
作者簡介
Keith D. Cooper,萊斯大學計算機科學係計算工程專業Doerr特聘教授,曾任該係係主任。Cooper博士的研究課題涵蓋過程間數據流分析、標量指令優化、寄存器分配以及指令調度等方麵。
Linda Torczon,萊斯大學計算機科學係高級研究員。Torczon的研究內容主要包括代碼生成、過程間數據流分析和優化、編程環境。
譯者簡介:
郭旭,資深軟件設計師。主要興趣是復雜軟件係統的分析和設計,目前從事高性能數據集成工具的研發。譯有《深入Linux內核架構》、《C語言接口及實現》等書。
精彩書評
“編譯器是一個內容豐富的研究領域,將整個計算機科學融匯在一個優雅的構造中。Cooper和Torczon的這本書很受歡迎,可以指導讀者輕鬆學習編譯器這種軟件係統,新版增加瞭兩位作者的一些設計經驗,並明確指齣瞭許多必須注意的細節,同時又不忘強調設計的大局觀。對任何不熟悉編譯器的人來說,本書都是不可多得的參考手冊。”
——Michael D. Smith,哈佛大學文理學院院長,工程與應用科學John H. Finley Jr.講席教授
“本書是構建現代優化編譯器的指南。作者汲取瞭編譯器構建領域大量的經驗,以幫助學生掌握整體設計思路,同時引導學生瞭解構建有效的優化編譯器所必需的許多重要而微妙的細節。尤其值得一提的是,在我讀過的書中,本書對靜態單賦值形式的闡述為清晰。”
——Jeffery von Ronne,得剋薩斯大學聖安東尼奧分校計算機科學係助理教授
“本書采用瞭更常規且一緻的結構,還包含大量輔助教學的內容,如復習題、附加示例、術語解釋和文本框說明等,這提升瞭它作為教科書的價值。本書還包括大量技術上的更新,包括非傳統語言、實際編譯器和編譯器技術非傳統用途方麵的更多內容。優化方麵的內容是第1版的特色,這一版中變得更為清晰易讀。”
——Michael L. Sccot,羅徹斯特大學計算機科學係教授,Programming Language Pragmatics的作者
“Keith Cooper和Linda Torczon不僅很好地講述瞭編譯器的曆史,也從實踐者的角度闡述瞭如何開發編譯器。書中包括瞭大量頗具實用價值的討論和說明,既涉及理論,也涉及眾多現存編譯器的實例(如Lisp、FORTRAN等)。對入門和高級“分配”與“優化”概念的全麵討論,實際上涵蓋瞭編譯器設計的整個生命周期。對於計算機科學專業的學生以及編譯器設計和開發人員來說,本書都是必備參考書。”
——David Orleans,諾瓦東南大學
“這本書寫得實在是棒極瞭,內容翔實,輔以大量圖錶和示例說明,作為大學編譯器課程的教科書和從業人員的參考書再閤適不過瞭。代碼優化是其重點。”
——Reviews網站
目錄
第1章 編譯概觀
1.1 簡介
1.2 編譯器結構
1.3 轉換概述
1.3.1 前端
1.3.2 優化器
1.3.3 後端
1.4 小結和展望
第2章 詞法分析器
2.1 簡介
2.2 識彆單詞
2.2.1 識彆器的形式化
2.2.2 識彆更復雜的單詞
2.3 正則錶達式
2.3.1 符號錶示法的形式化
2.3.2 示例
2.3.3 RE的閉包性質
2.4 從正則錶達式到詞法分析器
2.4.1 非確定性有限自動機
2.4.2 從正則錶達式到NFA:Thompson構造法
2.4.3 從NFA到DFA:子集構造法
2.4.4 從DFA到最小DFA:Hopcroft算法
2.4.5 將DFA用做識彆器
2.5 實現詞法分析器
2.5.1 錶驅動詞法分析器
2.5.2 直接編碼的詞法分析器
2.5.3 手工編碼的詞法分析器
2.5.4 處理關鍵字
2.6 高級主題
2.6.1 從DFA到正則錶達式
2.6.2 DFA最小化的另一種方法:Brzozowski算法
2.6.3 無閉包的正則錶達式
2.7 小結和展望
第3章 語法分析器
3.1 簡介
3.2 語法的錶示
3.2.1 為什麼不使用正則錶達式
3.2.2 上下文無關語法
3.2.3 更復雜的例子
3.2.4 將語義編碼到結構中
3.2.5 為輸入符號串找到推導
3.3 自頂嚮下語法分析
3.3.1 為進行自頂嚮下語法分析而轉換語法
3.3.2 自頂嚮下的遞歸下降語法分析器
3.3.3 錶驅動的LL(1)語法分析器
3.4 自底嚮上語法分析
3.4.1 LR(1)語法分析算法
3.4.2 構建LR(1)錶
3.4.3 錶構造過程中的錯誤
3.5 實際問題
3.5.1 齣錯恢復
3.5.2 一元運算符
3.5.3 處理上下文相關的二義性
3.5.4 左遞歸與右遞歸
3.6 高級主題
3.6.1 優化語法
3.6.2 減小LR(1)錶的規模
3.7 小結和展望
第4章 上下文相關分析
4.1 簡介
4.2 類型係統簡介
4.2.1 類型係統的目標
4.2.2 類型係統的組件
4.3 屬性語法框架
4.3.1 求值的方法
4.3.2 環
4.3.3 擴展實例
4.3.4 屬性語法方法的問題
4.4 特設語法製導轉換
4.4.1 特設語法製導轉換的實現
4.4.2 例子
4.5 高級主題
4.5.1 類型推斷中更睏難的問題
4.5.2 改變結閤性
4.6 小結和展望
第5章 中間錶示
5.1 簡介
5.2 圖IR
5.2.1 與語法相關的樹
5.2.2 圖
5.3 綫性IR
5.3.1 堆棧機代碼
5.3.2 三地址代碼
5.3.3 綫性代碼的錶示
5.3.4 根據綫性代碼建立控製流圖
5.4 將值映射到名字
5.4.1 臨時值的命名
5.4.2 靜態單賦值形式
5.4.3 內存模型
5.5 符號錶
5.5.1 散列錶
5.5.2 建立符號錶
5.5.3 處理嵌套的作用域
5.5.4 符號錶的許多用途
5.5.5 符號錶技術的其他用途
5.6 小結和展望
第6章 過程抽象
6.1 簡介
6.2 過程調用
6.3 命名空間
6.3.1 類Algol語言的命名空間
6.3.2 用於支持類Algol語言的運行時結構
6.3.3 麵嚮對象語言的命名空間
6.3.4 支持麵嚮對象語言的運行時結構
6.4 過程之間值的傳遞
6.4.1 傳遞參數
6.4.2 返迴值
6.4.3 確定可尋址性
6.5 標準化鏈接
6.6 高級主題
6.6.1 堆的顯式管理
6.6.2 隱式釋放
6.7 小結和展望
第7章 代碼形式
7.1 簡介
7.2 分配存儲位置
7.2.1 設定運行時數據結構的位置
7.2.2 數據區的布局
7.2.3 將值保持在寄存器中
7.3 算術運算符
7.3.1 減少對寄存器的需求
7.3.2 訪問參數值
7.3.3 錶達式中的函數調用
7.3.4 其他算術運算符
7.3.5 混閤類型錶達式
7.3.6 作為運算符的賦值操作
7.4 布爾運算符和關係運算符
7.4.1 錶示
7.4.2 對關係操作的硬件支持
7.5 數組的存儲和訪問
7.5.1 引用嚮量元素
7.5.2 數組存儲布局
7.5.3 引用數組元素
7.5.4 範圍檢查
7.6 字符串
7.6.1 字符串錶示
7.6.2 字符串賦值
7.6.3 字符串連接
7.6.4 字符串長度
7.7 結構引用
7.7.1 理解結構布局
7.7.2 結構數組
7.7.3 聯閤和運行時標記
7.7.4 指針和匿名值
7.8 控製流結構
7.8.1 條件執行
7.8.2 循環和迭代
7.8.3 case語句
7.9 過程調用
7.9.1 實參求值
7.9.2 保存和恢復寄存器
7.10 小結和展望
第8章 優化簡介
8.1 簡介
8.2 背景
8.2.1 例子
8.2.2 對優化的考慮
8.2.3 優化的時機
8.3 優化的範圍
8.4 局部優化
8.4.1 局部值編號
8.4.2 樹高平衡
8.5 區域優化
8.5.1 超局部值編號
8.5.2 循環展開
8.6 全局優化
8.6.1 利用活動信息查找未初始化變量
8.6.2 全局代碼置放
8.7 過程間優化
8.7.1 內聯替換
8.7.2 過程置放
8.7.3 針對過程間優化的編譯器組織結構
8.8 小結和展望
第9章 數據流分析
9.1 簡介
9.2 迭代數據流分析
9.2.1 支配性
9.2.2 活動變量分析
9.2.3 數據流分析的局限性
9.2.4 其他數據流問題
9.3 靜態單賦值形式
9.3.1 構造靜態單賦值形式的簡單方法
9.3.2 支配邊界
9.3.3 放置 函數
9.3.4 重命名
9.3.5 從靜態單賦值形式到其他形式的轉換
9.3.6 使用靜態單賦值形式
9.4 過程間分析
9.4.1 構建調用圖
9.4.2 過程間常量傳播
9.5 高級主題
9.5.1 結構性數據流算法和可歸約性
9.5.2 加速計算支配性的迭代框架算法的執行
9.6 小結和展望
第10章 標量優化
10.1 簡介
10.2 消除無用和不可達代碼
10.2.1 消除無用代碼
10.2.2 消除無用控製流
10.2.3 消除不可達代碼
10.3 代碼移動
10.3.1 緩式代碼移動
10.3.2 代碼提升
10.4 特化
10.4.1 尾調用優化
10.4.2 葉調用優化
10.4.3 參數提升
10.5 冗餘消除
10.5.1 值相同與名字相同
10.5.2 基於支配者的值編號算法
10.6 為其他變換製造時機
10.6.1 超級塊復製
10.6.2 過程復製
10.6.3 循環外提
10.6.4 重命名
10.7 高級主題
10.7.1 閤並優化
10.7.2 強度削減
10.7.3 選擇一種優化序列
10.8 小結和展望
第11章 指令選擇
11.1 簡介
11.2 代碼生成
11.3 擴展簡單的樹遍曆方案
11.4 通過樹模式匹配進行指令選擇
11.4.1 重寫規則
11.4.2 找到平鋪方案
11.4.3 工具
11.5 通過窺孔優化進行指令選擇
11.5.1 窺孔優化
11.5.2 窺孔變換程序
11.6 高級主題
11.6.1 學習窺孔模式
11.6.2 生成指令序列
11.7 小結和展望
第12章 指令調度
12.1 簡介
12.2 指令調度問題
12.2.1 度量調度質量的其他方式
12.2.2 是什麼使調度這樣難
12.3 局部錶調度
12.3.1 算法
12.3.2 調度具有可變延遲的操作
12.3.3 擴展算法
12.3.4 在錶調度算法中打破平局
12.3.5 前嚮錶調度與後嚮錶調度
12.3.6 提高錶調度的效率
12.4 區域性調度
12.4.1 調度擴展基本程序塊
12.4.2 跟蹤調度
12.4.3 通過復製構建適當的上下文環境
12.5 高級主題
12.5.1 軟件流水綫的策略
12.5.2 用於實現軟件流水綫的算法
12.6 小結和展望
第13章 寄存器分配
13.1 簡介
13.2 背景問題
13.2.1 內存與寄存器
13.2.2 分配與指派
13.2.3 寄存器類彆
13.3 局部寄存器分配和指派
13.3.1 自頂嚮下的局部寄存器分配
13.3.2 自底嚮上的局部寄存器分配
13.3.3 超越單個程序塊
13.4 全局寄存器分配和指派
13.4.1 找到全局活動範圍
13.4.2 估算全局逐齣代價
13.4.3 衝突和衝突圖
13.4.4 自頂嚮下著色
13.4.5 自底嚮上著色
13.4.6 閤並副本以減小度數
13.4.7 比較自頂嚮下和自底嚮上全局分配器
13.4.8 將機器的約束條件編碼到衝突圖中
13.5 高級主題
13.5.1 圖著色寄存器分配方法的變體
13.5.2 靜態單賦值形式上的全局寄存器分配
13.6 小結和展望
附錄A ILOC
附錄B 數據結構
參考文獻
索引
前言/序言
構建編譯器的實踐方法一直在不斷變化,部分是因為處理器和係統的設計會發生變化。例如,當我們在1998年開始寫作本書初版時,一些同事對書中指令調度方麵的內容頗感疑惑,因為亂序執行威脅到瞭指令調度,很有可能會使其變得不再重要。現在第2版已經付印,隨著多核處理器的崛起和爭取更多核心的推動,順序執行流水綫再次展現吸引力,因為這種流水綫占地較少,設計者能夠將更多核心放置在一塊芯片上。短期內,指令調度仍然很重要。
同時,編譯器構建社區還將繼續産生新的思路和算法,並重新發現原本有效但在很大程度上卻被遺忘的舊技術。圍繞著寄存器分配中弦圖(chordal graph)使用(參見13.5.2節)的最新研究頗為令人振奮。該項工作承諾可以簡化圖著色分配器(graph-coloring allocator)的某些方麵。Brzozowski的算法是一種DFA最小化技術,可以追溯到20世紀60年代早期,但卻已有數十年未在編譯器課程中講授瞭(參見2.6.2節)。 該算法提供瞭一種容易的路徑,可以從子集構造(subset construction)的實現得到一個最小化DFA的實現。編譯器構建方麵的現代課程本該同時包括這兩種思想。
那麼,為瞭讓學習者準備好進入這個不斷變化的領域,我們該如何設計編譯器構建課程的結構呢?我們相信,這門課應該使每個學生學會建立新編譯器組件和修改現存編譯器所需的各項基本技能。學生既需要理解籠統的概念,如鏈接約定中隱含的編譯器、鏈接器、裝載器和操作係統之間的協作,也需要理解微小的細節,如編譯器編寫者如何減少每個過程調用時保存寄存器的代碼總共所占的空間。
第2版中的改變
本書提供瞭兩種視角:編譯器構建領域中各問題的整體圖景,以及各種可選算法方案的詳細討論。在構思本書的過程中,我們專注於該書的可用性,使其既可作為教科書,又可用做專業人士的參考書。為此,我們特彆進行瞭下述改動。
改進瞭闡述思想的流程,以幫助按順序閱讀本書的學生。每章章首簡介會解釋該章的目的,列齣主要的概念,並概述主題相關內容。書中的示例已經重寫過,使得章與章之間的內容具有連續性。此外,每章都從摘要和一組關鍵詞開始,以幫助那些會將本書用做參考書的讀者。
在每節末尾都增加瞭本節迴顧和復習題。復習題用於快速檢查讀者是否理解瞭該節的要點。
關鍵術語的定義放在瞭它們被首次定義和討論的段落之後。
大量修訂瞭有關優化的內容,使其能夠更廣泛地涵蓋優化編譯器的各種可能性。
現在的編譯器開發專注於優化和代碼生成。對於新雇用的編譯器編寫者來說,他們往往會被指派去將代碼生成器移植到新處理器,或去修改優化趟,而不會去編寫詞法分析器或語法分析器。成功的編譯器編寫者必須熟悉優化(如靜態單賦值形式的構建)和代碼生成領域當前最好的實踐技術(如軟件流水綫)。他們還必須擁有相關的背景和洞察力,能理解未來可能齣現的新技術。最後,他們必須深刻理解詞法分析、語法分析和語義推敲(semantic elaboration)技術,能構建或修改編譯器前端。
本書是一本教科書、一門教程,幫助學生接觸到現代編譯器領域中的各種關鍵問題,並嚮學生提供解決這些問題所需的背景知識。從第1版開始,我們就維持瞭各主題之間的基本均衡。前端是實用組件,可以從可靠的廠商購買或由某個開源係統改編而得。但是,優化器和代碼生成器通常是對特定處理器定製的,有時甚至針對單個處理器型號定製,因為性能嚴重依賴於所生成代碼的底層細節。這些事實影響到瞭當今構建編譯器的方法,它們也應該影響我們講授編譯器構建課程的方法。
本書結構
本書內容劃分為篇幅大緻相等的四個部分。
第一部分(第2章~第4章)涵蓋編譯器前端及建立前端所用工具的設計和構建。
第二部分(第5章~第7章)探討從源代碼到編譯器的中間形式的映射,這些章考查前端為優化器和後端所生成代碼的種類。
第三部分(第8章~第10章)介紹代碼優化。第8章提供對優化的概述。第9章和第10章包含瞭對分析和轉換的更深入的處理,本科課程通常略去這兩章。
第四部分(第11章~第13章)專注於編譯器的後端所使用的算法。
編譯的藝術性與科學性
編譯器構建的內容有兩部分,一是將理論應用到實踐方麵所取得的驚人成就,一是對我們能力受限之處的探討。這些成就包括:現代詞法分析器是通過應用正則語言的理論自動構建識彆器而建立的;LR語法分析器使用同樣的技術執行句柄識彆,進而驅動瞭一個移進歸約語法分析器;數據流分析巧妙有效地將格理論應用到程序分析中;代碼生成中使用的近似算法為許多真正睏難的問題提供瞭較好的解。
另一方麵,編譯器構建也揭示瞭一些難以解決的復雜問題。用於
編譯器設計(第2版) [Engineering a Compiler,Second] 下載 mobi epub pdf txt 電子書