內容簡介
《高等院校信息與通信工程係列教材:語音信號處理(第2版)》係統地介紹語音信號處理的基礎、概念、原理、方法與應用,以及該學科領域取得的新進展。全書共分9章,其中第1章緒論,介紹語音信號處理及其發展過程。第2章介紹語音産生與人類聽覺的機理,傳統的綫性語音産生模型,以及近年來剛剛興起的非綫性語音産生模型。第3章從語音信號的時域特徵入手,引入時頻分析的思想,並進一步闡述時頻分析中短時傅裏葉變換和小波變換在語音信號特徵分析中的應用,最後對廣泛使用的倒譜特徵以及同態解捲積進行介紹。第4章介紹語音信號的綫性預測原理、解法、幾種推演方法以及綫譜對分析法。第5章介紹語音編碼的相關知識,包括語音的波形編碼、綫性預測編碼、極低速率語音編碼技術,以及相關編碼器的性能指標和評測方法。第6章介紹語音識彆的基本內容,從基於矢量量化的識彆技術到動態時間歸正的識彆技術,再到隱馬爾可夫模型的識彆技術,從孤立詞識彆到連接詞識彆及連續語音識彆技術,再到關鍵詞檢齣技術,最後還介紹近年來興起的一些語音識彆應用技術,包括語言學模型的自適應、htk應用以及lattice結構和混淆網絡等。第7章介紹說話人識彆的基本原理,主要包括說話人的特徵選取、說話人識彆的主要方法,以及近年來備受關注的gmm-ubm模型、開集說話人識彆的規整技術等。第8章介紹近年來發展迅速的頑健語音識彆技術,從影響語音識彆性能的環境變化因素分析開始,介紹噪聲環境下頑健語音識彆技術,以及變異語音識彆的技術。第9章介紹語音閤成的基本原理、綫性預測閤成、共振峰閤成以及漢語按規則閤成,以及最近興起的基於hmm閤成技術等內容。
《高等院校信息與通信工程係列教材:語音信號處理(第2版)》可作為高等院校計算機應用、信號與信息處理、通信與電子係統等專業及學科的高年級本科生、研究生教材,也可供該領域的科研及工程技術人員參考。
作者簡介
韓紀慶,哈爾濱工業大學計算機科學與技術學院教授、博士生導師。兼任國傢自然科學基金委信息學部自動化學科會議評審專傢、國傢科學技術奬勵評審專傢、中國中文信息學會理事及語音處理專委會副主任、全國人機語音通訊學術會議常設機構委員會副主席、《中文信息學報》編委、《數據采集與處理》雜誌編委。長期從事語音信號處理、音頻信息處理等領域的教學與科研工作。作為項目負責人,在研和完成的國傢自然科學基金重點項目1項、麵上項目5項、國傢973計劃課題1項、教育部“跨世紀優秀人纔培養計劃”基金1項,以及其他科研項目10餘項。獲省部級科技二等奬3項,三等奬2項。獲國傢發明專利7項。已在國內外刊物和會議上發錶論文180餘篇,著書3部。
目錄
第1章 緒論
1.1 語音信號處理的發展
1.2 語音信號處理的應用
1.3 語音信號處理的總體結構
參考文獻
第2章 語音信號的聲學基礎及産生模型
2.1 語音信號的産生
2.1.1 語音的發音器官
2.1.2 語音的聲學特徵
2.1.3 語音信號在時域和頻域的錶示
2.1.4 漢語中語音的分類
2.1.5 漢語語音的韻律特性
2.2 語音信號的感知
2.2.1 聽覺係統
2.2.2 聽覺特性
2.2.3 掩蔽效應
2.3 語音信號的綫性産生模型
2.3.1 激勵模型
2.3.2 聲道模型
2.3.3 輻射模型
2.4 語音信號的非綫性産生模型
2.4.1 調頻-調幅模型的基本原理
2.4.2 teager能量算子
2.4.3 能量分離算法
2.4.4 調頻-調幅模型的應用
參考文獻
第3章 語音信號的特徵分析
3.1 語音信號數字化
3.1.1 語音信號的采樣和量化
3.1.2 短時加窗處理
3.2 語音信號的時域分析
3.2.1 短時能量分析
3.2.2 短時平均過零率
3.2.3 短時自相關函數和短時平均幅度差函數
3.2.4 端點檢測和語音分割
3.3 語音信號的頻域分析
3.3.1 濾波器組方法
3.3.2 傅裏葉頻譜分析
3.4 傳統傅裏葉變換缺點及時頻分析的思想
3.4.1 信號的時頻錶示
3.4.2 不確定原理
3.5 gabor變換
3.6 小波變換在語音信號分析中的應用
3.6.1 小波的數學錶示及意義
3.6.2 小波分析特點
3.6.3 小波變換的多分辨分析
3.6.4 小波變換在語音處理中應用
3.7 語音信號的同態解捲積
3.7.1 同態信號處理的基本原理
3.7.2 語音信號的復倒譜
3.7.3 避免相位捲繞的算法
3.7.4 基於聽覺特性的mel頻率倒譜係數
3.8 語音信號特徵應用
3.8.1 基音周期估計
3.8.2 共振峰的估計
參考文獻
第4章 語音信號的綫性預測分析
4.1 綫性預測的基本原理
4.2 綫性預測方程組的解法
4.2.1 自相關法
4.2.2 協方差法
4.2.3 格型法
4.2.4 幾種求解綫性預測方法的比較
4.3 綫性預測的幾種推演參數
4.3.1 歸一化自相關函數
4.3.2 反射係數
4.3.3 預測器多項式的根
4.3.4 lpc倒譜
4.3.5 全極點係統的衝激響應及其自相關函數
4.3.6 預測誤差濾波器的衝激響應及其自相關函數
4.3.7 對數麵積比係數
4.4 綫譜對分析法
4.4.1 綫譜對分析的原理
4.4.2 綫譜對參數的求解
4.5 感知綫性預測plp係數
參考文獻
第5章 語音編碼
5.1 波形編碼
5.1.1 均勻量化pcm
5.1.2 非均勻量化pcm
5.1.3 自適應量化pcm
5.1.4 差分脈衝編碼
5.1.5 自適應差分脈衝編碼
5.1.6 增量調製和自適應增量調製
5.1.7 子帶編碼
5.1.8 自適應變換域編碼
5.2 參數編碼和混閤編碼
5.2.1 參數編碼
5.2.2 基於全極點語音産生模型的混閤編碼
5.2.3 基於正弦模型的混閤編碼
5.3 極低速率語音編碼技術
5.3.1 400bps~1.2kbps的聲碼器
5.3.2 識彆閤成型聲碼器
5.4 語音編碼器的性能指標和質量評測方法
5.4.1 編碼速率
5.4.2 頑健性
5.4.3 時延
5.4.4 計算復雜度和算法的可擴展性
5.4.5 語音質量及其評價方法
5.5 語音編碼國際標準
5.6 感知音頻編碼
5.6.1 感知編碼的一般框架
5.6.2 心理聲學模型
5.6.3 常用的感知編碼標準
參考文獻
第6章 語音識彆
6.1 概述
6.2 基於矢量量化的識彆技術
6.2.1 k-means矢量量化算法
6.2.2 lbg算法
6.3 動態時間歸正的識彆技術
6.3.1 dtw基本原理
6.3.2 模闆訓練算法
6.4 隱馬爾可夫模型技術
6.4.1 hmm基本思想
6.4.2 hmm基本算法
6.4.3 hmm算法實現中的問題
6.4.4 關於hmm訓練的幾點考慮
6.5 連接詞語音識彆技術
6.5.1 連接詞識彆問題的一般描述
6.5.2 二階動態規劃算法
6.5.3 分層構築方法
6.6 大詞錶連續語音識彆中的聲學模型和語言學模型
6.6.1 聲學模型
6.6.2 統計語言學模型
6.6.3 統計語言學模型平滑技術
6.6.4 語言學模型自適應技術
6.7 大詞錶連續語音識彆中的解碼技術
6.7.1 圖的基本搜索算法
6.7.2 麵嚮語音識彆的搜索算法
6.8 大詞錶連續語音識彆後處理技術
6.8.1 語音識彆中間結果的錶示形式
6.8.2 錯誤處理
6.8.3 最小字錯誤率解碼方法
6.9 基於hmm的自適應技術
6.9.1 基於bayesian理論的自適應方法
6.9.2 基於變換的自適應方法
6.10 關鍵詞檢齣技術
6.10.1 問題描述
6.10.2 關鍵詞檢齣係統的組成
6.10.3 垃圾模型建模方法
6.10.4 語音解碼器的設計
6.10.5 關鍵詞確認過程
6.10.6 關鍵詞檢齣係統性能優化
6.11 語音識彆的應用技術
6.11.1 語音信息檢索
6.11.2 發音學習技術
6.11.3 基於語音的情感處理
6.11.4 網絡環境下的語音識彆
6.11.5 嵌入式語音識彆技術
6.12 htk工具介紹
6.12.1 數據準備階段
6.12.2 模型訓練階段
6.12.3 識彆階段
參考文獻
第7章 說話人識彆
7.1 概述
7.2 說話人識彆的特徵選取
7.2.1 特徵參數的評價方法
7.2.2 說話人識彆係統中常用的特徵
7.3 說話人識彆的主要方法
7.3.1 與文本有關的識彆方法
7.3.2 與文本無關的識彆方法
7.3.3 文本提示型的識彆方法
7.4 閾值的選取
7.5 得分規整
7.5.1 零規整(zero normalization)
7.5.2 測試規整(test normalization)
7.5.3 說話人自適應的測試規整
7.5.4 tz-norm
7.5.5 h-norm
7.5.6 c-norm
7.6 引入區分判彆模型的說話人識彆
7.6.1 svm
7.6.2 基於svm的說話人識彆
7.6.3 基於gmm得分的svm說話人識彆
7.6.4 基於gmm均值超矢量的svm說話人識彆
7.7 復雜信道下的說話人識彆
7.7.1 特徵映射
7.7.2 說話人模型閤成
7.7.3 擾動屬性投影
7.7.4 聯閤因子分析
7.8 說話人識彆中有待解決的問題
參考文獻
第8章 頑健語音識彆技術
8.1 概述
8.2 影響語音識彆性能的環境變化因素
8.3 噪聲環境下的頑健語音識彆技術
8.3.1 基於語音增強的方法
8.3.2 通道畸變的抑製方法
8.3.3 基於模型的補償方法
8.4 變異語音識彆方法
8.4.1 變異語音的分析
8.4.2 變異語音的分類
8.4.3 變異語音的識彆
參考文獻
第9章 語音閤成
9.1 語音閤成的基本原理
9.2 參數閤成方法
9.2.1 綫性預測閤成方法
9.2.2 共振峰閤成方法
9.3 波形拼接閤成技術
9.3.1 td-psola算法
9.3.2 fd-psola算法
9.4 漢語按規則閤成
9.4.1 韻律規則
9.4.2 多音節協同發音規則閤成
9.4.3 輕聲音節規則閤成
9.4.4 兒化音節的規則閤成
9.5 基於hmm的參數化語音閤成技術
9.5.1 基於hmm參數語音閤成係統的訓練
9.5.2 基於hmm參數語音閤成係統的閤成階段
參考文獻
高等院校信息與通信工程係列教材:語音信號處理(第2版) 下載 mobi epub pdf txt 電子書
評分
☆☆☆☆☆
不錯不錯,比想象中好
評分
☆☆☆☆☆
不錯的書,很有用,內容很全麵
評分
☆☆☆☆☆
不錯的書,很有用,內容很全麵
評分
☆☆☆☆☆
東西還不錯。給個好評。。。
評分
☆☆☆☆☆
不錯不錯,比想象中好
評分
☆☆☆☆☆
東西很好,用的很滿意很滿意
評分
☆☆☆☆☆
公司買的,用完再評價。
評分
☆☆☆☆☆
讀高等院校信息與通信工程係列教材:語音信號處理(第2版) 《高等院校信息與通信工程係列教材:語音信號處理(第2版)》係統地介紹語音信號處理的基礎、概念、原理、方法與應用,以及該學科領域取得的新進展。全書共分9章,其中第1章緒論,介紹語音信號處理及其發展過程。第2章介紹語音産生與人類聽覺的機理,傳統的綫性語音産生模型,以及近年來剛剛興起的非綫性語音産生模型。第3章從語音信號的時域特徵入手,引入時頻分析的思想,並進一步闡述時頻分析中短時傅裏葉變換和小波變換在語音信號特徵分析中的應用,最後對廣泛使用的倒譜特徵以及同態解捲積進行介紹。第4章介紹語音信號的綫性預測原理、解法、幾種推演方法以及綫譜對分析法。第5章介紹語音編碼的相關知識,包括語音的波形編碼、綫性預測編碼、極低速率語音編碼技術,以及相關編碼器的性能指標和評測方法。第6章介紹語音識彆的基本內容,從基於矢量量化的識彆技術到動態時間歸正的識彆技術,再到隱馬爾可夫模型的識彆技術,從孤立詞識彆到連接詞識彆及連續語音識彆技術,再到關鍵詞檢齣技術,最後還介紹近年來興起的一些語音識彆應用技術,包括語言學模型的自適應、HTK應用以及LATTICE結構和混淆網絡等。第7章介紹說話人識彆的基本原理,主要包括說話人的特徵選取、說話人識彆的主要方法,以及近年來備受關注的GMM-UBM模型、開集說話人識彆的規整技術等。第8章介紹近年來發展迅速的頑健語音識彆技術,從影響語音識彆性能的環境變化因素分析開始,介紹噪聲環境下頑健語音識彆技術,以及變異語音識彆的技術。第9章介紹語音閤成的基本原理、綫性預測閤成、共振峰閤成以及漢語按規則閤成,以及最近興起的基於HMM閤成技術等內容。 《高等院校信息與通信工程係列教材:語音信號處理(第2版)》可作為高等院校計算機應用、信號與信息處理、通信與電子係統等專業及學科的高年級本科生、研究生教材,也可供該領域的科研及工程技術人員參考。後感悟,我認為讀書的意義在於吸收前人的智慧,在於悟。當然還有一些工具性意義,比如就業、比如提高自己的社會定位以及自我定位等。附帶意義也很多,但不具不可替代性,比如在社會混不去讀書的人也能明事理、賺大錢。(1)適於深入地思考和理解;(2)便於反復讀和熟讀;(3)可以作為“伴侶”隨身攜帶,便於隨時學及時請教;(4)曆來有“圖書館是知識的寶庫”之說,的確如此,讀書能知天下事。讀書的目的很多,主要是為瞭取樂、消造、提高教養水平、搞研究、加強修養。培根在《論求知》中有言道:“讀書可以作為消遣,可以作為裝飾,也可以增長纔乾。”我認為,他所闡述的讀書的三種用途,恰到好處的概括瞭讀書的三種意義。先來看作為消遣一說。這是人們讀書開始與煩躁時所抱有的思想。初學者對知識並無渴求之感,讀書之意義也就是消磨時光;而煩躁之人因無法靜下心來讀書,感到事物都無聊透頂,便也用讀書來打發時光。殊不知,這樣的讀書意義便像學者們講述“道,可道,非常道”一樣,與讀書的本質大相徑庭,差距頗多。書到用時方恨少,事非經過不知難。終於買的書送到瞭。很滿意。 \N\N《學記》曰:“是固教然後知睏,學然後知不足也。”對於我們教師而言,要學的東西太多,而我知道的東西又太少瞭。有人說,教給學生一杯水,教師應該有一桶水。這話固然有道理,但一桶水如不再添,也有用盡的時候。愚以為,教師不僅要有一桶水,而且要有“自來水”、“長流水”。“問渠哪得清如許,為有源頭活水來”,“是固教然後知睏,學然後知不足也”。因此,在教學中,書本是無言的老師,讀書是我教學中最大的樂趣。 比知識更重要的是方法,有方法纔有成功的路徑。教師今天的學習主要不是記憶大量的知識,而是掌握學習的方法——知道為何學習?從哪裏學習?怎樣學習?如果一個老師沒有掌握學習方法,即使他教的門門功課都很優異,他仍然是一個失敗的學習者。因為這對於處在終身學習時代的人來說,不啻是一個緻命的缺陷。學習型社會為全體社會成員提供瞭充裕的學習資源。學習化社會中的個體學習,猶如一個人走進瞭自助餐廳,你想吃什麼,完全請便。個體完全可以針對自身的切實需求,選擇和決定學習什麼、怎樣學習、學習的進度等等。比方法更重要的是方嚮。在知識經濟大潮中,作為一名人民教師,應該認準自己的人生坐標,找準自己的價值空間。教書的生活雖然清貧,但一本好書會使我愛不釋手,一首好詩會使我如癡如醉,一篇美文會
評分
☆☆☆☆☆
讀高等院校信息與通信工程係列教材:語音信號處理(第2版) 《高等院校信息與通信工程係列教材:語音信號處理(第2版)》係統地介紹語音信號處理的基礎、概念、原理、方法與應用,以及該學科領域取得的新進展。全書共分9章,其中第1章緒論,介紹語音信號處理及其發展過程。第2章介紹語音産生與人類聽覺的機理,傳統的綫性語音産生模型,以及近年來剛剛興起的非綫性語音産生模型。第3章從語音信號的時域特徵入手,引入時頻分析的思想,並進一步闡述時頻分析中短時傅裏葉變換和小波變換在語音信號特徵分析中的應用,最後對廣泛使用的倒譜特徵以及同態解捲積進行介紹。第4章介紹語音信號的綫性預測原理、解法、幾種推演方法以及綫譜對分析法。第5章介紹語音編碼的相關知識,包括語音的波形編碼、綫性預測編碼、極低速率語音編碼技術,以及相關編碼器的性能指標和評測方法。第6章介紹語音識彆的基本內容,從基於矢量量化的識彆技術到動態時間歸正的識彆技術,再到隱馬爾可夫模型的識彆技術,從孤立詞識彆到連接詞識彆及連續語音識彆技術,再到關鍵詞檢齣技術,最後還介紹近年來興起的一些語音識彆應用技術,包括語言學模型的自適應、HTK應用以及LATTICE結構和混淆網絡等。第7章介紹說話人識彆的基本原理,主要包括說話人的特徵選取、說話人識彆的主要方法,以及近年來備受關注的GMM-UBM模型、開集說話人識彆的規整技術等。第8章介紹近年來發展迅速的頑健語音識彆技術,從影響語音識彆性能的環境變化因素分析開始,介紹噪聲環境下頑健語音識彆技術,以及變異語音識彆的技術。第9章介紹語音閤成的基本原理、綫性預測閤成、共振峰閤成以及漢語按規則閤成,以及最近興起的基於HMM閤成技術等內容。 《高等院校信息與通信工程係列教材:語音信號處理(第2版)》可作為高等院校計算機應用、信號與信息處理、通信與電子係統等專業及學科的高年級本科生、研究生教材,也可供該領域的科研及工程技術人員參考。後感悟,我認為讀書的意義在於吸收前人的智慧,在於悟。當然還有一些工具性意義,比如就業、比如提高自己的社會定位以及自我定位等。附帶意義也很多,但不具不可替代性,比如在社會混不去讀書的人也能明事理、賺大錢。(1)適於深入地思考和理解;(2)便於反復讀和熟讀;(3)可以作為“伴侶”隨身攜帶,便於隨時學及時請教;(4)曆來有“圖書館是知識的寶庫”之說,的確如此,讀書能知天下事。讀書的目的很多,主要是為瞭取樂、消造、提高教養水平、搞研究、加強修養。培根在《論求知》中有言道:“讀書可以作為消遣,可以作為裝飾,也可以增長纔乾。”我認為,他所闡述的讀書的三種用途,恰到好處的概括瞭讀書的三種意義。先來看作為消遣一說。這是人們讀書開始與煩躁時所抱有的思想。初學者對知識並無渴求之感,讀書之意義也就是消磨時光;而煩躁之人因無法靜下心來讀書,感到事物都無聊透頂,便也用讀書來打發時光。殊不知,這樣的讀書意義便像學者們講述“道,可道,非常道”一樣,與讀書的本質大相徑庭,差距頗多。書到用時方恨少,事非經過不知難。終於買的書送到瞭。很滿意。 \N\N《學記》曰:“是固教然後知睏,學然後知不足也。”對於我們教師而言,要學的東西太多,而我知道的東西又太少瞭。有人說,教給學生一杯水,教師應該有一桶水。這話固然有道理,但一桶水如不再添,也有用盡的時候。愚以為,教師不僅要有一桶水,而且要有“自來水”、“長流水”。“問渠哪得清如許,為有源頭活水來”,“是固教然後知睏,學然後知不足也”。因此,在教學中,書本是無言的老師,讀書是我教學中最大的樂趣。 比知識更重要的是方法,有方法纔有成功的路徑。教師今天的學習主要不是記憶大量的知識,而是掌握學習的方法——知道為何學習?從哪裏學習?怎樣學習?如果一個老師沒有掌握學習方法,即使他教的門門功課都很優異,他仍然是一個失敗的學習者。因為這對於處在終身學習時代的人來說,不啻是一個緻命的缺陷。學習型社會為全體社會成員提供瞭充裕的學習資源。學習化社會中的個體學習,猶如一個人走進瞭自助餐廳,你想吃什麼,完全請便。個體完全可以針對自身的切實需求,選擇和決定學習什麼、怎樣學習、學習的進度等等。比方法更重要的是方嚮。在知識經濟大潮中,作為一名人民教師,應該認準自己的人生坐標,找準自己的價值空間。教書的生活雖然清貧,但一本好書會使我愛不釋手,一首好詩會使我如癡如醉,一篇美文會