武漢大學優秀博士學位論文文庫:基於雙耳綫索的移動音頻編碼研究 [Research on Binaural Cues of Spatial Audio Coding in Mobile Applicat pdf epub mobi txt 電子書 下載
內容簡介
飛速發展的移動市場對高品質音頻業務的需求日益迫切,移動環境下音頻帶寬不足,終端資源有限,傳統音頻理論和技術麵臨新的挑戰。近年來,MPEG、ITU和AVS等國內外標準化組織積極推動移動音頻理論和技術研究。基於雙耳綫索的音頻編碼因其在低碼率下的音質優勢而備受關注,然而,為適應移動環境苛刻的應用需求,仍需剋服空間參數模型的理論缺陷,突破實變換域雙耳綫索錶示的技術瓶頸,解決空間參數碼率難以下降、係統復雜度偏高等問題。陳水仙編著的這本《基於雙耳綫索的移動音頻編碼研究》開展基於雙耳綫索的移動音頻編碼研究,在雙耳綫索感知機理分析、空間感知信息度量、MDCT域雙耳綫索錶示和空間音頻編碼係統結構設計這四個方嚮上取得瞭創新性成果。
在雙耳綫索感知機理分析方嚮,《武漢大學優秀博士學位論文文庫:基於雙耳綫索的移動音頻編碼研究》針對現有係統隻能去除聲道間數據客觀冗餘的不足,以巴剋頻帶為感知分析單元,開展瞭對雙耳綫索臨界感知JND的分析研究,提齣基於感知的雙耳綫索參數錶示模型,有效去除瞭聲道問數據的主觀冗餘信息,下降4.28%~11.78%的空間參數碼率,主觀測試MUSHRA得分平均提高2.6分,客觀測試ODG得分平均提高1.1分。
在空間感知信息度量方嚮,本書針對建立在單耳聽音模型上的感知熵理論無法度量雙耳空間感知信息量的問題,結閤雙耳綫索的感知機理,建立瞭基於雙耳綫索生理感知的BCPPM模型來模擬雙耳對空間信息的感知過程,提齣基於模型的空間感知熵SPE的計算方法,解決瞭雙耳空間感知信息量的度量問題,豐富和發展瞭空間音頻編碼技術的理論和實踐。
在MDCT域雙耳綫索錶示方嚮,本書針對MDCT實變換的相位信息缺失及能量抖動造成雙耳綫索錶示不準確的問題,采用基函數“和分離”技術,提齣瞭基於共軛窗函數的MDCT頻譜復數化擴展方法,並針對新方法引入MDST帶來復雜度增加的問題,提齣瞭基於轉換矩陣稀疏性的MDCT-MDST快速轉換算法,同時利用轉換矩陣的正交性和循環性,將復雜度從O(N*2)下降到O(N),主觀測試MUSHRA得分平均提高2.07分,客觀ODG得分平均提高0.4281分。
在空間音頻編碼係統結構設計方嚮,本書針對空間信息和下混信息分離處理模式導緻的係統復雜度高和延時長的問題,采用濾波復用和並行處理的技術,提齣並行濾波共享的分析綜閤ABS編碼結構,去除瞭空間參數編碼與下混聲道編碼中的冗餘操作,縮短瞭5%的係統延時,減少瞭38%~86%的運算復雜度。
本書在基礎理論和關鍵技術方麵的研究成果可望成為國內移動音頻標準的支撐技術,增強我國在高速成長的全球移動音頻産業中的核心競爭力,為全麵參與移動音頻編解碼領域的國際競爭和標準化工作奠定堅實的研究基礎。
作者簡介
陳水仙,女,2011年畢業於武漢大學計算機學院計算機應用技術專業,獲博士學位。論文獲湖北省優秀博士學位論文奬。現在中國科學院信息工程研究所工作。
目錄
第1章 緒論
1.1 研究背景和意義
1.2 國內外研究現狀
1.2.1 冗餘信息去除技術
1.2.2 感知信息度量方法
1.3 麵臨的關鍵問題
1.3.1 空間參數主觀冗餘難以去除
1.3.2 MDCT域空間參數分析睏難
1.4 主要工作和全文組織結構
1.4.1 主要工作
1.4.2 全文組織結構
第2章 雙耳綫索的特徵分析與錶示
2.1 引言
2.2 雙耳綫索的特徵分析實驗係統
2.2.1 特徵分析實驗係統設計
2.2.2 雙耳綫索臨界感知的頻率依賴性
2.2.3 雙耳綫索的統計分布特性
2.3 編碼係統中的雙耳綫索編碼實現
2.3.1 基於頻率感知的參數集選取
2.3.2 基於頻率感知的參數量化和熵編碼
2.4 實驗與性能分析
2.4.1 參數碼率分析與比較
2.4.2 主觀性能分析與比較
2.4.3 客觀性能分析與比較
2.5 本章小結
第3章 雙耳綫索感知信息的度量
3.1 引言
3.2 基於雙耳聽音的生理感知模型構建
3.2.1 空間信息的物理層錶示
3.2.2 空間信息的生理感知
3.2.3 雙耳綫索生理感知模型BCPPM
3.3 基於BCPPM模型的空間感知熵計算
3.3.1 空間感知熵的定義
3.3.2 臨界頻帶濾波單元
3.3.3 雙耳綫索計算單元
3.3.4 有效感知量計算單元
3.4 實驗與性能分析
3.4.1 立體聲序列的信息量估算方法對比
3.4.2 不同序列SPE數值的差異分析
3.4.3 同一序列SPE隨時間的變化分析
3.5 本章小結
第4章 MDCT域雙耳綫索的分析與閤成
4.1 引言
4.2 基於共軛窗函數的MDcT復數化擴展
4.2.1 雙耳綫索的形成機理
4.2.2 MDCT頻譜對雙耳綫索的影響:
4.2.3 基於共軛窗函數的MDCT復數化擴展
4.2.4 實驗與性能分析
4.3 基於C2S轉換的雙耳綫索分析
4.3.1 MDCT-MDST快速轉換
4.3.2 C2S轉換矩陣的稀疏化近似
4.3.3 CMCLT域的雙耳綫索錶示
4.4 實驗與性能分析
4.4.1 主觀性能分析與比較
4.4.2 客觀性能分析與比較
4.5 本章小結
第5章 基於閤成分析的空間音頻編碼結構
5.1 引言
5.2 空間音頻編碼係統的基礎操作模塊
5.2.1 聲源分離模塊
5.2.2 下混/上混模塊
5.2.3 空間參數分析模塊
5.2.4 係統結構的優缺點
5.3 並行濾波共享的ABS編碼結構
5.3.1 頻帶劃分對空間信息分析的影響
5.3.2 ABS編碼結構設計
5.3.3 並行結構下的濾波共享
5.4 實驗與性能分析
5.4.1 係統延時分析
5.4.2 計算復雜度分析
5.4.3 係統性能分析
5.5 本章小結
第6章 總結與展望
6.1 研究工作總結
6.2 研究展望
參考文獻
緻謝
附錄
前言/序言
武漢大學優秀博士學位論文文庫:基於雙耳綫索的移動音頻編碼研究 [Research on Binaural Cues of Spatial Audio Coding in Mobile Applicat 下載 mobi epub pdf txt 電子書
武漢大學優秀博士學位論文文庫:基於雙耳綫索的移動音頻編碼研究 [Research on Binaural Cues of Spatial Audio Coding in Mobile Applicat pdf epub mobi txt 電子書 下載