發表於2024-12-23
BF:基於雙耳綫索的移動音頻編碼研究 陳水仙 武漢大學齣版社 9787307123182 pdf epub mobi txt 電子書 下載
基本信息
書名:基於雙耳綫索的移動音頻編碼研究
定價:26.00元
售價:20.5元
作者:陳水仙
齣版社:武漢大學齣版社
齣版日期:2014-01-01
ISBN:9787307123182
字數:
版次:1
裝幀:平裝
開本:16開
編輯推薦
內容提要
飛速發展的移動市場對高品質音頻業務的需求日 益迫切,移動 環境下音頻帶寬不足,終端資源有限,傳統音頻理論 和技術麵臨新 的挑戰。近年來,MPEG、ITU和AVS等國內外標準化組 織積極推 動移動音頻理論和技術研究。基於雙耳綫索的音頻編 碼因其在低碼 率下的音質優勢而備受關注,然而,為適應移動環境 苛刻的應用需 求,仍需剋服空間參數模型的理論缺陷,突破實變換 域雙耳綫索錶 示的技術瓶頸,解決空間參數碼率難以下降、係統復 雜度偏高等問 題。陳水仙編著的這本《基於雙耳綫索的移動音頻編 碼研究》開展基於雙耳綫索的移動音頻編碼研究,在 雙耳綫索感知 機理分析、空間感知信息度量、MDCT域雙耳綫索錶示 和空間音頻 編碼係統結構設計這四個方嚮上取得瞭創新性成果。
在雙耳綫索感知機理分析方嚮,《基於雙耳綫索 的移動音頻編碼研究》針對現有係統隻能去除聲 道間數據客觀冗餘的不足,以巴剋頻帶為感知分析單 元,開展瞭對 雙耳綫索臨界感知JND的分析研究,提齣基於感知的 雙耳綫索參 數錶示模型,有效去除瞭聲道問數據的主觀冗餘信息 ,下降 4.28%~11.78%的空間參數碼率,主觀測試MUSHRA 得分平均提 高2.6分,客觀測試ODG得分平均提高1.1分。
在空間感知信息度量方嚮,本書針對建立在單耳 聽音模型上的 感知熵理論無法度量雙耳空間感知信息量的問題,結 閤雙耳綫索的 感知機理,建立瞭基於雙耳綫索生理感知的BCPPM模 型來模擬雙 耳對空間信息的感知過程,提齣基於模型的空間感知 熵SPE的計 算方法,解決瞭雙耳空間感知信息量的度量問題,豐 富和發展瞭空 間音頻編碼技術的理論和實踐。
在MDCT域雙耳綫索錶示方嚮,本書針對MDCT實變 換的相 位信息缺失及能量抖動造成雙耳綫索錶示不準確的問 題,采用基函 數“和分離”技術,提齣瞭基於共軛窗函數的MDCT頻 譜復數化擴 展方法,並針對新方法引入MDST帶來復雜度增加的問 題,提齣瞭 基於轉換矩陣稀疏性的MDCT-MDST快速轉換算法,同 時利用轉換 矩陣的正交性和循環性,將復雜度從O(N*2)下降到O (N),主觀測 試MUSHRA得分平均提高2.07分,客觀ODG得分平均提 高 0.4281分。
在空間音頻編碼係統結構設計方嚮,本書針對空 間信息和下混 信息分離處理模式導緻的係統復雜度高和延時長的問 題,采用濾波 復用和並行處理的技術,提齣並行濾波共享的分析綜 閤ABS編碼 結構,去除瞭空間參數編碼與下混聲道編碼中的冗餘 操作,縮短瞭 5%的係統延時,減少瞭38%~86%的運算復雜度。
本書在基礎理論和關鍵技術方麵的研究成果可望 成為國內移動音頻標準的支撐技術,增強我國在高速 成長的全球移動音頻産業中 的核心競爭力,為全麵參與移動音頻編解碼領域的國 際競爭和標準 化工作奠定堅實的研究基礎。
目錄
第1章 緒論
1.1 研究背景和意義
1.2 國內外研究現狀
1.2.1 冗餘信息去除技術
1.2.2 感知信息度量方法
1.3 麵臨的關鍵問題
1.3.1 空間參數主觀冗餘難以去除
1.3.2 MDCT域空間參數分析睏難
1.4 主要工作和全文組織結構
1.4.1 主要工作
1.4.2 全文組織結構
第2章 雙耳綫索的特徵分析與錶示
2.1 引言
2.2 雙耳綫索的特徵分析實驗係統
2.2.1 特徵分析實驗係統設計
2.2.2 雙耳綫索臨界感知的頻率依賴性
2.2.3 雙耳綫索的統計分布特性
2.3 編碼係統中的雙耳綫索編碼實現
2.3.1 基於頻率感知的參數集選取
2.3.2 基於頻率感知的參數量化和熵編碼
2.4 實驗與性能分析
2.4.1 參數碼率分析與比較
2.4.2 主觀性能分析與比較
2.4.3 客觀性能分析與比較
2.5 本章小結
第3章 雙耳綫索感知信息的度量
3.1 引言
3.2 基於雙耳聽音的生理感知模型構建
3.2.1 空間信息的物理層錶示
3.2.2 空間信息的生理感知
3.2.3 雙耳綫索生理感知模型BCPPM
3.3 基於BCPPM模型的空間感知熵計算
3.3.1 空間感知熵的定義
3.3.2 臨界頻帶濾波單元
3.3.3 雙耳綫索計算單元
3.3.4 有效感知量計算單元
3.4 實驗與性能分析
3.4.1 立體聲序列的信息量估算方法對比
3.4.2 不同序列SPE數值的差異分析
3.4.3 同一序列SPE隨時間的變化分析
3.5 本章小結
第4章 MDCT域雙耳綫索的分析與閤成
4.1 引言
4.2 基於共軛窗函數的MDcT復數化擴展
4.2.1 雙耳綫索的形成機理
4.2.2 MDCT頻譜對雙耳綫索的影響:
4.2.3 基於共軛窗函數的MDCT復數化擴展
4.2.4 實驗與性能分析
4.3 基於C2S轉換的雙耳綫索分析
4.3.1 MDCT-MDST快速轉換
4.3.2 C2S轉換矩陣的稀疏化近似
4.3.3 CMCLT域的雙耳綫索錶示
4.4 實驗與性能分析
4.4.1 主觀性能分析與比較
4.4.2 客觀性能分析與比較
4.5 本章小結
第5章 基於閤成分析的空間音頻編碼結構
5.1 引言
5.2 空間音頻編碼係統的基礎操作模塊
5.2.1 聲源分離模塊
5.2.2 下混/上混模塊
5.2.3 空間參數分析模塊
5.2.4 係統結構的優缺點
5.3 並行濾波共享的ABS編碼結構
5.3.1 頻帶劃分對空間信息分析的影響
5.3.2 ABS編碼結構設計
5.3.3 並行結構下的濾波共享
5.4 實驗與性能分析
5.4.1 係統延時分析
5.4.2 計算復雜度分析
5.4.3 係統性能分析
5.5 本章小結
第6章 總結與展望
6.1 研究工作總結
6.2 研究展望
參考文獻
緻謝
附錄
作者介紹
陳水仙,女,2011年畢業於武漢大學計算機學院計算機應用技術專業,獲博士學位。論文獲湖北省博士學位論文奬。現在中國科學院信息工程研究所工作。
文摘
序言
BF:基於雙耳綫索的移動音頻編碼研究 陳水仙 武漢大學齣版社 9787307123182 pdf epub mobi txt 電子書 下載