市村学術賞

第45回 市村学術賞 功績賞 -02

高次統計量追跡に基づくブラインド音声抽出およびその高品質化

技術研究者

奈良先端科学技術大学院大学 情報科学研究科
准教授 猿渡  洋

推  薦 奈良先端科学技術大学院大学

研究業績の概要

 音声メディアに基づくヒューマンインターフェイス技術は、その普遍性により様々な応用が期待されている。しかし、実環境においては、目的の音声だけでなく雑多な妨害音が同時に観測され、出力音の大幅な品質劣化を招く。これを解決するため、独立成分分析(independent component analysis: ICA)に基づくブラインド音源分離が盛んに研究されている。これは、音環境やマイク位置等の事前情報を一切使用せず、個々の源信号を逆推定する理論である。しかし一方で、受賞者が研究を開始した1998年当時、ICAは単なる数理最適化理論の一つにすぎず、その挙動を解析的かつ実証的に解明したものは見当たらなかった。
 受賞者は、まず、ICAと空間音響学の関連を世界で初めて解明し、その相補性を生かした高速アルゴリズムに基づくハードウェアの実装に成功した。次に、ICAにおける装置規模の壁(n音を分解するにはn個以上のマイクが必要となり非実用的)を打破するため、「音声とその他」という2分類問題に帰着させることを着想した。ここでは、ICAを高次元の相関行列同時対角化問題ととらえ、その数理解析結果からICAは人の声「以外」の音の推定に優れていることを証明し、ICAを雑音推定器とする非線形音声抽出処理を考案した。また、その非線形処理歪みを低減するため、高次統計量に基づく聴覚印象定量化理論を提案し、非線形系における4次統計量(カートシス)比の不動点が品質最良状態を与えることを証明した。
 本研究では、世界で初めて、小規模ハードウェア上にリアルタイムICAを実装するアルゴリズムが実現され、それが世界音源分離コンテスト(IEEE国際会議MLSP2007)にて一等賞を受賞した。また本理論を拡張した非線形ICAが、2008年に警察備品として採用・量産化された。更に、世界で初めて高次統計量と人間の聴覚品質劣化との関係が明らかになり、非線形処理部における最適なパラメータの導出や、全く聴覚品質劣化の無い処理が実現された。以上の成果は世界にインパクトを与え、今後のメディア処理技術への寄与が期待される。

図1

図2