Loading...

日本キャステム

広帯域音声コーデックG.722

ITU-T G.722はCCITT勧告書(Blue Book)にも記載されている、とても歴史の有る広帯域音声コーデックです。
一般の電話音声が3.4kHz帯域であるのに対して、7kHzまでの音声を扱えるため「広帯域」と呼んでいます。

古い規格ではありますが意外に使い勝手が良く、そこそこの圧縮率で処理が軽く、広帯域音声が必要な用途には現役で使われています。
音声以外の信号(音楽など)が扱えるという魅力も有ります。例えば、ちょっとBGMを流したりするのには最適だと思います。

そんなG.722ですが、先日ITU-Tのサイトを見たら大幅な拡張がされていて驚きました。

  • 基本的な音質改善
  • さらに広帯域化(14kHz帯域)
  • 音声ビット長アップ
  • ステレオ化
  • 浮動小数点バージョン
  • PLC

すごいのは全て上位互換で作られていて、例えば「14kHz帯域、ステレオ」で圧縮されたコードデータが、元祖G.722(7kHz帯域、モノラル)で再生出来てしまう所です。
浮動小数点バージョンが有るのでパソコンでも簡単に処理が出来たり、PLCでIP伝送におけるパケットロス対策も出来るようになりました。
これから増々用途が増える気がします。
以下にポイントをまとめておきましたので、ご参照下さい。

G.722(オリジナル)

音声帯域:50Hz〜7kHz(16kHzサンプリング)
ビットレート:64kbit/s、56kbit/s、48kbit/s

音声:モノラル、14ビット
固定小数点演算

Annex A – Testing signal-to-total distortion ratio for 7 kHz audio-codecs at 64 kbit/sRecommendation ITU-T G.722 connected back-to-back.

G.722(標準、64kbit/s)でエンコード/デコードした際の歪を評価するためのテストデータ

Annex B – Superwideband embedded extension for ITU-T G.722

音声帯域:50Hz〜7kHz(16kHzサンプリング)
ビットレート:64kbit/s、56kbit/s

音声帯域:50Hz〜14kHz(32kHzサンプリング)
ビットレート:96kbit/s、80kbit/s、64kbit/s、

音声:モノラル、16ビット
固定小数点演算

Annex C – Floating-point implementation of ITU-T G.722 Annex B

Annex Bの浮動小数点バージョン

Annex D – Stereo embedded extension for ITU-T G.722

ステレオ拡張

音声帯域:50Hz〜7kHz(16kHzサンプリング)
ビットレート:80kbit/s、64kbit/s

音声帯域:50Hz〜14kHz(32kHzサンプリング)
ビットレート:128kbit/s、112kbit/s、96kbit/s、80kbit/s

音声:ステレオ、16ビット
固定小数点演算

Annex E – An alternative implementation of stereo superwideband extension using floating point

Annex Dの浮動小数点バージョン

Appendix

Appendix I – Networking aspects
Appendix II – Digital test sequences
Appendix III – A high-quality packet loss concealment algorithm for ITU-T G.722
Appendix IV – A low-complexity algorithm for packet-loss concealment with ITU-T
Appendix V – Mid-side stereo coding