Loading...

日本キャステム

はじめに

VoIPで通話を行うためには音声をデジタル信号として取り扱う必要があります。A/D変換器とD/A変換器さえあればとりあえずデジタル化された音声をネットワーク上に流す事はできますが,情報量が多過ぎてすぐに破綻してしまうでしょう。
ネットワークの限られた帯域を効率良く利用するためには音声データの情報量を圧縮する音声コーデックが必要となります。 コーデックとは「エンコード(符号器) + デコード(復号器)」という意味の造語です。エンコーダは非圧縮の音声データから符号化されたデータを出力します。逆にデコーダは符号化されたデータから非圧縮の音声データを復元します。A/D変換器やD/A変換器の事をコーデックと呼ぶ場合もありますが,ここでは非圧縮音声データと符号データの変換部分を指すものとします。(図1)

(図1)コーデックの範囲

音声コーデックの場合,一般的なデータ圧縮(ZIPやLHAなど)と異なり,完全に元と同じデータは復元できません。音声が劣化するのと引き換えに高い圧縮率を得る事に主眼を置いているからです。(最近の楽音コーデックでは完全に復元するものもあります。)音声コーデックは入出力がデジタル・データなので,中身は全て数値演算処理(デジタル信号処理)になります。演算処理はハードウェアでもソフトウェアでも実現可能ですが,処理内容が非常に複雑なためソフトウェアでなければ実現出来ないようなものもあります。デジタル信号処理演算を高速に行うためのDSP(Digital Signal Processor)というプロセッサも多く使われます。 表1に主要な音声コーデックを示しました。 本章ではまず最初に音声コーデックの比較や選択を行う場合に考慮すべきポイントについて説明します。 次に音声コーデックの原理について説明します。特にVoIPで使用される事が多いITU-T G.723.1やG.729 Annex Aの基礎になっているCELP方式について詳しく解説します。 最後にITU-T勧告のG.711,G.723.1,G.726およびG.729 Annex Aの使用方法を説明します。

(表1)主要な音声コーデック

標準化組織/勧告番号 名称・方式 サンプリング周波数(kHz) ビットレート(kbit/s) フレーム長(msec) 原理遅延(msec) 品質(MOS) 主な用途
ITU-T
G.711
PCM 8 64 0.125 4.10 ISDN
ITU-T
G.723.1
MP-MLQ/
ACELP
8 6.3/5.3 30 37.5 3.9/3.65 VoIP
ITU-T
G.726
ADPCM 8 16/24/32/40 0.125 3.85 PHS
ITU-T
G.728
LD-CELP 8 16 0.625 0.625 3.85
ITU-T
G.729
CS-ACELP 8 8 10 15 3.92 PDC
ITU-T
G.729Annex A
CS-ACELP 8 8 10 15 3.7 VoIP
ARIB
STD-27
PSI-CELP 8 3.45 40 45 PDC
ARIB
STD-27
VCELP 8 6.7 20 PDC
ARIB
STD-27
ACELP 8 6.7 20 25 PDC
3GPP
GSM 06.10
RPE-LTP 8 13 20 3.5 GSM FR
3GPP
GSM 06.20
VSELP 8 5.6 20 3.5 GSM HR
3GPP
GSM 06.60
ACELP 8 12.2 20 25 GSM EFR
TIA
IS-54
VSELP 8 7.95 20 D-AMPS
TIA
IS-641
ASELP 8 7.4 20 25 D-AMPS
3GPP
TS 26.071
AMR 8 4.75/5.15/5.9/6.7/
7.4/7.95/10.2/12.2
20 20/25 3G
INMARSAT IMBE 8 4.15 20 船舶電話
DDVPC
FS-1016
CELP 8 4.8 30 105 軍用
DDVPC
FS-1015
LPC-10e 8 2.4 22.5 90 軍用
DDVPC MELP 8 2.4 22.5 45.5 軍用
ITU-T
G.722
SB-ADPCM 16 48/56/64 0.125 1.5
3GPP
TS 26.171ITU-T
G.722.2
AMR-WB 16 6.6/8.85/12.65/
14.25/15.85/18.25/
19.85/23.05/23.85
20 25

 

関連情報

音声/楽音コーデック製品

特許契約サポート