性能評価 〜音声非可逆圧縮編〜
 
 

■ まずは聞き比べ

 まずは、1曲聞き比べてみましょう。
 モロコ氏作曲の「強いぞ!ボスバトル」を、64kbpsで、MIO、MP3、WMAに圧縮してみました。
 
形式 ダウンロード 詳細
MIO形式 boss1.mio
(1,185,300 bytes)
ERINA-Libraryで圧縮したもの。
ミドルサイドステレオ使用。
ERINA-Library に付属の簡易プレイヤーや、WinAMPプラグインなどで聴くことができます。
MP3形式 boss1.mp3
(1,214,844 bytes)
64kbpsで圧縮できる良いMP3エンコーダーが手元になかったので、SCMPXの固定ビットレート・ジョイントステレオで64kbpsに圧縮。
固定ビットレートにしたのは、SCMPXの可変ビットレートのエンコーダーにはバグがあるのか、非常に音質が悪いため。
WMA形式 boss1.wma
(1,231,530 bytes)
Windows Media エンコーダーで、64kbpsに圧縮したもの。
聞くためには、コーデックをインストールする必要があります。

※この曲の著作権は、作曲者モロコ氏にあり、Entis-soft が管理しています。

 パッと聞き比べてすぐにわかると思いますが、MIOが一番音質がいいです。
 WMAもシンバルなどの高音がかなりひしゃげていますが、聞ける範囲の音質になっていると思います。
 MP3は完全に論外です。サンプルによっては比較的聞けるものもあるのですが、このサンプルでは、高周波成分が多いのが原因でしょうが、まったく論外です。
 MIOも音がひしゃげていないわけではないのですが、WMAほどではないです。

 
 
■ 歪み分析
 1kHz、4kHz、6kHz、8kHz、10kHzの正弦波を混合したサンプルを64kbps相当のパラメータで圧縮して、復元した波形を簡単なアナライジングプログラムを使って比較してみます。

 アナライジングプログラムは大まかに言うと、16ビットPCMフォーマットのWAVファイルを読み込み、その波形の一部を抽出し、離散コサイン変換を掛けて周波数特性を分析すると言うものです。
 ブロックの切れ目の特性を見る目的も含め、抽出するサンプルの位置と、離散コサイン変換の行列サイズは、2の累乗ではない数値になっています。
 詳細はソースをご覧ください。

アナライジングプログラム (125KB)
ソースコード(16KB)


 オリジナルの波形は以下のようになっています。

 縦軸は該当周波数帯のエネルギ、横軸は周波数をあらわしています。
 縦横ともに対数表示になっています。
 

 MP3の復元波形は以下のようになっています。
 エンコードはSCMPXで64kbps、ジョイントステレオを指定して圧縮しました。
 出来上がったファイルのサイズは、80,090バイトです。
 10kHz以上の成分がまったくオリジナルと異なっているのは、ローパスフィルタの影響と思われます。


 
 

 次に Ogg Vorbis の復元波形を見てみましょう。
 Ogg は、Lilithで、112kbpsを指定して圧縮しました。
 出来上がったファイルのサイズは、61,353バイトです。
 MP3より再現性が高いのですが、それは当然のことで、112kbpsだからでしょう。


 
 

 次にWMAの復元波形を見てみましょう。
 WMAは、Windows Media エンコーダで、64kbpsを指定して圧縮しました。
 出来上がったファイルのサイズは、84,766バイトです。
 MP3、Oggと比べると非常に再現性が高いです。


 
 

 最後にMIOの復元波形を見てみましょう。
 MIOは、1/20相当のパラメータで圧縮しました。
 出来上がったファイルサイズは、85,356バイトです。
 WMA同様、非常に再現性が高いのがわかります。


 

 

■ まとめ

 MP3には、エンコーダとしては古いSCMPXを利用していることや、MP3の得意としない低レート圧縮を行っていることもあり、際立って音質が悪いと言う結果になっています。
 MIOは低レートでは非常に高性能であることがわかります。
 WMAとは特性が異なりますが、MIOは低レートでWMAと同等かそれ以上の音質であると言えるでしょう。


 

Copyright (c) 2001 Leshade Entis. All rights reserved.