前回の「4.音源再生のために用意するもの(アプリ編)」では、PCでオーディオ環境を整えていくアプリの条件を見ていきました。音源をそのアプリで再生するわけですが、PCで扱う音源のデータは基本的に圧縮されています。圧縮されていない状態だとデータのサイズが大きくなり、あっという間にストレージの容量を消費してしまうからです。この圧縮には大きく2つのパターンあります。可逆圧縮と非可逆圧縮です。後者は不可逆圧縮と表現されることもありますが。当サイトでは非可逆圧縮という言葉で扱います。
Contents
エンコードとデコード
PCオーディオの世界では、元の音源は主にパルス符号変調(PCM)という方式でデジタルデータ化されます。無圧縮の状態の音源データはリニアPCMという形式になります。
このままではデータの容量が大きいため、さらに圧縮を行います。これをエンコードと言い、エンコードを行うアプリのことをエンコーダーと言います。
実際に音源データを再生する場合は、これを元のデータに戻し再生を行います。元のデータに戻すことをデコード、それを行うアプリをデコーダーと言います。つまり、再生アプリにはデコーダーが入っているということになります。
可逆圧縮の音源ファイル
可逆圧縮の音源ファイルでは「デコードしたデータ」=「元のデータ」になります。つまり圧縮したデータの音質は、元のデータと同等になります。
音質が良い反面、音源ファイルのデータのサイズが大きく、ストレージの容量を多く消費するというデメリットがあります。元のデータからの圧縮比率は、40~60%程度になります。
可逆圧縮は元のデータからのロスがないため、ロスレスと呼ばれることも多いです。
可逆圧縮の音源ファイルの代表的な規格
可逆圧縮した音源ファイルでよく使われている規格を記載します。上のものほどよく使われています。
- Free Audio Lossless Codec (FLAC)
- Apple Audio Lossless Codec (ALAC)
- Monkey’s Audio (APE)
- WavPack (WV)
非可逆圧縮の音源ファイル
非可逆圧縮の音源ファイルでは「デコードしたデータ」≠「元のデータ」になります。しかもデコードしたデータの音質は元のデータから劣化しています。
これは音源ファイルをエンコードする過程によるもので、その過程において人間の聴覚上重要ではない音や気が付きにくい音をカットして圧縮しています。そのため元データからの圧縮比率は、10~20%程度になります。
聴覚上重要ではない音をカットしているものの、元のデータの音源と比べると音が薄っぺらく感じられます。あくまでも音源の概要をなぞった音質という表現が適切です。
非可逆圧縮は元のデータからのロスがあるため、ロッシーと呼ばれることも多いです。
非可逆圧縮の音源ファイルの代表的な規格
可逆圧縮した音源ファイルでよく使われている規格を記載します。上のものほどよく使われています。
- MPEG-1 Audio Layer 3 (MP3)
- Advanced Audio Coding (AAC)
- Windows Media Audio (WMA)
- Ogg Vorbis (OGG)
PCオーディオ環境では可逆圧縮推奨
PCオーディオ環境においては、可逆圧縮(ロスレス)の音源ファイルを扱うことを推奨します。
非可逆圧縮は、スマートフォンやポータブルプレイヤーで聴く環境では周囲の雑音などで音質の悪さはそれほど気にならないものですが、オーディオ環境のような腰を据えて静かな環境で聴く場合は音質の悪さが目立つためです。
また、ハードディスクが大容量化しているため、そこまで音源ファイルのサイズにこだわらなくて済む世の中になってきているため、それであれば最初から可逆圧縮で音源を扱うに越したことはありません。
次回予告
次回は、音源ファイルの基本スペックであるサンプリング周波数とビット数についてみていきます。
これをきちんと把握すると、音源ファイルのスペックを見ただけでどれだけ音が繊細に表現できるものなのかを理解できるようになります。
次回の記事:PCでオーディオ環境を整えるための第一歩:6.音源に関する理解(サンプリング周波数・ビット数)
コメントを残す