はじめに
MP3がCDに比べて音質が悪いという話を聞いたことがある方も多いと思います。オーディオインターフェース(サウンドカードやUSB DACなど)の説明を読むとなんかデジタルでも音が劣化するようなことも書いてあります。でも、デジタルは1と0の世界。音が劣化することなんてあるのでしょうか。
ここでは、『データ圧縮技術』の部分と『データ伝送技術』の部分でデジタルでの音質の劣化についてお話ししたいと思います。
デジタルデータの圧縮
可逆圧縮と不可逆圧縮
まずCDは自然界にあるアナログの音を16bit/44.1kHzというスペックでデジタル化したものです。CDやWAVE(*.wav)などはこのデータで、データ量を減らす『圧縮』をしていない『未圧縮』のデータです。MP3はこの『未圧縮』のデータを様々な方法でデータ量を減らす処理を行ってファイルの容量を減らしています。この処理のことを『エンコード』とか『圧縮』などと呼ばれており、その方式によってMP3(*.mp3)の他にもAAC(*.aac)やFlac(*.flac)などがあります。
『圧縮』の方法には大きく分けて2つあります。
- 『可逆圧縮』 ・・・ 再生時に完全に元に戻せる圧縮
- 『非可逆圧縮』 ・・・元の音に近いが元には戻らない圧縮
イメージするなら書類を整理するときに、重要度に応じてファイルを取捨選択していらない書類は思い切って捨ててしまう方法が『非可逆圧縮』、全ての書類を残しつつ効率良くコンパクトに収納したのが『可逆圧縮』です。
『非可逆圧縮』でも大事な書類はちゃんと残しているのでほとんど問題無いですが、捨ててしまった書類は読むことはできません。『可逆圧縮』はすべての書類を読むことができますが、どんなに頑張っても量は『非可逆圧縮』に比べて大きくなってしまします。
『非可逆圧縮』の『MP3』では128kbpsくらいがよく使われていましたが、これは元のデータの約1/10です。最近では256kbpsや320kbpsなども多くなっていますが、それでも1/4程度の容量です。これに対して『可逆圧縮』の『flac』ではだいたい1/2程度の容量までしか圧縮することができません。
また、『非可逆圧縮』のフォーマットは『MP3』や『AAC』などが一般的なフォーマットとして定着しており、ほとんどの再生ソフトやポータブルプレーヤーが『MP3』や『AAC』に対応していますが、『可逆圧縮』に関しては標準と言えるものがなく、ポータブルプレーヤーで聴く場合は『MP3』や『AAC』に再度エンコードする必要があることも多いなどの課題もあります。
種類 | サイズ | 音質 | 使い勝手 |
---|---|---|---|
『未圧縮』 | △ | ◎ | ○ |
『可逆圧縮』 | ○ | ◎ | △ |
『非可逆圧縮』 | ◎ | △ | ◎ |
非可逆圧縮はその方式によって、同じビットレート(ファイルサイズ)でも音質が異なるのはもちろん、実は同じ圧縮方式でもエンコーダーによって音質が変わります。上の例で言えば取捨選択する基準が人によって異なるのと同じで、どこを重視するかはエンコーダーの設計した人の思想や方針によって異なるからです。
圧縮方式
名称 | 拡張子 | 種類 | 特徴 |
---|---|---|---|
WAV | wav | 未圧縮 | 未圧縮データ |
Monkey's Audio | ape | 可逆 | 古参の可逆圧縮方式。フリーウェアだがオープンソースではない。 |
flac | flac | オープンソースで広く使われている。Oggプロジェクトに参加。 エンコード/デコードが速い。 |
|
tta | flac | オープンソース。ハードウェア実装が容易なハズだが肝心な製品はあまりないと思う。 | |
tak | tak | エンコード/デコードが速く圧縮率も高い。フリーウェアだがオープンソースではない。 | |
Apple Lossless | m4a | APPLEの規格だったがオープンソース化された。通称ALAC。 | |
ATRAC Advanced Lossless | aa3/oma | SONYの規格で、最近ではあまり使われていない。 | |
MP3 | mp3 | 非可逆 | 古参でもっとも広く普及している可逆圧縮方式。ハードウェアの対応も最も進んでいる。 |
AAC | m4a/aac | MP3の後継(その成立ちも)。ハードウェアの対応も進んでいて、原理的には同じビットレートならMP3より良いハズ。 | |
ogg Vorbis | ogg | MP3のライセンス料を回避するため登場、同程度の性能でライセンスフリー。MP3が定着した後だったのであまり普及していない。 | |
ATRAC3 | aa3/oma | SONYの規格で、最近ではあまり使われていない。 |
ビットレート
ビットレートとは1秒あたりのデータ量で、ビットレートと曲の長さでファイルの大きさが決まります。ちなみにCDは44.1kHz×16bit×2ch(ステレオ)なので1411kbpsということになります。(bps=bit per second)
ビットレートは大きく分けて2種類あります。
- CBR (Constant Bit Rate) 固定ビットレート … ファイル容量が予測しやすい、プログラムで扱い易い。
- VBR (Variable Bit Rate) 可変ビットレート … 同じ容量なら音質が良くなり、同じ品質なら容量が小さくなる。
例えば毎日1回ある会議の議事録を纏めるとします。1回あたりのページ数を決めるのがCBRで、2ページと決めたら1ヶ月に60枚ぐらいと予想できるので保存するバインダーの選択や過去の議事録の検索はやりやすくなります。しかし、『部長のありがたい雑談が8割の会議』と『重要案件が10個も決まった会議』が同じ2ページですから無駄や紙面不足が発生してしまいます。そこで、会議の内容によってページ数を変えるのがVBRというわけです。
また、VBRの中にABR(Average Bit Rate)とよばれるものがあり、これは平均が指定したビットレート程度になるように調整する方式で、VBRながらファイルの容量が予測しやすくなります。上の例でいけば議事録をつけずに1ヶ月くらい会議のメモを残して、1ヶ月の議事録の合計が60ページになるように割り振って纏めるというわけです。
以前は容量も重要でしたし、VBRはプログラムが複雑になるのでプレーヤーによっては対応していない場合もありましたが、最近ではHDDなどのストレージ容量も大きく増えて楽曲データの容量などをチマチマ気にしなくてもよいようになりましたし、プレーヤーの対応も進んでいるのでVBRがおすすめです。
デジタルデータの転送
データの劣化
一般的にはデジタルデータの転送は劣化しないと考えて良いものです。だってそうでなければ困ります。音楽ならばちょっと音質が悪くなるくらいで済みますが、メールの内容が変わったり、銀行の基幹システムで数値が1ケタ減ったりしたら、それこそシャレになりません。22世紀になっても郵便屋さんが大繁盛して、みんなタンス預金です。
もちろん、デジタルデータの転送も現実の世界ではアナログの信号としてやりとりされています。アナログの信号ですから劣化もしますが、強力なエラー訂正機能やエラー検出機能を使ってチェックをして、もし問題があれば訂正するか、再度データを転送させるか、それができなければエラーとして通信を中断します。したがって転送に成功した場合は、劣化のないデータが得られたと考えて良いのです。
ですから、PCからUSBの外付けHDDに音楽データをコピーしても劣化はしません。仮にHDDやケーブルの調子が悪くてエラーが発生しても、ファイルの書き込みに失敗することはあっても、音質が悪くなるようなことはありません。
しかし、用途によっては多少データが劣化しても途切れなくスムーズにデータ転送した方が良い場合もあります。例えば音楽CDの再生や地デジの放送などは、エラーとして中断してしまうよりも適当にゴマかしてでも再生を継続する方が望ましいものです。
USBでは双方の用途に対応するため複数の転送モードをもっており、前者のように正確なデータ転送を行うモードを『バルク転送』と呼び、後者のように途切れなくスムーズに伝送を行うモードを『アイソクロナス転送』と呼びます。ちなみに、他にUSBをコントロールする信号を送る『コントロール転送』や少量のデータを最優先に送る『インタラプト転送』(キーボードやマウス用)というモードがあります。バルクと聞くと安いけど品質はマチマチなイメージがあるのは自作マニアだけでしょうか(笑)。
オーディオインターフェースは一般的には『アイソクロナス転送』モードを使います。このモードは途切れなく一定量のデータを伝送するためのモードで、エラーを検出しても再度データを送ってもらうような処理をせずに転送を継続することを優先させるので、結果的にデータが劣化する可能性があるのです。
ですから、同じようにUSBの先についている機器でも、HDDとオーディオインターフェースは通信モードが異なり、オーディオインターフェースでは、デジタルでも劣化がありうるというということになるのです。
タイミング(クロック)の劣化 [ジッター]
実はデジタルデータの転送ではデータ自身の他にタイミングの劣化も考えられます。デジタル化された音をリアルタイムに伝送する場合、データはデジタルでも、そのタイミングはアナログ的な点が重要です。
たとえば、『ジャン』という音が1秒鳴ったとします。この信号が正確に伝わったとしても、2秒で鳴らしたらメチャクチャな音になります。もちろん、そうならないようにクロックとよばれる信号でタイミングをとっているのですが、これがわずかですが、伸びたり縮んだりすることで音が訛ってしまうのです。これを業界(?)ではジッターと呼びます。ここテストにでます、じゃなくて、よくPCオーディオの本とかオーディオ機器の説明にでてます。このタイミングのズレは少なければ少ないほど原音に忠実になるので、ジッターが少ない=低ジッターは高音質ということになります。
ただし、PCからUSBのオーディオインターフェースまでの転送でジッター自体が存在しても、それはUSB転送のクロックに関するジッターであって、音を再生するクロック(つまりサンプリングレート)とは別です。このデータはオーディオインターフェースで作られたクロック(サンプリングレート)を使ってアナログの『音』に変換されて再生されるため、USB転送時のジッターは処理落ちさえしなければ原理的には音質に影響しないと言えます。
オーディオインターフェースにもジッターという言葉がでてきますが、これは再生するチップが正確なタイミングを作ることができるかという部分に関してです。つまり、どんなに正確なデジタルデータであっても、再生する時にテキトーなタイミングで音を鳴らしたのでは音質もイマイチになってしまうというワケです。
※厳密には、USB転送時のジッターやPCからのノイズがオーディオインターフェースで生成するタイミングに影響することがあり、これがUSB転送時のジッターや可逆圧縮のデコード時のノイズが音質の劣化につながっていると言われるゆえんのようです。しかし、これらはオーディオインターフェースのタイミング生成に影響を与えているのであって、直接音を劣化させているわけではないということは重要で、オーディオインターフェースの作りによって影響の受け方が変わるということでもあります。