Audacityで高品質のダウンサンプリング手法
--------------------------------------------------------
「疑似ハイレゾ音源」の最新バージョンの紹介記事です。
疑似ハイレゾ音源の最新バージョン
http://r1rawd.cocolog-nifty.com/blog/2020/12/post-40adca.html
--------------------------------------------------------
アマチュアバンドも録音機器の進歩でハイレゾレコーディングが当たり前になってきていて
録音・編集は96/192KHz・24bitのハイレゾで行うが、自主制作のCD作成用に44.1KHz・16bitや
配信用の44.1KHzのmp3などにダウンサンプリングしているのが現状で、まだハイレゾのままで
聞いてもらうニーズは少ないようです。
この時、ハイレゾ音源からのダウンサンプリングは下記の方法で行われていると思います。
WAV 96KHz・24bit → WAV 44.1KHz・16bit / mp3 44.1KHz 192kbpsぐらい
WAV 192KHz・24bit → WAV 44.1KHz・16bit / mp3 44.1KHz 192kbpsぐらい
この方法で出来上がったCDを実際に演奏された方が聞いて、「何か違うなー」 と感じていたら
正解かもしれません。
実は上の方法の1回で44.1KHz/16bitにダウンサンプリングを行うと音質が低下するんです!
ハイレゾ感は22.1KHz以上の音をカットしてしまうので残すことはできませんが、「生の音感」は
ダウンサンプリング時にもうひと手間かけるだけで音質劣化を最低限に押さえる方法があります。
その方法とは、アップサンプリング/ダウンサンプリングを組み合わせて3段階の変換を行うこと。
① 96KHz・24bit の場合
96KHz/24bit → 384KHz/64bit float → 352.8KHz/64bit float → 44.1KHz/16bit
② 192KHz・24bit の場合
192KHz/24bit → 384KHz/64bit float → 352.8KHz/64bit float → 44.1KHz/16bit
※Audacityの品質設定:サンプル形式 32bit float、ディザリング矩形 に設定。
ディザリングの方法は好みで選んでください。
このやり方で行うと、1回のダウンサンプリングで44.1KHz/16bitに落とした時の音質の劣化感
・ボーカルが膨らむ ・ギターなどの輝きがなくなる ・ドラムのアタック感がなくなる
などの「生の音感」の劣化が少なくなります。
実際の波形にもその変化は現れます。
下の図は、192KHz/24bitのハイレゾ音源を、通常と今回の3段階ダウンサンプリングした波形です。
1ch: 1回のダウンサンプリングで44.1KHz/16bitに変換
2ch: 今回の3段階のダウンサンプリングで44.1KHz/16bitに変換
(※1ch,2chの差異はグラフのレンジ(16bitの分機能65,536)では判別できません)
3ch: 1chから2chを引いた差分で波形(音)に違いがあれば、波形として現れます。
(※差分が、±1bit であったためグラフレンジに入れるため+84.3dB増幅しています)
変換方法が違うと波形の大きさに ±1bit の差異を生じており、16bitの波形の分機能65,536
に対して僅か±1bit の差異を耳で知覚できるのは少し驚きです!
ただ音の好みは人によるので、今回の「3段階でダウンサンプリング」は私が音質が良いと感じた
のであり、1回のダウンサンプリングの方が音がよいという方もいると思います。
テストしてみたところ、YouTubeにアップして再エンコードされた音声でもこの差がわかることが
確認されたので、192KHz/24bitの音源を2種類の方法で44.1KHz/16bitダウンサンプリングした
サンプル曲をアップしたので実際に聞いていただいて比較してみてください。
(※サンプル曲は著作権の関係で使える音源が無いので、192KHz/24bitの疑似ハイレゾ音源
を使っています。 ヒアリングではどちらも同じ変化だったので疑似ハイレゾをサンプル
音源としても問題のないことを確認しています)
Audacityで高品質のダウンサンプリング手法とその音質の比較
ビデオは
前半2分が、192KHz/24bit→44.1KHz/16bit
後半2分が、192KHz/24bit→384KHz/64bit float→352.8KHz/64bit float→44.1KHz/16bit
でダウンサンプリングしたサンプル曲を、YouTubeによるAACへの再エンコード時の音質劣化を
小さくするために、音声を44.1KHz/16bit WAV形式のAVI動画で上げています。
サンプル曲は、「デュオボーカル アッチカ」の自主製作CD 安穏譜より「元気で又逢えたね」
※曲の使用についてはアッチカのバンマス佐々木様より快く了解を頂きました。感謝!
デュオボーカル アッチカ
https://anrakuji.org/acchika
https://www.youtube.com/channel/UCBJUkSa3oDOPfJPl3UVHB_A
開発環境
PC:ノートパソコン dynabook T551/T6DB corei7-2670QM、8GB
HDD:外付け USB3.0 3TBx2台(データ用、作業ファイル用)(低価格の遅いHDD)
USB-DAC:エレコム EHP-AHR192GD (改造品)BRAVO-HD ASIO バッファ 5ms
ヘッドホン:オーディオテクニカ ATH-W1000 (改造品)
編集ソフト:Audacity 2.0.6 (波形補間が直線補間タイプのソフトはNGです)
最新バージョンは書き出しメニューが変更で使いづらいです。
再生ソフト:WaveSpectra V1.51 ASIOで再生 (音楽鑑賞・リファレンス用に使用)
ボリューム調整やEQ、リサンプリングなどの音質を劣化させる機能が一切ない
ので高音質再生ができます(音質はUSB-DACに依存)。
欠点はWAVとRF64形式しか再生できないことですが、4GB越えのハイレゾを
デコード時に音質劣化するFLACにすることなくRF64形式の非圧縮で高音質の
まま再生できます。
高音質設定(CPU負担小) ①FFT サンプルデータ数128,窓関数なし
②休止時間 500mms ③測定モード OFF ④ウィンドウ最小化
ヒアリング:8KHzまでしか聞こえない年相応の耳 (^^;
R1メモ
1) ダウンサンプリングの組み合わせと音質
1-1、96KHz/24bit→44.1KHz/16bit 品質・低
1-2、96KHz/24bit→88.2KHz/64f→44.1KHz/16bit ↓
1-3、96KHz/24bit→192KHz/64f→178.4KHz/64f→44.1KHz/16bit ↓
1-4、96KHz/24bit→384KHz/64f→352.8KHz/64f→44.1KHz/16bit 品質・高
2-1、192KHz/24bit→44.1KGz/16bit 品質・低
2-2、192KHz/24bit→178.4KHz/64f→44.1KHz/16bit ↓
2-3、192KHz/24bit→384KHz/64f→352.8KHz/64f→44.1KHz/16bit 品質・高
※編集にAudacityなどの内部演算32bit floatを使用できる場合は編集後の書き出しで
96/192KHz・32bit float or 64bit float で中間ファイル書き出してから44.1KHz
にダウンサンプリング操作を行うとより良い結果が得られると思います。
2) なぜこのような結果になったのか? (ブログ管理人R1の推定です)
48KHz系列(48/96/192/384KHz)から44.1KHz系列(44.1/88.2/176.4/352.8KHz)に変換する場合
時間軸が整数倍では無いので新たに非整数倍の時間軸に変換されます。
非整数倍の新しい時間軸上に補間で新しく生成されたbit値は
「新たな44.1KHz系の時間軸を中心に48KHz系をsinc関数で重みづけをした平均値」です。
(とイメージで考えています。三角関数で止まっているので数学的な突っ込みは無しです(^^;)
平均値の計算なら、水増し?データ数が多くてbit深度が深いほうが誤差が小さくなるのでは?
とやってみたら結果オーライが今回のブロブネタです。
※ここにもヒントがあるので参考にしてみてください。
CDからスタジオのハイレゾ・マスタリング音源を再現。
http://r1rawd.cocolog-nifty.com/blog/2019/04/post-4b51ee.html