« 2019年10月 | トップページ | 2019年12月 »

2019年11月

2019年11月22日 (金)

Audacityで高品質のダウンサンプリング手法

--------------------------------------------------------
「疑似ハイレゾ音源」の最新バージョンの紹介記事です。

疑似ハイレゾ音源の最新バージョン
http://r1rawd.cocolog-nifty.com/blog/2020/12/post-40adca.html
--------------------------------------------------------

 アマチュアバンドも録音機器の進歩でハイレゾレコーディングが当たり前になってきていて
録音・編集は96/192KHz・24bitのハイレゾで行うが、自主制作のCD作成用に44.1KHz・16bitや
配信用の44.1KHzのmp3などにダウンサンプリングしているのが現状で、まだハイレゾのままで
聞いてもらうニーズは少ないようです。

この時、ハイレゾ音源からのダウンサンプリングは下記の方法で行われていると思います。

  WAV 96KHz・24bit → WAV 44.1KHz・16bit / mp3 44.1KHz 192kbpsぐらい
  WAV 192KHz・24bit → WAV 44.1KHz・16bit / mp3 44.1KHz 192kbpsぐらい

 この方法で出来上がったCDを実際に演奏された方が聞いて、「何か違うなー」 と感じていたら
正解かもしれません。
実は上の方法の1回で44.1KHz/16bitにダウンサンプリングを行うと音質が低下するんです!
ハイレゾ感は22.1KHz以上の音をカットしてしまうので残すことはできませんが、「生の音感」は
ダウンサンプリング時にもうひと手間かけるだけで音質劣化を最低限に押さえる方法があります。

その方法とは、アップサンプリング/ダウンサンプリングを組み合わせて3段階の変換を行うこと。

 ① 96KHz・24bit の場合

   96KHz/24bit → 384KHz/64bit float → 352.8KHz/64bit float → 44.1KHz/16bit

 ② 192KHz・24bit の場合

   192KHz/24bit → 384KHz/64bit float → 352.8KHz/64bit float → 44.1KHz/16bit

   ※Audacityの品質設定:サンプル形式 32bit float、ディザリング矩形 に設定。
    ディザリングの方法は好みで選んでください。


このやり方で行うと、1回のダウンサンプリングで44.1KHz/16bitに落とした時の音質の劣化感

 ・ボーカルが膨らむ ・ギターなどの輝きがなくなる ・ドラムのアタック感がなくなる

などの「生の音感」の劣化が少なくなります。

 実際の波形にもその変化は現れます。
下の図は、192KHz/24bitのハイレゾ音源を、通常と今回の3段階ダウンサンプリングした波形です。
 1ch: 1回のダウンサンプリングで44.1KHz/16bitに変換
 2ch: 今回の3段階のダウンサンプリングで44.1KHz/16bitに変換
    (※1ch,2chの差異はグラフのレンジ(16bitの分機能65,536)では判別できません)
 3ch: 1chから2chを引いた差分で波形(音)に違いがあれば、波形として現れます。
    (※差分が、±1bit であったためグラフレンジに入れるため+84.3dB増幅しています)

Hakei_102

 

 変換方法が違うと波形の大きさに ±1bit の差異を生じており、16bitの波形の分機能65,536
に対して僅か±1bit の差異を耳で知覚できるのは少し驚きです!

 ただ音の好みは人によるので、今回の「3段階でダウンサンプリング」は私が音質が良いと感じた
のであり、1回のダウンサンプリングの方が音がよいという方もいると思います。
テストしてみたところ、YouTubeにアップして再エンコードされた音声でもこの差がわかることが
確認されたので、192KHz/24bitの音源を2種類の方法で44.1KHz/16bitダウンサンプリングした
サンプル曲をアップしたので実際に聞いていただいて比較してみてください。
  (※サンプル曲は著作権の関係で使える音源が無いので、192KHz/24bitの疑似ハイレゾ音源
    を使っています。 ヒアリングではどちらも同じ変化だったので疑似ハイレゾをサンプル
    音源としても問題のないことを確認しています)

Audacityで高品質のダウンサンプリング手法とその音質の比較

 

 

 

 ビデオは
   前半2分が、192KHz/24bit→44.1KHz/16bit
   後半2分が、192KHz/24bit→384KHz/64bit float→352.8KHz/64bit float→44.1KHz/16bit
でダウンサンプリングしたサンプル曲を、YouTubeによるAACへの再エンコード時の音質劣化を
小さくするために、音声を44.1KHz/16bit WAV形式のAVI動画で上げています。


サンプル曲は、「デュオボーカル アッチカ」の自主製作CD 安穏譜より「元気で又逢えたね」
 ※曲の使用についてはアッチカのバンマス佐々木様より快く了解を頂きました。感謝!
  デュオボーカル アッチカ
  https://anrakuji.org/acchika
  https://www.youtube.com/channel/UCBJUkSa3oDOPfJPl3UVHB_A


開発環境

 PC:ノートパソコン dynabook T551/T6DB corei7-2670QM、8GB
 HDD:外付け USB3.0 3TBx2台(データ用、作業ファイル用)(低価格の遅いHDD)
 USB-DAC:エレコム EHP-AHR192GD (改造品)BRAVO-HD ASIO バッファ 5ms
 ヘッドホン:オーディオテクニカ ATH-W1000 (改造品)
 編集ソフト:Audacity 2.0.6 (波形補間が直線補間タイプのソフトはNGです)
       最新バージョンは書き出しメニューが変更で使いづらいです。
 再生ソフト:WaveSpectra V1.51 ASIOで再生 (音楽鑑賞・リファレンス用に使用)
       ボリューム調整やEQ、リサンプリングなどの音質を劣化させる機能が一切ない
       ので高音質再生ができます(音質はUSB-DACに依存)。
       欠点はWAVとRF64形式しか再生できないことですが、4GB越えのハイレゾを
       デコード時に音質劣化するFLACにすることなくRF64形式の非圧縮で高音質の
       まま再生できます。
         高音質設定(CPU負担小) ①FFT サンプルデータ数128,窓関数なし
         ②休止時間 500mms  ③測定モード OFF ④ウィンドウ最小化       
 ヒアリング:8KHzまでしか聞こえない年相応の耳 (^^;

 

R1メモ

1) ダウンサンプリングの組み合わせと音質

  1-1、96KHz/24bit→44.1KHz/16bit                   品質・低
  1-2、96KHz/24bit→88.2KHz/64f→44.1KHz/16bit             ↓
  1-3、96KHz/24bit→192KHz/64f→178.4KHz/64f→44.1KHz/16bit    ↓
  1-4、96KHz/24bit→384KHz/64f→352.8KHz/64f→44.1KHz/16bit  品質・高

  2-1、192KHz/24bit→44.1KGz/16bit                   品質・低
  2-2、192KHz/24bit→178.4KHz/64f→44.1KHz/16bit           ↓
  2-3、192KHz/24bit→384KHz/64f→352.8KHz/64f→44.1KHz/16bit  品質・高

  ※編集にAudacityなどの内部演算32bit floatを使用できる場合は編集後の書き出しで
   96/192KHz・32bit float or 64bit float で中間ファイル書き出してから44.1KHz
   にダウンサンプリング操作を行うとより良い結果が得られると思います。

2) なぜこのような結果になったのか? (ブログ管理人R1の推定です)
 48KHz系列(48/96/192/384KHz)から44.1KHz系列(44.1/88.2/176.4/352.8KHz)に変換する場合
時間軸が整数倍では無いので新たに非整数倍の時間軸に変換されます。
非整数倍の新しい時間軸上に補間で新しく生成されたbit値は
「新たな44.1KHz系の時間軸を中心に48KHz系をsinc関数で重みづけをした平均値」です。
(とイメージで考えています。三角関数で止まっているので数学的な突っ込みは無しです(^^;)
平均値の計算なら、水増し?データ数が多くてbit深度が深いほうが誤差が小さくなるのでは?
とやってみたら結果オーライが今回のブロブネタです。

  ※ここにもヒントがあるので参考にしてみてください。
     CDからスタジオのハイレゾ・マスタリング音源を再現。
     http://r1rawd.cocolog-nifty.com/blog/2019/04/post-4b51ee.html

| | コメント (0)

2019年11月11日 (月)

Audacityでモノラルを疑似ステレオにしてみた!

--------------------------------------------------------
「疑似ハイレゾ音源」の最新バージョンの紹介記事です。

疑似ハイレゾ音源の最新バージョン
http://r1rawd.cocolog-nifty.com/blog/2020/12/post-40adca.html
--------------------------------------------------------

 「風の谷のナウシカ」のDVDを久しぶりに見たのだが、なんと音声がモノラルであった
ことに初めて気が付いた。
音声はステレオという先入観と、モノラルにサラウンド効果をかけているようで今まで
ステレオ風に聞こえていて違和感が全くなかったのだ。 
今日まで気づかなかった私の耳はこんなもんです(^^;

でもなぜ、モノラル!
「風の谷のナウシカ」の映画が製作された1984年はまだステレオに移行の過渡期だったらしい。
モノラルだとわかると、ステレオで聞きたくなるのが人情。

 

 ということで、今回はモノラルの疑似ステレオ化を模索してみました。
試行錯誤の末、何とかステレオらしく聞こえる変換方法が見つかったので公開。

 

1、今回考え付いた、疑似ステレオ化の方法。

 ①疑似ステレオの仕組み

   低音をLch,高音をRch寄りに位相差で疑似的に定位
   遅延でステレオ幅を得る

 ②モノラル音源の加工方法

   Lch = Lch(モノラル)+
      Lchサラウンド(モノラルを加工)→(正相←Low(周波数)High→逆相)
                       +20ms遅延+ゲイン調整

   Rch = Rch(モノラル)+
      Rchサラウンド(モノラルを加工)→(逆相←Low(周波数)High→正相)
                       +20ms遅延+ゲイン調整

 ③ステレオ感の調整パラメーター

   1、正相・逆相のフィルタリングを行うイコライザーカーブ
     中間帯域から離れるほど高音・低音の位相差の強度を強くする。
     中間帯域は明瞭度を保つため、位相を大きくいじらない
   2、遅延時間 20ms前後 (短い=ステレオ幅狭い、長い=ステレオ幅広い)
   3、サラウンド効果のゲイン +5dB前後 (+4=ステレオ感小、+6=ステレオ感大)

 ④使用する音楽編集ソフト

   Audacity (使用しているのはVer.2.0.6)

 

2、実際に疑似ステレオ化した音源のサンプル。

   YouTubeにアップしたので疑似ステレオの効果を聞いてみてください。

 

 

 

  サンプル曲はモノラル音源が得られなかったので、YouTube Audio Libraryから
 ダウンロードした音源(主にクラシック)をモノラル化してから使用しています。

疑似ステレオ化のパラメーター(全曲共通)

  1)イコライザーカーブA(周波数が対数目盛で、0KHz・0dB、22.05KHz・-48dB)
   イコライザーカーブB(周波数が対数目盛で、0KHz・-48dB、22.05KHz・0dB)
  2)遅延時間 20ms
  3)ゲイン +5dB

曲順

1、William_Tell_Overture_by_Rossini.mp3
2、Symphony_No_5_by_Beethoven.mp3
3、Moonlight_Sonata_by_Beethoven.mp3
4、Lost_In_Prayer.mp3
5、Hungarian_Rhapsody_No_2_by_Liszt.mp3
6、Gymnopedie_no1.mp3
7、9th_Symphony_Finale_by_Beethoven.mp3

(クラシックのレパートリーを知らないので適当に選びました)

 

3、疑似ステレオの作り方(説明は、Audacity Ver.2.0.6 を使用)


3-1、サラウンド音源の作り方
 1)ステレオ2ch化されたモノラル音源(44.1KHz)を、トラック1に読み込む
 2)トラック1をコピーして、トラック2にペースト
 3)トラック1にイコライザーカーブA(周波数が対数目盛で、0KHz・0dB、22.05KHz・-48dB)
  イコライザーのカーブは周波数軸が対数目盛りで行ってください
 4)トラック2にイコライザーカーブB(周波数が対数目盛で、0KHz・-48dB、22.05KHz・0dB)
   A,Bとも、減衰側の-48dBを大きく(-24dBなど)するとステレオ感が小さくなります
 5)トラック2の上下を反転
 6)トラック1,2を合成して書き出し→サラウンド音源(sara.wav 44.1KHz・24bit)
  これで、低音側が正相・高音側が逆相のサラウンド音が得られます。

3-2、モノラル音源とサラウンド音源の合成
 1)トラック1にモノラル音源を読み込み
 2)トラック2にサラウンド音源を読み込み
 3)トラック2の先頭に20msの無音を挿入し、最後を20ms削除
   遅延は20msを標準とし、15,10msに小さくするとステレオ幅が狭くなります。
   20msより大きくすると単音などの場合にエコーが掛かったように聞こえる
   場合があるのでヒアリングで最適値を決めてください。
 4)トラック2の左BOXの▼メニューで、ステレオトラックを分離する。
   新しく、左がトラック2、右がトラック3になっている
 5)トラック3の上下を反転させる
 6)トラック2,3の左BOXのゲインスライダーを+5dBにする。
   この段階で再生して音を確認し、ステレオ感を調整するなら+4、+6dBなどに好みで
   調整してください。
 7)トラック1,2,3を合成してステレオチャンネルで書き出します。
   PCでしか再生しないなら、44.1KHz24bit,wavがおすすめです。CD化なら44.1KHz16bit,wavで。

 

 

  疑似ステレオの作り方(Audacityの画面キャプチャービデオ)

 

 

 

  音声部分に、BGMとして実際に疑似ステレオ化した音を入れてあります。

 

3-3、その他

 1)モノラル音源が48KHzの場合、イコライザーカーブA,Bがそのまま使えます。

 2)疑似ステレオ化の中核であるイコライザーA,Bがハイレゾに対応できないので
  疑似ステレオ化できる音源は、44.1KHzと48KHzだけです。

 3)古いSPレコードのモノラル音源は高域がほとんど出ていないので、ステレオ感が低音定位側の
  Lch寄りになりますが、ステレオ感はそこそこ感じられます。 

 4)音質向上のためにアップサンプリングを行うなら下記がおすすめです。

   a)44.1KHz24bit→352.8KHz64bit flot→384KHz64bit float→192KHz24bit

    ※YouTubeにアップしたビデオはYouTubeの再エンコードで44.1KHzにダウンされるので少しでも劣化しないように
     a)の方法で音声を192KHz/24bit/WAV (ブルーレイ用tsファイル)に変換してからでアップしています。


   b)44.1KHz24bit→CDからスタジオのハイレゾ・マスタリング音源を再現
          http://r1rawd.cocolog-nifty.com/blog/2019/04/post-4b51ee.html
     
   c)mp3に書き出すなら、44.1KHz24bit→48KHz320Kbps(48KHzにすると音質が向上します)
    ※私のUSB-DACはクロックが12MHz1系統で44.1/48KHzのマスタークロックを生成していて
     44.1KHz系のジッタが大きくて?44.1KHz系の音質が劣っているためでしょうか?

| | コメント (4)

2019年11月 6日 (水)

アップサンプリングでハイレゾのちょっと手前の音に復元

--------------------------------------------------------
「疑似ハイレゾ音源」の最新バージョンの紹介記事です。

疑似ハイレゾ音源の最新バージョン
http://r1rawd.cocolog-nifty.com/blog/2020/12/post-40adca.html
--------------------------------------------------------

 CDやmp3の音とハイレゾ音源を聞き比べて、やっぱりハイレゾのほうがいい音だと
思う方へのメッセージです。

 CDやmp3音源から疑似的なハイレゾ音源への復元は、少し複雑で手間がかかりますが
できます。

 ※AudacityでCDを疑似ハイレゾ音源に復元するブログの記事です。
   「CDからスタジオのハイレゾ・マスタリング音源を再現。」
    http://r1rawd.cocolog-nifty.com/blog/2019/04/post-4b51ee.html

今回は「しかしこの方法はめんどくさいのでパス」、という方向けに簡易版の方法です。
この方法は簡単にできますが、あくまでもCDの帯域(~22.05KHz)内の復元でハイレゾ成分
(22.05KHz~)は含んでいませんが、元の音に比べて音質が向上します。(と思います)


その方法は、「アップサンプリングを2回に分けて行う」 ことだけです。

CDやmp3(44.1KHz)のアップサンプリング方法

  ①96KHz・24bitにアップサンプリング

    44.1KHz(16bit) → 88.2KHz・24bit → 96KHz・24bit

  ②192KHz・24bitにアップサンプリング

    44.1KHz(16bit) → 178.4KHz・24bit → 192KHz・24bit


(※なぜ2回に分けてアップサンプリングをすると良いのかは、上の記事を参照ください)


さらに音質向上へのヒント

1)最良の変換(ちょっと複雑になります)

 44.1KHz → 352.8KHz・64bit float → 384KHz・64bit float → 96KHz・24bit
 44.1KHz → 352.8KHz・64bit float → 384KHz・64bit float → 192KHz・24bit

2)CD全曲を結合して時間が長い音源などは、Flacで書き出す。(WAVの最大サイズは4GBまで)
(私は非圧縮のRF64フォーマットで書き出し、WaveSpectraのASIO+USBDACで再生しています
 WaveSpectraはりサンプリングや音量調整などの余計な操作を一切行っていないので素の音
 を再生でき、私の常用再生ソフトです。欠点はWAVとRF64しか再生できないこと)

3)使用する音楽編集ソフト
 Audacity をお勧めします。
 必須要件 ・384KHz・64bit floatの操作ができる
      ・アップ/ダウンサンプリングの補間に直線補間方式は不可
      ・ダウンサンプリング時に(お好みで)ディザが使える

| | コメント (0)

« 2019年10月 | トップページ | 2019年12月 »