« SANDDIVER | トップページ | 西之島 2015/05/12 の輪郭想像図 »

2015年5月15日 (金)

高域補間 N-ハイレゾ音源 Ver.2

--------------------------------------------------------
「疑似ハイレゾ音源」の最新バージョンの紹介記事です。

疑似ハイレゾ音源の最新バージョン
http://r1rawd.cocolog-nifty.com/blog/2020/12/post-40adca.html
--------------------------------------------------------

高域補間 N-ハイレゾ音源 Ver.2

 

1、高域補間 N-ハイレゾ音源 Ver.2

 

 前回の「なんちゃってハイレゾ音源 高域補間」(以下 Ver.1)は失敗作でした。
高域成分を適当に足せば「音が変わってハイレゾ化?」と大きな間違い(^_^;)。
帯域のバランスを欠いたとんでもない音質になっていました。
ノートパソコン+ヘッドホン(※1)で聞いているときには良く聞こえたのですが、DVD Video
に96KHz/24bitで焼いてオーディオ装置(※2)で再生してみるとボーカルの中音域が強調
された不自然な音です。

 

 

 

Ver.1の高域補間方法「10KHz以上から生成したx2,x4の偶数・擬似倍音を高域補間成分に
加える」を再検証してみると下記の欠点があることが分かりました。

 

 1,10KHz以上から生成した倍音は、音声・楽器の基音帯域から離れすぎていて音色が
  再現できない。
 2,Ver.1では補間に偶数倍音のみを使っていたが、奇数倍音が無いと「ボケた音質」に
  なりクリアー感が出ない。
 3,偶数倍音のみの高域補間は「ボケた音質」になるので、合成ゲインを-72dbぐらいに
  下げないと聞けなかった。

 

 

 

上記の欠点を改良した、Ver.2の新しい高域補間の方法です。

 

 1,オリジナル帯域(0-22.05KHz)には手を付けない。
 2,高域補間成分は基音に近いエネルギーの大きな倍音を含む帯域から、
  奇数・偶数擬似倍音成分を生成する。 
   ・奇数擬似倍音 = 7.3KHz~22.05KHzを3逓倍して、22KHz~約65KHz
   ・偶数擬似倍音 = 5.5KHz~22.05KHzを4逓倍して、22KHz~約65KHz(※3)

    ※3、偶数擬似倍音成分は約88.2KHzまで出ますが、奇数擬似倍音成分と
       帯域をそろえないと、192KHz/24bit時にもたつき感が出ました。
       そのため、偶数擬似倍音成分は奇数擬似倍音と同じ帯域にするために
       約65KHzでカットします。

 

 

 

2、Ver.2の高域補間のパラメーターの決め方

 

 Ver.2は自分の好みで調整するのではなく、ハイレゾ音源(96KHz/24bit(※4)、
192KHz/24bit(※5))を一度CD品質(44.1KHz/16bit)に落とし、高域補間によりオリジナルの
ハイレゾ音源に近づけていく手法を取りました。

 

ヒアリングの判定は、出来上がったN-ハイレゾ音源をノートパソコン(※1)と、DVD Video
(音声 96KHz/24bit)にしてオーディオ装置(※2)で聞き比べました。
192KHz/24bit音源は、外部USB-DACを持っていないのでPCのみでのヒアリングです。

 

Ver.2から名称も「なんちゃってハイレゾ音源」から「N-ハイレゾ音源」に変更しました。(^_^;)

 

 

 

 「高域補間 N-ハイレゾ音源 Ver.2」はどこまでオリジナルのハイレゾ音源に近づくことが
出来たでしょうか?

 

 

 

 ※1、ノートパソコン:dynabook T551/T6DB  ヘッドホン:audio technica ATH-W1000
 ※2、DVD再生  : ハードディスクレコーダー RD-BZ810
    アンプ  : PMA-2000
    スピーカー: S-LH5a
    ヘッドホン:audio technica ATH-W1000
    ※スピーカーは中高音がホーン型でちょっと癖があるので、ヒヤリングはヘッドホン
      と併用しています。
 ※4、「スガラボットのオーディオForum」さんが公開している、96kHz/24bit で録音した
     バイオリンとピアノの演奏「エルガー: 愛の挨拶」をリファレンスに使用させて頂き
     ました。
 ※5、「audio-technica」 192kHz/24bitハイレゾリューション音源サンプル
    「01. I GOT CRUSH ON YOU AT DEMO」をリファレンスに使用させて頂きました。
    

 

*******************************************************************

 

3、高域補間 N-ハイレゾ音源 Ver.2 の作り方

 

3-1, 「高域補間 N-ハイレゾ音源 Ver.2」の作り方

 

  1)作成フロー
   1, CD音源(44.1KHz/16bit) → アップサンプリング 192KHz/24bit → (a)
   2, (a)から奇数倍音作成(3逓倍)→22KHz-65KHz BPFx2回 → (b)
   3, (a)から偶数倍音作成(4逓倍)→22KHz-65KHz BPFx2回 → (C)
   4, (a),(b),(c)のミキシング操作で、N-ハイレゾ音源を生成
     (a)+(b)x-3 -20 db+(c)x-4 -21 db → 192KHz/24bit 書き出し → 192KHz/24bit 音源 (d)
       ~USB-DAC,ポータプル用
     (a)+(b)x-3 -20 db+(c)x-4 -21 db →  96KHz/24bit 書き出し →  96KHz/24bit 音源 (e)
       ~DVD-Video用

 

    2)高域補間の様子~こんな風に行われます。
   Ver.1でサンプルに使った「ふうか まりを」さんを、N-ハイレゾ音源 Ver.2 でリメーク。

 

 

 

 

 

 

 

 

  サンプル音源  a wandering minstrel -Short Ver.- 作詞:ふうか まりを 作曲:阪神 総一
  ボーカル:ふうか まりを  Trial & Error (http://www.tandess.com/music/)

 

 

 

  アップサンプリング周波数は、私の最終目的がDVD-Video(96KHz/24bit)で聞くことなの
で192KHz/24bitにしました。
USB-DAC等で聞ける方は、
44.1KHz→176.4KHzUP→N-ハイレゾ化→176.4KHz or 88.2KHzダウンが良いと思います。
(アップサンプリングは整数倍でなくても大きな差はないが、ダウンサンプリングは1/整数
倍の方がいいように感じました)

 

 

 

  使用した音楽編集ソフトはアップサンプリング・テストで一番波形の劣化が少なかった
「Audacity 2.0.6」。
フリーソフトなので、無い方はサイトからダウンロードしてください。
※ほかの音楽編集ソフトでは検証していません。

 

 

 

  memo

    最初、演算誤差を小さくできるかと思って、192KHz/32bit、384KHz/24/32bitで
   変換してみたのですが、アップサンプリングの段階で音質が変わってしまいました。
   (再びダウンサンプリングしても戻らない)
   原因はソフトなのかパソコンの最大仕様 192KHz/24bit なのかは不明です。
   でも、32bitや384KHzの再生は出来ます?

 

*******************************************************************

 

N-ハイレゾ音源の作り方の、手順

 

①、「ファイル→開く」でCD音源を取り込む。
  1)サンプル音源 Elgar.WAV (44.1KHz/16bit)
   ・CD音源は別ソフトで予めリッピングしておいてください。
    ここでは、オリジナルの96KHz/24bitを44.1KHz/16bitにダウンサンプリングした
    ものを使っています。

 

   オリジナル96KHz/24bit音源のスペクトラム(図1)

 

01_org_96

 

CD品質(44.1KHz/16bit)にダウンサンプリング音源のスペクトラム(図2)

02_4416

 

②、「プロジェクトのサンプリング周波数(Hz)」(左下)を、192000 に設定
 
③、オーディオの書き出し
  1)「ファイル→オーディオの書き出し→ファイル名設定(Elgar_192KHz-24bit.wav)→
    オプションでWAV,24bit選択→保存」
    ※合成時のベース音源になります。
  2)「ファイル→閉じる」 ※必ず閉じてください。そのまま続けると44100/16bit領域の
   操作になります。

 

    192KHz/24bitにアップサンプリングした音源のスペクトラム(図3)

 

03_441619224


④、高域補間用 奇数倍音(3逓倍 ピッチ200%)の生成
  1)「ファイル→開く→Elgar_192KHz-24bit.wav」
  2)「エフェクト→ピッチの変更→周波数・変更率(%)=200%」
  3)「エフェクト→イコライゼーション」を使ったバンドパスフィルター(BPF)で22KHz以下と
   65KHz以上をカットします。
   下の(図4)の特性カーブでイコライゼーションを実行します。
   予めカーブを保存しておくといいでしょう(BPF 22-65KHz)

 

     イコライゼーションのバンドパスフィルター特性カーブ(図4)

 

04bpf



       
  4) もう一度、3)のBPFを実行します。
    ※BPFが1回だと可聴帯域にノイズが残るのでノイズ除去のためにBPFを2回通す。

 

    BPF2回通過後の奇数倍音のスペクトラム(図5)

 

05_x3

 

  5)「ファイル→オーディオの書き出し→ファイル名設定(Elgar_192KHz-24bit_x3.wav)→
    オプションでWAV,24bit選択→保存」
  6)「ファイル→閉じる」

 

 

 

⑤、高域補間用 偶数倍音 (4逓倍 ピッチ300%)の生成
  1)「ファイル→開く→Elgar_192KHz-24bit.wav」
  2)「エフェクト→ピッチの変更→周波数・変更率(%)=300%」
  3)「エフェクト→イコライゼーション」を使ったバンドパスフィルター(BPF)で22KHz以下と
   65KHz以上をカットします。
    (図4)の特性カーブでイコライゼーションを実行します。
  4) もう一度、3)のBPFを実行します。
    ※BPFが1回だと可聴帯域にノイズが残るのでノイズ除去のためにBPFを2回通す。

 

    BPF2回通過後の偶数倍音のスペクトラム(図6)

 

06_x4


  5)「ファイル→オーディオの書き出し→ファイル名設定(Elgar_192KHz-24bit_x4.wav)→
    オプションでWAV,24bit選択→保存」
  6)「ファイル→閉じる」

 

 

 

⑥、ベース音源と高域補間用音源の合成
  1)「ファイル→開く→Elgar_192KHz-24bit.wav」
  2)「トラック・新しく追加・ステレオトラック」で、奇数倍音用の空トラック2を作る。
  3)もう一度「トラック・新しく追加・ステレオトラック」で、偶数倍音用の空トラック3を作る。
  4)「「ファイル→開く→Elgar_192KHz-24bit_x3.wav」で別ウィンドウが開きます。
   a)「編集・コピー」で奇数倍音をコピー。
   b)ベース音源のウィンドウに戻って、トラック2を選択して、「編集・ペースト」で
     奇数倍音をペーストする。
   c)「Elgar_192KHz-24bit_x3.wav」のウィンドウを閉じる。
  5)「「ファイル→開く→Elgar_192KHz-32bit_x4.wav」で別ウィンドウが開きます。
   a)「編集・コピー」で偶数倍音をコピー。
   b)ベース音源のウィンドウに戻って、トラック3を選択して、「編集・ペースト」で
     偶数倍音をペーストする。
   c)「Elgar_192KHz-24bit_x4.wav」のウィンドウを閉じる。
  6)奇数倍音、偶数倍音のゲイン調整を行います。 
   a)奇数倍音(トラック2)のパネル左のミュート、ソロの下のスライダーで、「 -3 -20 db」設定。
     (パワーバランス設定で、 -3 -20 dbに固定)  
   b)偶数倍音(トラック3)のパネル左のミュート、ソロの下のスライダーで、「 -4 -21 db」設定。
     (音色の調整で必要なら可変)

 

   memo

    ベース音源と補間用高域のパワーバランスは、ピンクノイズを補間した時に滑らか
    につながる値(-3db)に設定しています。
    音色の調整は、奇数倍音、偶数倍音のどちらの増減でもできますが、調整が容易な
    ように奇数倍音をパワーバランス用に固定とし、偶数倍音の増減で音色の調整を
    行います。
    私はヒアリングで-4db(落ち着いた感じ)と-5db(少し華や)の間と思いましたが1db
    単位の調整なので、落ち行いた感じの-4dbを最適値に決定しました。
    偶数倍音のゲインを上げる(-3、-2db)と、低音(ふんわり感?)の強調。
    下げる(-5,-6db)と高音(クリアー感?)の強調になります。

 

*** 追加 2015-06-13  *** 

 

  いろいろな音源を変換してみるとオリジナル音源の広域減衰が速いパターンでは
  FFTのスペクトラムがスムーズにつながらない曲が多く出ました。
  ピンクノイズで決めたパワーバランスは大きすぎたようです。
  補間部分がスムーズにつながるように今回高域補間のゲインを見直しました。
   修正前:(オリジナル、x3、x4)=0,-3,-4 
   修正後:(オリジナル、x3、x4)=0,-20,-21
  聴感上は(私には)同じように聞こえて区別できないのですが、波形で比較してみると
  歪みが減っています。
  修正前と同じように、x4のゲインを-21db±αで調整すると雰囲気が変わりますので
  試してみてください。
********************************** 

 

 

 

  7)ベース音源、奇数倍音、偶数倍音を合成して192KHz/24bitで書き出す。
    (書き出すと自動で合成されます)
   a)「ファイル→オーディオの書き出し→
     ファイル名設定(Elgar_192KHz-24bit_0-3-4db.wav)→
     オプションでWAV,24bit選択→保存」
  8)続けて、合成した音源を96KHz/24bitで書き出す
   a)「プロジェクトのサンプリング周波数(Hz)」(左下)を、96000 に設定
   b)「ファイル→オーディオの書き出し→
     ファイル名設定(Elgar_96KHz-24bit_0-3-4db.wav)→
     オプションでWAV,24bit選択→保存」

 

   ベース音源に高域補間成分(奇数倍音-3db、偶数倍音-4db)を合成したスペクトラム

 

   192KHz/24bit N-ハイレゾ音源(図7)

 

07_192out

 

   96KHz/24bit N-ハイレゾ音源(図8)

 

08_96out

 

 

 

  memo

 

  補間成分のピークがオリジナルより大きいですが、パワー的には3,4逓倍したスカスカ
  のスペクトラムです。オリジナルと補間成分のバランスはピンクノイズで補間シミュレー
  ションした時にスムーズにつながる値(-3db)に設定しています。


  N-ハイレゾ音源 Ver.2は、どの音源に対しても補間操作が同じなので時間短縮のた
  めにバッチ処理で一括変換できる方法が無いでしょうか?

 

 

 

⑦N-ハイレゾ音源に対応する音源

 

  N-ハイレゾ音源 Ver.2は、CD音源(44.1KHz/16bit)以外にも、
  ・mp3、MPEG-4オーデイオなどの圧縮音源や、
  ・CD化したテープ音源
  にも有効です。
  まだ試していませんが、レコードをハードディスクレコーダーで48KHz/16bit-PCMで
  録音してN-ハイレゾ音源にするといい結果が出るのではないかと計画しています。

 

  AAC 101kbps音源を、N-ハイレゾ化したスペクトラム(図9)

 

09_15khz_nhr


    ※オリジナル音源は、高圧縮音源のため15~22KHzがカットされています。

 

  又、音楽ジャンルを問いません。
  Jポップ、クラシック(バイオリン、チェロ、ピアノ、オーケストラ)、声楽(ソプラノ)、
  自然音※(SL、鳥)などで確認しました。
  ※自然音は、「sony リニアPCMレコーダー サンプル音源 96KHz/24bit」でテスト。
  
  memo

 

   ハイレゾサンプルとして公開されている「22KHzに繋ぎ目が見える」96KHz/24bit音源。
   N-ハイレゾ音源で例えると偶数倍音が強すぎてボーカルが鼻につきます。
   44.1KHz/24bitにダウンして聞いた方が素直でいい音です。

 

 

 

 

 

*** BPFを2回通す理由 2016/03/04 追加記事 ***

 

  BPF(バンドパスフィルター)を2回通す理由はAudacityの場合、1回だけだと22KHz以下
の可聴帯域にノイズ成分が残ります。
可聴帯域にノイズ成分が乗るのは精神衛生上無い方が良いので、BPFをもう一度掛けて
います。
 (ノイズは-140db程度なのでブラインドテストしたら解らないかも(^_^;)
1回で気にならないのなら製作時間短縮にもなるので試してみてください。
又、通過帯域のゲインが0dbのBPFを2回通しても理論上は音量に変化は有りません。
図で見ても、通過帯域のゲインは変化していません。(波形劣化の可能性はある)
基音に対するゲイン調整はミキシング時に行っています(fx3=-20、fx4=-21db の部分です)

 

図、fx3(3逓倍)のBPF通過後のスペクトル例

 

Bpf1or2

 

 

 

追記

 

 現在、私のPC環境とAudacityを使った場合のUP周波数・bitは下記の組み合わせが最適
と判断してN-ハイレゾ化しています。
擬似ハイレゾ化の高域補間は原音の修復を試みる手法なので、この組み合わせ以外も
試されてみてはいかがでしょうか。

 

1)org(44.1KHz,16bit)→44.1KHz,32bit①
2)44.1KHz,32bit①→352.8KHz,32bit② ※1
2)352.8KHz,32bit②x3逓倍→BPF(※2)x2回→352.8KHz,32bit(fx3)③
3)352.8KHz,32bit②x4逓倍→BPFx2回→352.8KHz,32bit(fx4)④
4)ミキシングとゲイン調整は、352.8KHz,32bit領域で行う ②+(③x-20db)+(④x-21db)→
  書き出し時に 176.4KHz,24bit⑤ or 88.2KHz,24bit⑥ に変換します。 ※3

 

※1、演算域は演算誤差を少なくするために整数倍MAX・32bit領域で行います。
   2回に分けて、44.1KHz,16bitを352.8KHz,32bitに変換するのは、Audacityを使う場合
      その方が良い音に聞こえたからです。
※2、BPFの通過帯域は、22KHz~65KHz (0db~通過帯域の音量変化なしの意味)
※3、パソコンやUSB-DACを通して聞かれる方は、176.4KHz,24bit or 88.2KHz,24bit 推奨。
   DVD,Blu-rayで聞く場合は、96KHz,24bit or 192KHz,24bit で書き出し(但し音質変化有)
   32bitでの書き出しは(私の)パソコンでは音が変わってしまうので不採用です。
   PCの再生スペックは、192KHz,24bitまでのようです。

 

**********************************************************

 

追記(2016/10/03)

 

  音源をハイレゾ化しなくても、人間を改造してハイレゾで聞くことが出来る(かも)(^_^;)

 

   なんちゃってハイレゾ オカルト編

 

 

 

 

 

にほんブログ村 写真ブログ 立体写真へ

 

 

にほんブログ村 写真ブログ 水中写真へ

|

« SANDDIVER | トップページ | 西之島 2015/05/12 の輪郭想像図 »

ハイレゾ音源」カテゴリの記事

コメント

唐突に申し訳ございません。
偽レゾ音源を作ろうと思いこのページに辿り着きました。

制作の過程でこのページではBPFを2回通すとのことなのですが、それをするとBPF1回の時よりも倍音の音量がかなり小さくなってしまうと思います。
これは問題ないのでしょうか。ヒストグラムを見る限りきちんとつながっているので問題はないと思うのですが、いまいち変化を感じられないので質問させいただきました。
回答いただければ幸いです。

投稿: NaFFF | 2016年3月 3日 (木) 22時46分

NaFFF さんへ

 BPFを2回通す理由等をこの記事の末尾に追加しました。
そちらを参照ください。

投稿: R1 | 2016年3月 4日 (金) 20時07分

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



トラックバック


この記事へのトラックバック一覧です: 高域補間 N-ハイレゾ音源 Ver.2:

« SANDDIVER | トップページ | 西之島 2015/05/12 の輪郭想像図 »