« 2019年3月 | トップページ | 2019年5月 »

2019年4月

2019年4月19日 (金)

西之島 2019-04-13 T01:05:20Z Landsat8

 久しぶりの快晴で、西之島の全景が見られました。
海岸線が海食で少しづつ小さくなっている・・・ような気がします。
火山活動がまだ継続していることを示すものは島周辺の変色水域だけになりました。

 

 

西之島 2019-04-13 T01:05:20Z Landsat8 (左クリックで拡大)

 

Pan_003

 

 

画像の出典:下記よりダウンロードした画像をもとにR1が作成。
“ The source data were downloaded from AIST’s LandBrowser,
(https://landbrowser.airc.aist.go.jp/landbrowser/). Landsat 8 data courtesy of the
U.S. Geological Survey.”

 

Satellite:LANDSAT8
ID:LC81050412019103LGN00
Path:105 Row:041 Num:109
Cloud:31.62
Date:2019-04-13T01:05:20Z

 

 

にほんブログ村 科学ブログ 地学・地球科学へ

| | コメント (0)

2019年4月11日 (木)

CDからスタジオのハイレゾ・マスタリング音源を再現。

--------------------------------------------------------
「疑似ハイレゾ音源」の最新バージョンの紹介記事です。

疑似ハイレゾ音源の最新バージョン
http://r1rawd.cocolog-nifty.com/blog/2020/12/post-40adca.html
--------------------------------------------------------

 スタジオ品質の96/192KHz・24bit音源を、CDの44.1KHz・16bitにダウンサンプリングされた音源から
元の96/192KHz・24bit音源の復元は可能なのか?
結果は、「ほぼ同じように聞こえる」まで復元できたと思うのですが?

 手間はちょっとかかるけれど、ハイレゾ化されることのない古いCDやレコード・テープからCD化した音源を、
ハイレゾで聴くことができるんです!
本当かどうか、ぜひ試してみてください(^_^;)


簡単にまとめると

1、まず、CDの44.1KHz・16bitにダウンサンプリングされた音源のビット深度を24bitに擬似復元し、
  非整数倍ダウンサンプリングで41.1KHz系列の音質に変化(劣化)した音を48KHz系列の音質に復元。
  
2、次に、ハイレゾとして聞こえるために必要な22.1KHz以上の高域成分と等価な働きをする、
  可聴帯域で構成された擬似ハイレゾ成分を生成・合成して、擬似ハイレゾ・マスタリング音源の完成。
  復元された音源は96/192KHz・24bitですが、22.1KHz以上の高域成分は含んでいません。

3、変換する音源はサンプリング周波数が44.1KHzなら、WAV形式のほかにAudacityで読み込むことのできる
  圧縮音源のmp3・AACなど、動画のmp4、webm(音源のみ)などが使えます。
  (圧縮音源の復元の音質は、高域がちょっと甘い48KHz・24bitぐらいの音質でしょうか?)

4、復元は、Audacityを使った少し複雑な操作(29STEP)で時間も少し長いです。
  1曲・2分30秒のwavの変換       : 10分   作業に必要なHDD容量:4.43GB
  CD連結・40分24秒のwavファイルの変換 : 94分   作業に必要なHDD容量:71.5GB
  (R1の開発環境にて計測)


1、「ハイレゾ・マスタリング音源」の復元の仕組み

1-1、STEP-1 ビット深度24bitに擬似復元

  44.1KHz・16bitにダウンサンプリングされる前のビット深度24bitに擬似復元できるという思い付きは、
  「96/192KHz・24bitから非整数倍ダウンサンプリングで劣化(※1-1)したCD音源(44.1KHz・16bit)のビット丸め誤差
 はディザリングにより切り上げ/切り捨ての確率が50%であるという仮定を基にしています。

 復元操作は、2段階の変換(44.1KHz・16bit→352KHz・64bit float→384KHz・64bit float)により行われます。
 (※1-2)

 1回目の変換(44.1KHz・16bit→352KHz・64bit float)は、整数倍アップサンプリングでディザリングのビット丸め
 誤差を均等に分散した水増しデータを作り、2回目の計算時の誤差を散らして精度を上げるため。(と思う)

 2回目の非整数倍リサンプリング(352KHz・64bit float→384KHz・64bit float)でsinc関数による重みづけされた
 平均計算(であっているのかな?)で、新しい時間軸上のビット深度復元の精度を上げる(※1-3)。
 復元操作の中間ファイルは64bit floatで扱い、書き出し時に24bit fix で書き出します。

  STEP-1のこの段階で、384KHz/64bit floatを96/192KHz・24bitにダウンサンプリングした音源でも
 ビット深度擬似復元による音質改善効果が認められます。(この音質で十分ならSTEP-2は不要です)

※1-1、96/192KHz・24bitから44.1KHz・16bitへの非整数倍ダウンサンプリングによる劣化は、
   非整数倍ダウンサンプリングの比が小さく(96/44.1=2.18、192/44.1=4.35)てsinc関数による重みづけ平均
   もサンプル数が少なく、かつ24bitから16bitへの丸め変換(ディザあり)なので、新たな時間軸上の
   リサンプルbit値がオリジナル音源と乖離すると考えています。
   (イメージで考えたアイデアなので数学的には突っ込まないでください(^_^;)

※1-2、変換作業の中間ファイルの仕様・組み合わせの有無は、
    サンプル周波数は「88.2/96/176.4/192/352.8/384KHz」、
    ビット深度は「16/24/32/64、fix/float」の中からヒアリングで決定。
   Audacityのサンプル形式(内部演算)が32bit float なのに、64bit float形式でなぜ差が出たのか???


※1-3、アップ/ダウン・サンプリングの解説の図でこの考えのイメージが浮かんだのですが、
    数学的な裏付け・説明は私にはできません(^_^;)

 


1-2、STEP-2 擬似ハイレゾ成分の生成と合成

    擬似ハイレゾ成分を生成してSTEP-1の音源と合成し、擬似ハイレゾ音源に変換します。
    STEP-2では、44.1KHzにダウンサンプリングされて失われた「ハイレゾとして
   感じるために必要な倍音を含んだ22.1KHz以上の高域成分(※1-4)」に相当する、
   「可聴帯域で構成された擬似ハイレゾ成分(※1-5)」を生成して合成し、聴感上ハイレゾ
   音源と同等の音色に復元します。

   擬似ハイレゾ成分は、CD音源を 圧縮音源の Ogg Vorbis Q=10(※1-6)に変換後、STEP-1と同じ操作で
   ビット深度を復元してからヒアリングで決定した減衰(-121.5dB)後、STEP-1の音源と合成して
   384KHz/64bit flotのマスター音源を生成。
   それを、96KHz/24bitまたは192KHz/24bitのディザあり(※1-7)でリサンプリングして完成です。

   出来上がった96/192KHz/24bitをスペアナで見ても22KHz以上は音楽信号が無く約-170dBの低い
   フロアノイズ帯域で、雑音による音の濁りも起こさないので聴感上も有利になります。

   減衰率の-121.5dB(3回に分けて、-50,-40,-31.5dB)(※1-8)の3段目を-30~-34dBの間で変化させると、
   音源の再現からは
   外れますが、ライブ感が強調されたり、ボーカルが生々しくなったりと、DSP効果で使うのもアリです。

 


※1-4、22KHz以上のハイレゾ成分(帯域)は可聴帯域の倍音で構成されていて音として耳へは聞こえないが、
   スピーカーの過度特性による応答遅れを改善して音質向上の効果がある(R1の考えです)。
※1-5、ハイレゾの高音域の倍音によるスピーカー駆動の加速減速の応答を上げるアシスト効果の代わりに、
    圧縮音源にするときにフィルタリングで残された「音として成立するために最低限必要な要素」を使います。
    (理論的な説明はできませんが直感で試したところ好結果でした)
    そのまま加算すると強すぎるので、3回に分けて-121.5dB減衰させて加算します。
※1-6、圧縮音源に、Ogg Vorbis を選んだ理由は、mp3やAACのような変換による曲先頭の遅延がなく
    WAVと同期がとれる圧縮音源がこれしかなかったからです。
    変換品質Qは最高値の10で行ってください。9以下にするとハイレゾ効果が薄くなります。
※1-7、ディザリングはAudacityのディザリングで聴感上もっともよかった矩形ディザリングを使います。
   (ディザリングの意味と効果を今回初めて知りました (^_^;)
※1-8、一度の操作できる減衰量は-50dBなので、3回に分けています。増減させるときは3回目の-31.5dBを
    変化させてください。


1-3、R1メモ
    私は、96/192KHz・24bitからCD44.1KHz・16bitへの非整数倍ダウンサンプリングは、
   非整数倍ダウンサンプリング比が小さく(96/44.1=2.18、192/44.1=4.35)、かつ24bitから16bit
   への丸め変換(ディザあり)なので、新たな時間軸上のリサンプルbit値がオリジナル音源と乖離
   して音色が変化していると考えています(硬い感じの劣化音として聞こえます)
    試しに、96KHz/24bitを44.1KHz/16bitに落とした音源から、STEP-1の384KHz/64bit float音源を作り、
   それを352KHz/64bit floatに一度変換し、さらに44.1KHz/16bit(ディザあり)
   に変換(サンプリング比大 384/44.1=8.7)すると、CDフォーマット音源でありながら音色は
   96/192KHz系列の音になります。
    マスター音源が41/88/176KHzのCDの場合どうなるかというと、レコードからCD-Rにダイレクトに
   焼いた音源でも効果があったのでそれなりの効果は期待できます。
    1993年のCDで、録音に「従来の磁気テープの代わりに新開発の「光ディスク」(通称CDWO又はCD-R)
   を使用した高音質のCD」を持っていますが、当時はCDフォーマットの44.1KHz・16bitのデジタル録音が
   最先端だったのですね(^_^;)


2、「ハイレゾ・マスタリング音源」の復元作業
 
2-1 Audacity による作成フロー

   44-16(org.wav)→44-q10-ogg(q10.ogg)→352-64f(q10-352.rf64)→384-64f(q10-384.rf64)
      ↓                                                                         ↓
      ↓                                                       -121.5dB(-50,-40,-31.5dB)(※1-8)
      ↓                                                                         ↓  
   352-64f(352.rf64)→384-64f(384.rf64)→  +  ←←←←←←←←←←←
                                                                   ↓
                                                         384-64f(HR-384.rf64)
                                                                   ↓
                                                                   ↓→96-24(HR-96-24.wav)
                                                                   ↓→192-24(HR-192-24.wav)
                                                                   ↓
                                                 CDフォーマットハイレゾが必要なら
                                                                   ↓
                                                    352-64f(HR-384-352.rf64)
                                                                   ↓
                                                       44-16(HR-44-16.wav)

     ※ファイル名はサンプルです。
     44-16   は 44.1KHz/16bit、wav
     44-q10-ogg は 44.1KHz、品質10、Ogg Vorbis
     352-64f  は 352.8KHz/64bit・float、RF64形式 (※2-1)
     384-64f  は 384KHz/64bit・float、RF64形式
     96-24    は 96KHz/24bit、wav
     192-24   は 192KHz/24bit、wav

※2-1、CD1枚を連結したファイルなどは、384KHz/64bit・floatで書き出すと15~20GBになり
    WAV形式では編集できないため、RF64形式を使います。

 


2-2、作成手順

 変換操作は、Audacity 2.0.6 を使った説明になります(このバージョンが使いやすいので使用してます)

2-2-1、作業前にAudacityの設定を行います。
  1)編集→設定→品質
    サンプリング:サンプリング周波数 44100Hz、サンプル形式 32bit・float
    リアルタイム変換:Best Quality (Slowest)、ディザリング 矩形
    高品質変換:Best Quality (Slowest)、ディザリング 矩形
  2)編集→設定→ディレクトリ
    テンポラリディレクトリに使用するHDDを指定。(高速タイプ推奨)

2-2-2、変換操作

 

 

 

 

1)CD音源(44/16bit)読み込み (org.wav)(※2-2)
2)書き出し設定 44.1KHz、ogg、品質10
3)書き出し (q10.ogg)
4)書き出し設定 352KHz、RF64形式、64bit・float (※2-3)(※2-4)
5)書き出し (352.rf64) → CLOSE
6)読み込み (352.rf64)
7)書き出し設定 384KHz、RF64形式、64bit・float 
8)書き出し (384.rf64) → CLOSE
9)読み込み (q10.ogg)
10)書き出し設定 352KHz、RF64形式、64bit・float
11)書き出し (q10-352.rf64) → CLOSE
12)読み込み (q10-352.rf64)
13)書き出し設定 384KHz、RF64形式、64bit・float 
14)書き出し (q10-384.rf64) → CLOSE
15)読み込み (384.rf64)  ・・・トラック1 になります
16)ドラッグ&ドロップで (q10-384.rf64) をトラック2に読み込み
17)トラック2をフィルター/増幅で、-50dB (1回目)
18)トラック2をフィルター/増幅で、-40dB (2回目)
19)トラック2をフィルター/増幅で、-31.5dB (3回目)
20)書き出し設定 384KHz、RF64形式、64bit・float
21)書き出し (HR-384.rf64) → CLOSE
22)読み込み (HR-384.rf64)
23)書き出し設定 192KHz、wav形式、24bit
24)書き出し (HR-192-24.wav)
25)書き出し設定 96KHz、wav形式、24bit
26)書き出し (HR-96-24.wav)
27)CDフォーマットで書き出す場合は、101)へ 不要なら28)へ
28)CLOSE
29)拡張子が、ogg、rf64の中間ファイルを削除

※ 29)STEP 完了で、96/192KHz・24bit 擬似ハイレゾの書き出し完了。
  CDフォーマットハイレゾが必要なら以下を実行

101)書き出し設定 352KHz、RF64形式、64bit・float
102)書き出し (HR-384-352.rf64) → CLOSE
103)読み込み (HR-384-352.rf64)
104)書き出し設定 44.1KHz、wav、16bit 
105)書き出し (HR-44-16.WAV)
106)CLOSE
107)拡張子が、ogg、rf64の中間ファイルを削除

 

 

2-2-3、 作業時間と中間ファイルに必要なデータ用HDDの容量
    変換時間を短縮するためには高スペックPCと、音源と中間ファイル用の2台の高速・空き容量大の
   HDDが必須です。

   96/192KHz,24bit変換(ステップ29)まで)完了までの時間と必要な作業ファイル容量について

    1曲・2分30秒のwavの変換       : 10分 4.43GB  (作成例のビデオ)
    CD連結・40分24秒のwavファイルの変換 : 94分 71.5GB
    (変換時間は、操作に慣れた状態でR1の開発環境にて計測)

  192KHz/24bitのwav形式で書き出せるのは約60分(WAVの4GB制限)が上限なので、CD上限の74分に近い
  音源は4GBを超えてWAVでは扱えなくなるので、分割またはFLAC形式で書き出してください。

 


※2-2、Audacityで読み込める圧縮音源(mp3,aacなど)や動画(mp4,webmなど)の音声も変換可。
※2-3、中間ファイルはWAV形式ではなく、RF64(RIFF64)・64bit形式で書き出します。
   理由は、音源がCD1枚を連結したものは4GBを超えてWAVで扱えなくなるのと、消去時の目印にもなります。
   bit指定は64bit floatを選択(他のbit数や固定bitを指定すると音質が落ちます)
※2-4、変換・書き出しに時間がかかり、ソフトが停止したように見えることがあります。
   CD連結などの長い曲では、作業中に「応答なし」の表示が出ることがありますがそのまま待ちます。
   Audacityの変換中を示すバーグラフが完了してもHDDに書込みが終わるまで作業が終わらず、
   次の作業に進めません。
   待ちの間に、マウスカーソルを任意のメニューボタンの上に置いておくと、作業が完了すると
   ボタンに四角い枠がでるので目安にすると便利です。

 


2-2-4、付録 市販の192KHz/24bit ハイレゾ音源に近づけたい方のもうひと手間(通常は不要で、非推奨)

 復元の検証テストで、192KHz/24bit音源を44.1KHz・16bitにダウンサンプリングした音源を使用して、
復元した音源が元の音源よりクリアー(硬い?)に聞こえる、と思われた方がいるかもしれません。
私は、出来上がった音源は音楽信号を含んでいない22KHz以上の可聴帯域外に低レベル(-170dB)のフロアノイズ
しか含んでいないので可聴帯域の音楽を濁らせず、よりクリアーな生の音に近づいたと考えます。
試しに、ホワイトノイズを22KHzのハイパスフィルターを通し、ゲインを可聴帯域のフロアノイズと同じレベル
(約-120dB前後)に調整して加えると、オリジナルの192KHz/24bitのハイレゾ音源の柔らかい(ぼけた感じ?)
雰囲気に近づきます。
192KHz/24bitハイレゾ音源の柔らかさ?は、録音機材による高音域のノイズで音が劣化した状態を聞いているの
ではないかと私は思います。
(試しに、192KHz/24bitのハイレゾ音源を、45KHzのローパスフィルターを通して45KHz以上のノイズを除去した
192KHz/24bit音源にして聞いてみると差がわかります)
 

2-2-5、R1メモ
 今回はAudacityを使いましたが他のソフトを使われる方は、アップ/ダウンサンプリングのアルゴリズムで
直線補間を使っているソフトは、なめらかな波形補間ができないので使用できません。


3、開発環境
 PC:ノートパソコン dynabook T551/T6DB corei7-2670QM、8GB (2011年製)
 HDD:外付け USB3.0 3TBx2台(データ用、作業ファイル用)(低価格の遅いHDD)
 USB-DAC:エレコム EHP-AHR192GD (改造品)BRAVO-HD ASIOバッファ 3ms (※3-1)
 ヘッドホン:オーディオテクニカ ATH-W1000 (改造品)
 編集ソフト:Audacity 2.0.6
 再生ソフト:WaveSpectra V1.51 ASIOで再生 (リファレンス用に使用)
       高音質設定 ①FFT サンプルデータ数128,窓関数なし
       ②休止時間 500mms  ③測定モード OFF ④ウィンドウ最小化
 ヒアリング:8KHzまでしか聞こえない年相応の耳・・・ 

 変換時間の短縮には高スペックのCPUと高速HDDを使うと効果があります。
 第7/8世代のcorei7やSSDを使うとどのくらい早くなるんだろう???

※3-1、BRAVO-HDドライバーのASIOのバッファサイズ(3~100mms)を変えると音質が変化します。
   短い(3~50mms)とセパレートの良い硬い音質で、長い(100mms)とボーカルが引き立つちょっと音像が
   甘くなる音質になるのですがどうしてかは不明。
   今のところ、最小の3msで音飛びなどがないので使用しています。
   調べるとバッファサイズで音が変化する同じ現象の記事はわずかしかなく、ほとんどの記事が
   音の変化はなく音飛びなどの不具合がない範囲で最小値がよいというものでした。

   使用しているUSB-DACはスマホ専用でPC接続での使用はメーカー非対応品で、ドライバーも使えるというだけ
   のサポート外品で不具合であれば自己責任ですね。
   (ドライバーを入手したHPも閉鎖されていました)
   WASAPIの場合、パネルで指定した周波数で固定再生されてしまい一致しないと音質がオリジナルと変わるので
   サンプリング周波数が異なる音源を再生するたびに合わせる手間がめんどうです。
   その点、ASIOは自動で追従してくれるのでその都度の設定が不要で、音質もWASAPIより
   好みなので常用はASIOで聞いています。 


2019/04/11 by R1
ハイレゾ音源カテゴリー(ブログ記事)
http://r1rawd.cocolog-nifty.com/

BGM:甘茶の音楽工房 http://amachamusic.chagasi.com/
gogatsunokaze,haruemukaukusabanae,irishnokaze,sangatsunosundasora,yuuguredoki

 

 

にほんブログ村 写真ブログ 立体写真へ

 

にほんブログ村 写真ブログ 水中写真へ

| | コメント (0)

« 2019年3月 | トップページ | 2019年5月 »