« 2022年のフンガ・トンガ=フンガ・ハアパイ火山の大規模噴火 | トップページ | CD音源の高精度アップサンプリングで、ハイレゾ相当のリアル音源を作る。 »

2023年8月17日 (木)

m4a,mp3などの非可逆圧縮音源を、WAV(44.1KHz 16bit)音質に簡易復元

 m4a,mp3などの非可逆圧縮音源は、元のWAV(44.1KHz 16bit)より音質が劣化しています。
非可逆圧縮音源の帯域バランスは一般的に「高域は強調され、低域はスカスカ」の傾向になります。
(聴覚の特性に基づいて圧縮しているため、こうなってしまうのでしょうか?)
しかし、そんな圧縮音源でも圧縮前のWAV相当の音質で聞くことができないか? その答えです。

約16KHz以上のカットされた帯域と、マスキングでカットされた周波数成分は復元不可能ですが、
帯域バランスをWAVに近づけることで、圧縮音源くささをなくしました。

※1、聴力検査で約8KHzまでしか聞こえない耳で音質を評価しています。
   20KHzまで聞こえる若い方にはどんなふうに聞こえているんでしょう?

 圧縮音源からWAV相当の音質への簡易復元は簡単な操作なので是非試してみてください。

 

1、使用するソフト

 Audacity Ver 3.2.5 推奨(プロジェクトのサンプリング周波数の指定が簡単)

 ※2、Ver 3.2.5は、現在アーカイブからのダウンロードになります。
   2023/08/16現在  https://www.fosshub.com/Audacity-old.html

 ※3、Ver 3.3.3 最新バージョンでも使えますが多用する(プロジェクトのサンプリング周波数)の
   指定が階層の深いところに変わって使いにくいです。
   エフェクトの日本語表記も変更されています。


 Audacityの設定 (Ver3.2.5)

 1)編集→環境設定→品質
  サンプリング
   サンプリング周波数: 44100Hz
   サンプル形式   : 32bit 浮動小数点 ・・・必須
  リアルタイム変換
   サンプリング周波数: 最高品質(最低速)
   ディザリング   : 無し
  高品質変換
   サンプリング周波数: 最高品質(最低速)・・・必須
   ディザリング   : 無し       ・・・必須 

  ※4、他のソフトでも、下記を満たせば使えると思います。
    ・サンプリング周波数の指定が任意設定できる(f=2^n)
    ・32bit-float 編集ができる
    ・アップ/ダウンサンプリング計算がsinc関数演算
    (他のソフトが使えてもパラメーターの見直しは必要と思います)


2、操作の流れ

   変換フロー (m4a 44.1KHz の例)

   m4a (44.1KHz) → 262144Hz 32bit-float → wav (44.1KHz/16bit)

 

 m4a(44.1Khz)音源の変換例(ファイル名:44m4a.m4a)

 1)44m4a.m4a 読み込み

 2)アップサンプリング周波数を 262,144Hz に指定
  画面左下の(プロジェクトのサンプリング周波数)のBOXに、262144 と直接入力
  262,144Hz は、二進数で割り切れる時間軸 T=1/2^18 (s)  

 3)32bit float/rf64形式で書き出し
  ファイル名例 44m4a_262f.rf64

  ※5、32bit float/wav形式でも可 (CD1枚連結を書き出すと4GBを超えるのでrf64を推奨)

 4)44m4a_262f.rf64 読み込み

 5)ダウンサンプリング周波数 44100Hz を選択 (※6)
  画面左下の(プロジェクトのサンプリング周波数)で44100 を選択。

  ※6,映像から分離したAAC、AC3などの48KHzの非可逆圧縮音源は、wavの書き出し時に
    48KHz/16bit を選択します。
    48KHz系を44.1KHz系に変換(逆も)すると音質が落ちます。

 6)wav/16bit で書き出し(※7)
  ファイル名例:44m4a_262f_44-16.wav

  ※7、44.1KHz16bit以外(例 96/192KHz24bit)で書き出しても、WAV音質にもハイレゾ音質にも
     なりません。劣化するだけです。


 ※8、CD1枚分などの長時間の音源の場合、次の項目に進む前に「新規プロジェクト」を先に
   開いてから、作業の終わったプロジェクトを終了させながら進むと、複数のプロジェクトを
   開かずに済み、audacityの作業ファイルの累積が無くなくなり作業容量の節約ができ、
   操作のレスポンス低下をなくすことができます。
  
 ※9,蛇足ですが、ASIOソフトの「BRAVO-HD Audio CPL」を開いてしまうと、Audacityがまともに
   動作しなくなる(速度低下)現象が出ています。


3、何をしているのか?

  数学的な説明は抜き(できません(^^;)で、下記のイメージの考えで簡易変換を行っています。

   非可逆圧縮音源はwavデータを間引くために関数の形のデータ(イメージでの理解です)に変換
  されていて、WAVに変換すると不連続の点を結んでつながれた「ガタガタ波形」になり、
  その「ガタガタ波形」が音質劣化の原因と考えました。
  (関数なのでbit深度の考えが無く、32bit-floatで復調すると、24bit値をとります)

  そこで、32bit-floatで復調された「ガタガタ波形」の24bitをsinc関数を使ったアップサンプリ
  ングで再計算して滑らかな 262,144Hz/24bitの波形に変換し、その滑らかな波形から再び
  44.1KHz/16bitにダウンサンプリングすることで、圧縮されて残った周波数成分を持った
  滑らかなWAV波形に戻すことができる。

   アップサンプリング周波数を 262,144Hz(二進数で割り切れる時間軸(T=1/2^18_s)に
  することでアップ/ダウン・サンプリング時の時間軸の割り切れない計算誤差をなくして、
  音質の劣化を少なくします。 
  262,144Hzは(2^17~20_Hz)の中からヒアリングで決定。

  ※10、192KHzなどは、T=1/192,000=0.0000052083…(s)と割り切れないため時間軸基準に
    揺らぎを生じて音質を劣化させていると考えられる。 (PC内部の2進数は理解不能です) 

   下図は、実際にmp3(44.1KHz128kbps)でWAV音質に簡易復元した例で、波形の変化(差分)と
  新たに生成された周波数成分です。

_001_h16002

 

   今回の処理は、「圧縮音源をハイレゾ音質相当に変換する」ためのプリ処理で、
  圧縮音源をCD音質相当(wav 44.1KHz16bit)に復元するために開発した。
  次回のブログで「WAV音源をハイレゾ相当に変換」を公開予定です。

 

にほんブログ村 写真ブログ 立体写真へ

 

にほんブログ村 写真ブログ 水中写真へ

|

« 2022年のフンガ・トンガ=フンガ・ハアパイ火山の大規模噴火 | トップページ | CD音源の高精度アップサンプリングで、ハイレゾ相当のリアル音源を作る。 »

ハイレゾ音源」カテゴリの記事

コメント

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



« 2022年のフンガ・トンガ=フンガ・ハアパイ火山の大規模噴火 | トップページ | CD音源の高精度アップサンプリングで、ハイレゾ相当のリアル音源を作る。 »