ドイツのAccentize社のマシンラーニングテクニックにより、スピーチやボーカルレコーディングで発生する様々な種類のノイズをリアルタイムで分析し、より精密かつ迅速に除去することができる。
マシンラーニング(machine learning)分野の最近の発展は、我々がデータを扱い、理解し、処理する方式を変化させた。 新たな理論的洞察力、自由に使えるプログラミングライブラリの増加、コンピューティングリソースへのアクセス増加により、データ処理問題を異なる角度から解決できる新たな可能性が台頭してきた。 Accentize社は最先端マシンラーニング理論をオーディオ信号処理領域に適用することに重点を置き、最先端研究とその生産実装間の格差を解消してきた。 新しく発売されたAccentize社の”VoiceGate"プラグインを使えば、スピーチやボーカル録音で発生可能なほぼ全てのノイズを簡単かつ自動化された方式で処理することができる。
"VoiceGate"は人間のスピーチ(speech)を分析する特殊訓練された人工神経網(artificial neural network)の下で作動するリアルタイムノイズ除去器(real-time noise reducer)です。 人工神経網のようなマシンラーニング技術の助けにより、"VoiceGate"アルゴリズムは音声信号構成要素のうち必要な部分と必要でないノイズを簡単に区別して処理できます。 "VoiceGate"に適用された人工神経網は、100時間を超えるオーディオデータを通じて人間のスピーチ特性を学習するように訓練されてきました。
VoiceGateエンジンの概要
"VoiceGate"は"Steady Noise"と"Impulsive Noise"の2つのタイプで、一般的なノイズを感知するように設計されました。 このようなノイズ検出概念の下で、Steady Noiseはホワイトあるいはピンクノイズのように時間が経ってもその音量値が大きく変動しない固定的かつ一定の騒音を意味します。 反面、Impulsive Noiseはクリック(click)やポップ(pop)ノイズのように時間によって予期せぬ発生の一時的かつ即時の騒音を示します。 一旦検出されたノイズが、この2つのタイプのうちの1つに分類されると、”VoiceGate"は、ユーザーが指定した周波数領域内でそのノイズに対する減衰処理を開始します。
ノイズ·コントロール
"VoiceGate"がマシンラーニングアルゴリズムをベースに実行されていることを忘れないでください。 したがって、ユーザーは"VoiceGate"がノイズに対する制御をほぼ自動で実現するため、パラメータの設定に心血を注ぐ必要はありません。 しかし、ノイズを制御するマシンラーニングメカニズムを通じてより良い結果を得るためには、”VoiceGate"の機能とコントロールを簡単に知っておく必要があります。
Mode選択: Broadband Mode、 Spectral Focus Mode
プラグインの上段には、"Broadband Mode"と"Spectral Focus Mode"の2つのモード選択ボタンがあります。 基本設定はBroadband Modeに設定されており、このモードで”VoiceGate"を使用すると、"VoiceGate"がカバーできる全周波数の範囲(概ね50Hz~10、000Hz)でノイズを制御することができます。

上段のウィンドウではフィルターが反応する現在の周波数応答を見せてくれる。
インタフェースの中央には、二つのウィンドウが表示されます。 上段のウインドウには、"VoiceGate"がカバーできる全体周波数範囲で、フィルターの現在の周波数応答が表示されます。 ユーザーはこのウィンドウを通じてフィルターによって減衰(attenuation)されるノイズの周波数領域とその減衰の程度を直接モニタリングすることができます。

下段のウィンドウではプラグインを通過する全体シグナルの量とフィルタリングされたノイズの量が確認できる。
下段のウインドウには、出力波形とともに灰色の入力波形が表示されます。 ここからプラグインを通過する全信号の量とリアルタイムでフィルタリングされるノイズの量を観察することができます。 灰色の波形はノイズフィルタリングによって切断された部分を示します。

Steady NoiseとImpulsive Noiseのパラメータ

Spectral Focusモード
VoiceGateを通過した音
Spectral Focus Modeでは、ユーザーが指定した狭い周波数領域でノイズを外科的に除去(surgical elimination)できるため、このモードで出るボーカルの他のノイズは触らずに、ひたすら高周波領域の歯擦音のみを除去することができました。 また、ユーザーは選択した領域のノイズをモニタリングすることができ、これはユーザーによって除去される、あるいは保存されるノイズを見つけるのに非常に効果的と思われます。
“VoiceGate”のマシンラーニングアルゴリズムは、様々なユーザー経験から得た新しいデータを持続的に人工神経網に追加することで、着実に改善されるでしょう。したがって、"VoiceGate"は人間のスピーチとボーカルから発生するほぼすべての種類のノイズを感知し、処理できるものと考えられます。
"VoiceGate"の主な用途:
- スピーチやボーカル録音のノイズをリアルタイムで減らす。
- クリック(click)やポップ(pop)ノイズを除去
- 背景雑音(background noises)を除去する。
- 多様な種類のノイズをリアルタイムで感知し、処理する。
- and more.
価格情報:
€84.00 EUR (84 ユーロ)
*macOS及びWindows用の7日間、全機能評価版を無料でダウンロードできます: こちら
Accentize マシンラーニング(machine learning)分野の最近の発展は、我々がデータを扱い、理解し、処理する方式を変化させた。 新たな理論的洞察力、自由に使えるプログラミングライブラリの増加、コンピューティングリソースへのアクセス増加により、データ処理問題を異なる角度から解決できる新たな可能性が台頭してきた。 Accentize社は最先端マシンラーニング理論をオーディオ信号処理領域に適用することに重点を置き、最先端研究とその生産実装間の格差を解消してきた。
コメント