この記事の概要を簡単まとめ!
- VTuberの中でも多数派な「ボイスチェンジャー」型
- 現在は有料・無料問わず多くのものが存在する
- 無料で有名な「恋声」は致命的不具合を持ち、代替案を探す必要がある
- DAWとVSTプラグインで安定するという情報を聞き、検証することに
- VSTプラグインにはRovee, Graillon 2, DAWにはCakewalkを使用する
- 初期設定と登録が面倒であるが、それをこなせば問題ない
- VCn以外を目的としたプラグインも簡単に導入できる
- FFT(高速フーリエ変換)が使えるVSTでマイクノイズの除去も簡単
- DAW1つで殆どのことができ、負荷もかなり軽い
- VCnで困っている人、色々したい人の最適解は”DAW+VST“だった
声は、人の第二印象であると考えている。第一印象は外見で、これは言うまでもない。その次に五感で捉えることになるのが音だ。それも、能動的に発生させやすい声である。同時に声はその人のイメージの殆どを決める要素にもなり得る。それ故に多くの人が「第一声」を気にするのであろう、最初にかける言葉は大半が決まった挨拶である。それはそうで、いきなり自分のことを語りだしたとしたらそれは単に危ない人である。
VTuberもこれは同じだ。第一印象はモデル、第二印象はその声であることは簡単に想像がつく。しかし違いがあるとすれば、配信ないし動画投稿をメインとするそれは殆どの場合で「相手の顔が見えない」ことで、さらに不特定多数に見られる構図となる。一応コメントなどの機能があるのでリスナーからの反応を貰えるが、それでも顔は見えないので感情や考えは読み取れないものとなる。
ところでVTuberのモデルは理論上なんでもOKで、その際に考えるのが声である。自身とモデルの性別が一致する場合はそのままでいいとして、異性となる場合や人ではないものになる場合、声を変えて運用することも考えなければならない。その時に登場するのがボイスチェンジャー、私はVCnと呼んでいる。これまで無料である恋声を検証で使用してきたが、バッファが溜まるとフリーズする致命的欠陥を前に、新たな策を探すことになった。そしてある情報から最適解と思われるものに辿り着いた。今回はその検証となる。
ひとっ飛びできる目次
寄せ集めは決して「純正に劣る」わけではない
VTuberとボイスチェンジャー
現実とモデル間の性別の差
VTuberという概念、あるいは存在。今になってようやく一般的存在となったこれだが、1つ気になっていることがある。それは「モデルとしての男女比」である。企業系のVTuberは大手でも弱小でも、大半が女性型が多いように感じている。では個人の場合はどうかというと正直まちまちである。個人の場合は大手と違い、モデルの性別に人気はあまり関係はなさそうである。その時、たまたま目に入ったかどうかによるのであろう。
私の知る限り、純男性で明確に確定しているのはclea氏と伝説の男であり、伝説の男についてはモデルがたまに3Dで女性型を使うことがあるが、普段はLive2Dの男性型モデルを使用している。次に認識している卯塚ウウ(うーちゃん)は女の子(妖精)である。それ以外においてもやはり女性型が多く、男性型でやっている人はごく少数と考えてもいいほどである。VTuberの世界もやはり「そういう需要」があるのだろう。
ここで考えたいのが、現実とモデル間の性別の差である。最もわかりやすいのがうーちゃんで、本体である大道芸人うー氏は明確に男性である。これに関してはうーちゃんを観ている殆どの人が認識できていることであるはずだ。それ以外に観測できる(チャンネル登録などはしていない)「モデルが女性型のVTuber」は、殆どが生活様式を公開していない、或いはわからないようにSNS等で振る舞っていることもあって、現実の性別は明確には不明だ。実際の配信や動画投稿を見て、声質や発言内容をもとに推測することは可能ではある。ただ、重要なのはモデルと活動内容であり、現実のステータスをわざわざ深掘りすることはやめておくべきであろう。なお、大手VTuberは深掘りによる被害を受けている印象がある。
声質の変換:ボイスチェンジャーを使う
一般に男性は低~中音域、女性は中~高音域の声質である。これを前提として声だけ聞いたとき、それが男性であるか女性であるかを推定することができるであろう。もちろんこれに当てはまらない人はいるので、声だけでは正確な判定は行えない。また、この前提を持った状態で、男性型モデルで高音域、女性型モデルで低音域の声を聞いたとき、おそらく違和感を覚えるはずだ。これについては個人差はあるが。
ではその違和感を取り去るにはどうしたらいいか。2つの方法が考えられる。1つは声帯を「調教」し、その音域が出せるようにする。もう1つは文明の利器を借りて取り込んだ音声を変換する。前者は喉を傷める可能性が極めて高く、それ以外の身体を痛める危険があるので推奨されない方法である。そのため通常は後者の手段が用いられる。これは接続端子がUSBを採用していて直接接続できるものかミキサー経由で声をPCに取り込み、これをソフトウェアで加工して出力するという方法になる。これが最も一般的だ。
この際に使用するのがボイスチェンジャーと呼ばれるソフトウェアである。これで任意の音声に加工する、またはソフトウェアのプリセットに合わせたものを出力するものが多い。ただしこれだけでは変換した音声は出力されないので、PCに別途「仮想オーディオデバイス」を単体でインストールまたは音楽系ソフトウェアのプラグインとして追加されたものを使用して出力してやる必要がある。この方法については割愛するが、基本的な使用方法はインターネット上に先駆者の情報が多く残っているので、使えないことはないはずだ。後は実際に使って慣れろである。
有料・無料問わず多くのものが存在している
そのボイスチェンジャー、ここでは以降はVCnと呼ぶことにするが、一体どんなものが存在するのかを確認する。先駆者がこのページで綺麗にまとめてくれているので、その情報をもとに代表的なものを取り上げる。
- 無料のVCn
- 恋声(v2.87):無料のVCnの代表的存在。男→女、女→男のどちらでも対応しており、wavファイルを読み込ませることもできる。2018年5月時点で更新が止まっており、現在に至るまで何の音沙汰もない。よって今後一切更新されることがない。また致命的な不具合を持っており、これは後述する。
- Gachikoe! Core(v0.0.3):桜音さち氏が開発中の”Gachikoe!”のコア部分のみを抽出したもの。そのためピッチ・フォルマント・ゲインの変更のみが可能なシンプルなものになっている。”Gachikoe!”及び”Gachikoe! Core”のv0.0.3以外のものはFANBOXの支援で開発版を使用可能になる。
- Suara Lite(安定版0.14/開発版0.20):名古屋大学発のベンチャー企業であるTARVOが開発している。UI・設定項目共にシンプルであり、使いやすいものになっている。またwavファイルとして録音可能な機能も持っている。公式のダウンロードページに推奨スペックがあり、それによればi5(6th)以上で2.4GHz以上と、CPUの要求スペックは高いがその分処理能力は高い。
- 有料のVCn
- バ美声(¥2,000, v1.03, 試用版有):かつてはβ版として提供され、2021年11月に製品版として正式リリースされた。あらゆる面で簡単にできるようにUIとシステムが調整されている。フォルマントをピッチに応じて自動調整するようになっており、wavファイルの読み込みにも対応する。製品版がリリースされたため、β版は封印され現在は無料では使えなくなっている。
まあ黙っていれば誰も気付かないが。 - Voidol2(¥13,200):Voidolの機能強化版。AIによるリアルタイム声質変換を搭載し、これにシンセサイジングによる超低遅延声質変換エンジン(SYNTHモード)を追加。さらにサンプラー機能・イコライザも追加した強化版である。ちなみにVoidol2のリリースを記念して、旧製品となるVoidolが期間限定で無料配布されていた。
- バ美声(¥2,000, v1.03, 試用版有):かつてはβ版として提供され、2021年11月に製品版として正式リリースされた。あらゆる面で簡単にできるようにUIとシステムが調整されている。フォルマントをピッチに応じて自動調整するようになっており、wavファイルの読み込みにも対応する。製品版がリリースされたため、β版は封印され現在は無料では使えなくなっている。
- 番外編:ハードウェアVCn
- VT-4 Voice Transformer:ローランド製のハードウェアVCn。本体にマイクを接続して使用する。ピッチとフォルマントの変更が可能になっている。対応するマイクはフォンプラグ(おそらくφ6.35mm)・φ3.5mmであると思われる。電源は単三電池4本またはUSB Type-B(色がないため2.0と推測)。5種類×4つの計20種類のプリセットとワンタッチで切り替え可能なエフェクトボタン、シンプルなUIで使いやすいという。価格は変動するため掲載しない。
- ZOOM V6:ZOOM社製のハードウェアVCn。マイクが付属し(ケーブルは別途用意)、本体にはフットペダルが付属する。プリセットは40種類が既に設定されており、後からユーザー自身でカスタムプリセットを60種類作ることができる(合計100種類)。単純に高機能なので、下手なソフトウェアを買うよりも簡単に収まる可能性が高い。価格は変動するため掲載しない。
上記がVCnの中でも有名でよく使われ、検索結果にも出やすいものである。またハードウェアVCnはVTuberが使用する以外にもミュージシャンが使用することを想定して作られているものになっているので、頑丈で必要な機能があり、それでいてシンプルでわかりやすいように設計されているものがある。それぞれには特徴と得意・不得意がはっきりするもの、或いは似ていることができるものがあるので、無料の場合は導入してから比較、有料の場合は先駆者の情報を参考にするといいだろう。
使用していた「恋声」の致命的不具合
配信関連及びVTuber・VR関連の調査も行っている私は、正式な活動こそ行っていないが、実際の配信環境に則した状態を再現して調査もしている。その際、身バレ防止VCn勢の負荷も検証するために無料のVCnを導入していた。その際、使用していたのが「恋声」である。VCnの中では有名で、情報もある程度揃っていることから、最初に使うVCnとして最適であろうということで、メインに使用していたのである。
しかし恋声は使用しているうちに、致命的不具合を抱えていることを発見した。VCnは一度有効にしたら、不具合が発生したかPCの負荷が高すぎる場合以外はつけっぱなしにするはずである。恋声もそのように運用していた。しかし恋声の声質変換を有効にした状態で長時間使用していると、キャッシュが溜まりすぎて最終的にフリーズするという、明らかに使用上の問題が存在する。これは声質変換を一度終了してから再開することでキャッシュをリセットできるが、配信中はそれに気に掛ける余裕はないはずだ。これにより定期的に配信側の設備を確認しなければならないので、その意味ではストレスになってしまうことであろう。
一般的なソフトウェアであればこの問題が発覚すれば修正が入り、時間が経てば修正完了したバージョンがアップロードされ、これを利用できるようになる。だが前述の通り更新は一切行われることがないので、この不具合は抱えたまま使い続けることとなる。これでは運用に大変支障が出るので、今後の活動のことも考えると代替案が必要になる。そうなれば早々に動くのが吉である。
DAWとVSTプラグインで安定するという情報
VCnはメジャーな技術であるので、関連ワードを入れて調べればいくらでも情報が現れる。そうして調べている時に現れた情報が”DAW“と”VSTプラグイン“である。DAW(Digital Audio Workstation)は簡単に言えば「PCで完結するレコーディングスタジオ」で、スタジオにある全機能を1つのソフトウェアとしてまとめたものとなる1)参照:今さらですが、DAWとはなんですか?〜サンレコ編集長に直撃(1) – サンレコ 〜音楽制作と音響のすべてを届けるメディア。そしてVST(Virtual Studio Technology)プラグインはドイツ・Steinberg社によって開発されたDAWと外部のソフトウェアとの連携を行うためのプログラム規格である。現在はSteinberg社以外のDAWでもVSTプラグインに対応するものが多く、1つの規格としてはかなり普及が進んでいるものである2)参照:VSTプラグインとは?導入メリットやインストール方法を紹介 | G.C.M Records。使用方法としてはDAWにVSTプラグインを入れて任意の外部機能を使用可能にするという形になる。
それで今回使用するのは、DAWが完全無料でVSTプラグイン導入対応のCakewalk, VSTプラグインがRoveeとGraillon2(無償版)である。これらを組み合わせることによって、製品版に劣らないレベルの声質変換を実現しつつ、恋声で存在したキャッシュによる動作停止の問題に悩まされることがなくなる。なお、これに加えて仮想オーディオデバイスも必要となる場合もある。これはさておき、この3つを使ったVCnの手順について解説し、その結果について考察していくこととする。
3つの無料を組み合わせて行うVCn
検証するにあたって、まずは前述の3つをPCに導入する必要がある。よって導入方法と事前の設定方法について解説を行う。
DAWおよびVSTプラグインの導入
DAW”Cakewalk”を導入する
最初に導入するは大前提となるCakewalkである。元々GibsonがSONARとして開発・販売されていたDAWであるが、経営難に伴ってそれが停止されそのまま消えるかと思われていたが、シンガポールのBandLabがまるごと引き取って”Cakewalk by Bandlab”として復活した。その際に旧SONARユーザーに対して無料で利用できるようにするというアナウンスであったが、実際には全ユーザーに対しての無料開放であった。太っ腹である。
かつてはBandLabも同時にインストールしなければ使用できないものであったが、現在はCakewalk単体のインストールも可能になっている。よってここではCakewalk単体でのインストールで話を進める。以下の手順に沿ってインストールを行う。なお、インストール手順は先駆者の情報(1)(2)を参考にしている。
- BandLab公式サイトのCakewalkダウンロードページにアクセスし、インストーラをダウンロードする。
- インストーラを起動し、画面に表示される指示に従って進める。途中、追加のインストーラについてもインストールするかどうかを尋ねられる。次の6項目についてインストール可能になっている。
- Studio Instruments: ドラム、ベース、エレクトリックピアノ、ストリングスの4種類の音源が収録されているパック。DAW初心者用のパックである。今回の用途では必要はないが、おまけで入れておいても面白い。
- Drum Replacer: ドラムの録音データを解析して音の鳴っているタイミングを抽出し、他の音に差し替えることができるツール。これも今回の用途では不要だが、将来的に自作音楽などを作る場合には役に立つかもしれない。
- Melodyne: 音程の修正ツール。後から音程を直すことができるという。しかし、30日間限定の試用版であるのでカットした方がいい。
- Theme Editor: 色を変えられるだけである。いらない。
- Demo Projects: Cakewalkの素材を使用したデモプロジェクト。使い方を学ぶのに使用できる。
- Offline Help and Document: オフラインでヘルプが読めるようになる。しかし全編英語なので、読めなければ結局翻訳のためにインターネットが必要になるので意味がない。
- Cakewalk本体のインストール開始前に利用規約に同意するダイアログが現れる。これに同意して先に進む。インストールは標準でも問題ない。しばらくするとインストールが完了するので完了をクリックすると、BandLabのログインページが自動で開く。なお、このとき裏では追加のインストーラも同時に実行されている。
- Cakewalkはプロジェクトの保存にBandLabのアカウントが必須になる。非アクティベートでは保存できないため、適当な名前とメールアドレス・パスワードを入力後、送られてきたメールで認証を行う。その後、
クソうざいreCAPTCHA v2をクリアすることで認証完了となり、ログインページへ移行する。この時点ではまだログインしなくてもいい。 - Cakewalkを起動すると、初期設定ウィザードが現れる。次の3項目について設定を行う。
- オーディオのセットアップ:入力・出力デバイスの決定と、詳細設定からドライバーモード・サンプリングレート・ビット数を決定する。入力は普段から使用しているマイク、出力にはSYNCROOMのインストールで付属する(Yamaha SYNCROOM Driver (WDM))か、それに相当する仮想オーディオデバイス(出力用)を選択。ドライバーモードは「WASAPI共有」、サンプリングレートは44100kHz, ビット数は16bitでOK。これは一般的な音楽CDの規格と同じものである。
- ワークスペースを選択。本格的な作業をするわけではないのならどれでもいい。デフォルトでも問題ない。
- データ送信の同意。これも任意である。これを完了することで使用可能になる。
- プロジェクトを作成する画面が現れる。”Empty Project.cwt”を選択して空のプロジェクトを作成する(しなくてもOK)。このタイミングでCakewalkを使用中のPCからBandLabにログインすることでアクティベートが行える。ここまで行えば、Cakewalkはインストール完了である。

リスト化するとやることが多いように見えるが、実際にはダウンロードの待ち時間の方が長く感じることであろう。また、インストール中にBandLabのアカウント作成を行っておくことで、後のアクティベートも楽になる。導入目的は「ボイスチェンジャーを使うため」なのでアクティベートは別にしなくてもいいのだが、プロジェクトの保存はアクティベートが必須である。プロジェクトは保存しておけば後述の設定をすぐ呼び出せて、再度1から設定し直す必要はなくなるため、ここではアクティベートは一応しておくといいだろう。
なお、声質変換後の出力先として仮想オーディオデバイスを使用しているが、これはOBSに音声を出力させるために必要なものである。もし導入していない場合は、何かしらの仮想オーディオデバイスは必ず入れておくこと。
スポンサーリンク
スポンサーリンク
VSTプラグイン2種の導入
次に2つのVSTプラグインを導入する。この作業はCakewalkのインストールと並行してもOKである。Roveeはzipファイル内にあるdll単体、Graillon2はインストーラによる導入となる。Roveeについては公式サイトから最新版のzipファイルをダウンロードして任意の場所に解凍するだけで完了なため、全く難しいことがない。Graillon2は導入前のインストーラのダウンロードで少々問題があるので、リストで解説する。
- AUBURN SOUNDS公式サイトはURLが”auburnsounds.com”であり、検索エンジンによってはこのURL名を含むサイトが結果のトップではないことがある。必ずURLを確認した上で、公式サイトのGraillon2ダウンロードページにアクセスし、左の”Free Edition”のダウンロードリンクをクリックしてインストーラの入ったzipファイルをダウンロードする。
- 任意の場所に中身を解凍後、使用中のOSに合わせたインストーラを起動する。ここではWindowsを前提としているため、”Graillon-2-FREE-[version].exe”をクリックする。執筆時点での最新バージョンは2.6.0である。起動後は表示される内容に従って進めていく。
- インストール対象とインストール先を選択する。インストール対象はVST2.4/3.0/AAXで、インストール先は任意に選択できる。デフォルトではいつものProgram Filesに指定されるが、今回は探しやすさを考慮して、ユーザー領域の任意の場所に任意の名前でディレクトリを設定する。なお、64bitと32bitそれぞれのインストールとなり、それぞれのディレクトリをあらかじめ作っておくこと。決定したら後は待っていればインストールは自動で完了する。

上記の通りに行えば、おそらく問題なくインストール(うち1つは単純に解凍するだけ)出来ているはずである。このとき、RoveeのDLLファイルはGraillon2のインストール先の近くのディレクトリに入れておくといいだろう。Cakewalkに認識させた後から動かすのが大変であるためだ。さて、これでVSTプラグインそのものは揃ったので、これをCakewalkに認識させる。次の手順で使用可能になる。
- 上部メニューから「編集/環境設定」を開く。そのウィンドウの左メニューから「ファイル/VSTプラグイン」を選択し、その中にある「VSTプラグインの検索」からRoveeおよびGraillon2が存在するディレクトリを参照形式で追加する。このとき、検索が楽になるようにRoveeとGraillon2は同一のディレクトリに置くことを推奨する。
- Cakewalkで空のプロジェクトを作成し、トラックを作成する。マイクおよびスピーカーが初期設定のものと一致するかどうかも確認しておく。これらは後から変更も可能。
- トラックに「(電源ボタンマーク)FX」と書かれたものがある。そこのプラスをクリックし、そこから「オーディオFXの挿入(A)」で、RoveeとGraillon2を探してここに追加する。追加順は問わない。導入すると、別ウィンドウでそのVSTプラグインを操作することができるようになる。なお、同時に1つまでしか操作できない。

ここまでくれば準備完了である。どうやらオーディオFX(VSTプラグイン)は別ウィンドウで操作ができるようになり、同時に1つのプラグインしか操作できないようである。ただ、一度設定したら殆ど声質は変えないはずなのでそこはあまり気にならないことであろう。この点については、次項で実際に検証した際に考察する。
また、この状態のプロジェクトを任意の名前で保存しておくことで、オーディオFXにGraillon2とRoveeが既に入った状態で再開できるようになる。いちいち追加し直しが必要なくなり手間を省くことができるので、ここまで来たら保存しておくといい。
DAW+VSTプラグインでのVCn、検証開始
検証準備:プラグイン調整と出力ルート
検証する準備は整った。しかしまだやるべきことは残っている。ここまでは導入手順を書いただけであり、次に必要なのはプラグインを最適化することと、どのように出力するかである。この調整と出力ルートの確認を行うことで、ようやく実際に使用する準備が整うのである。
参考にしている先駆者の情報では、Roveeのフォルマントを0、ピッチを+6にし、Graillon2のピッチシフトを+1.98、プリザーブフォルマントを0としている。ただこれはその人の設定であるので、私の設定ではない。ここは個人差が出るところであるので、各自で結果を聞きながら調整していくといいだろう。
出力ルートについてであるが、これまではノイズ除去(前置)としてVoidolを声質変換機能を使わずにノイズゲートのみを利用する形で、バイパスで使用していた。ただ、CakewalkはVSTプラグインでノイズ除去機能を追加してやれば、ノイズ除去もそこで行えてしまうわけで、これができると無理にVoidolを経由する理由がなくなってしまう。つまりはCakewalk1つであらゆることが可能になるということで、もし負荷を抑えたり無駄に起動するソフトウェア・ツールを抑えたい場合には利用価値がある。またノイズ除去のVSTプラグインは多種多用なので、目的に合わせて選択できるのも利点である。その中には有料もあるが、殆どは無料のもので片付くはずだ。当然、プラグインの入れすぎは負荷に関わってくるため、何でも入れることはできない。
その前提のもとで調査すると、ReaFIRやDeeGateが候補となる。これは実際に使ってみて、使いやすいと感じた方を採用するといい。すると、経路は「マイク(in)→Cakewalk(Rovee+Graillon2+ノイズ除去)→Yamaha SYNCROOM Driver(out)」となる。これまで仮想オーディオデバイスを2本経由していたのが1本で済むようになるので、負荷と経由遅延も抑えられ、よりリアルタイムでの声質変換が可能になるはずだ。
検証:実際の出力結果はどのようになるか
これらの設定で、果たしてどのような結果になったか。配信こそ行えるタイミングではないので行っていないが、それに準じた状況で録画をした。この際、ノイズ除去にReaFIRを使用した。その結果が以下である。
例によって、タスクマネージャーを裏で録画して、それを編集で並べている。また、マイクはテスト用のダイナミックマイク(φ3.5mm3極接続)を使用しているので、元の音質は悪い。それもノイズ除去をあらかじめ行っているので、変な音が入り込むことは少なくなっている。
声質変換は、いくら無制限に変換可能であっても機械的な処理を施す関係上、完全な「女の子の声」にすることは無理である。これはうーちゃんを観ていると分かる。なので、自分でフィードバックを確認しながら調整していく。なお、極端に高くする/低くすると、テレビでよく見る匿名インタビューの声になってしまうので注意。遊びには最適だが、普段の声としては使えない。
それはともかく、確かにCakewalk(正確には導入したVSTプラグイン)で設定した通りの声質変換が行われており、仮想オーディオデバイスにそれを出力し、最終的にOBSで変換後の音声を出力できていると分かる。また、これまでは「マイク(in)→Voidol(Yamaha)→恋声(VB-Cable)→VB-Cable(out)」で、2つのソフトウェアと2つの仮想オーディオデバイスを経由していた関係で処理に時間がかかり、大幅な遅延で音声が出力されていた。今回の方法でダイレクトに音声を出力できるようになったことで音声の前に字幕が出るというガバガバな状況を回避できるようになった。また、タスクマネージャーから確認できるCakewalkの負荷は低く、全体的な負荷を下げることにも繋がっている。比較データは配信用PCとして導入したHasee Kingbook T65の負荷試験でのVoidolのみを使用したときで、CPU使用率及び使用優先度も低くなっているのが確認できる。また、音声についても安定して出力できていることが確認できる。Voidolの方はノイズゲートを有効にしていたが、そもそもの精度が微妙で、結果的にまともに音声を出力できていなかった。
ここでは音声テストをメインとしたため、VSeeFace+Leap Motionは使用していない。ただ、このレベルの負荷であれば同時に使用したとしても問題ないはずである。Kingbook T65はGTX 1050-Ti(M)が搭載されているため、CPUで行う処理をGPUに代行させれば、より安定度も増すことであろう。使用しているVSTプラグインも負荷が極端に高いわけでなく、ノイズ除去も優秀なものが多いので、Cakewalkだけで完結することができるようになるであろう。
スポンサーリンク
スポンサーリンク
評価:DAWだけで理想のものが作れる可能性は高い
複数のソフトウェア・ツールを同時に起動して複雑な設定と経路を構成し、それでいて品質は微妙で、負荷も高く、あまり積極的には使えないものであった以前の構成。それと現在のを比較すると、まず必要となる基本ソフトウェアがDAWのみで完結するという点で、用意するものが少なくなり、手間も負荷も楽になる。続いて声質変換のために必要な物はVSTプラグインとして、様々なメーカー、或いは個人製作のものを取り込んで、プラグインのパラメータ調整とプラグイン自体のON/OFFが自由に行える。明らかにDAWを使った方が負荷的にも安定し、仮想オーディオデバイスの数も少なく済み、何より設定手順が分かりやすい。最初にBandLabに登録する手間を考えても、DAWで済ませた方がいいというのがはっきりしている。
そもそもDAW自体は音楽制作のために使うソフトウェアだ。その中からヴォーカルの声を編集・加工する機能を抽出して使っているようなもので、そのためだけに金を出して使っていればただの馬鹿だった。しかし、BandLabが機能が十分に揃っているCakewalkを全ユーザーに無料配布しており、しかもVSTプラグインにも対応している。そのおかげで、Cakewalkを使えば、「音」に関連することなら殆どそれで済ませることができる。それこそ、声に関することはこれとVSTプラグインを揃えれば、ほぼ無料で理想の形に近付けることもできるはずだ。
私自身は音楽制作の才能はない。だがDAWを導入したことで、制作環境は入ったことになる。仮に本格的にVTuberの活動に介入するとなれば、将来的には音楽制作も必要なスキルの1つになってくることは十分あり得ることだ。達成したい目的と今後のことを含めて考えても、Cakewalkを入れる価値は十分にある。
VCnで困っている人、色々したい人の最適解は”DAW+VST”だった
ボイスチェンジャー、ボイスチャットの略称と混ざるのを防ぐために私はVCnと呼んでいるそれは、調査のためであって本気でやるつもりではなかったので、恋声やVoidolの、手軽なものを使用して検証していた。しかし恋声のキャッシュが溜まりすぎることによるフリーズと、Voidolのノイズゲートが微妙でノイズではない部分でさえ無駄に除去してしまうという問題点に悩まされていた。しかし最近、配信ないし録画によって検証を行うにあたってこの点で躓くのが気になってしまい、どうにか解決できないだろうかということで調査を行った。そうして出てきた答えがDAW+VSTプラグインだった。
しかもうまいことに、私とほぼ同じ構成でVCnをしていた人がいたのである。ちょうど同じように恋声のキャッシュ溜まりによるフリーズに悩まされ、その解決策を探していて、詳細に書き残してくれていた。その情報をもとに検証して、実際にどのような形になるかを録画して記録した。その結果は、確かに恋声よりもいい、というものである。正直、もう少し早く知っていれば良かったと思うほどだ。開発終了で今後修正されることのないものを使い続けるよりは、現在進行形でサポートされており、拡張機能が入れやすいものを使った方が利便性も高くストレスフリーである。これはどのソフトウェア・ツールでも同じことだが。
それに加えて、VSTプラグインに対応するDAWならまだまだできることを増やせる。具体的に何をするかは決まってはいないものの、今後DAWを使って検証していく上で問題が発生したとき、多種多様に存在するVSTプラグインを利用すれば殆どの場合で解決できることであろう。または、既に具体的にやりたいことが決まっている人は、それを実現できるVSTプラグインを探して導入すれば、簡単に解決できる。これらの点を考えてみればDAWは、音楽関係はほぼ何でもできる万能ソフトウェア/ツールであると言える。難しいと思っていたことでさえ、案外簡単にできてしまうかもしれない。
一昔前ならDAW自体は高額なソフトウェアであるが、今では機能が揃っていて、しかも無料で配布されているというのは少なくない。Cakewalkはその1つである。もしVCn関係で迷いがあるのなら、使わない手はない。幸いにも先駆者は多く、手順も然程難しくない。最適解の1つとして、導入してみてはどうだろうか。
以上、ボイスチェンジャー最適解探し:無料プラグインとソフトウェアで、であった。次は何の記事で会おうかな?
KIBEKIN at 08:00 Sept. 14th, 2022
スポンサーリンク