バーチャルユーチューバーへたれちゃんですぅ~!(ミッキーマウス声で)
きっも
バ美肉の音質調整の難しさ
ボイチェンは茨の道
さてバーチャルユーチューバーとして受肉した訳ですが、声質の調整が難航しています。
2021年2月時点でのボイチェンはこんな感じ。まぁそこそこ違和感なく聞こえるようになってきたかな?と思う反面、他の人の声と比べると微妙に聞きづらいですよね。
少し高音部が足りないのかな。また調整しなきゃね。
一人での調整は難しい
おっさんが自分の声を自分一人で調整するというのは、実を言うと非常に難しいのです。
私の場合はマイクよりおっさん声をボイスチェンジャーに入れて、女声をヘッドホンでリアルタイムに視聴するという方法で微調整することがよくあるのですが、これには難点があります。
それは「ボイチェンからの女声に骨伝導で男声が混じる」為です。
女声を突き詰めると分かってくるのですが、鼻に乗ったミッキーマウスのような声は女声とは言い辛いですよね。
しかしこれにおっさんの低い響きのある声が骨伝導で重なると、割と良い声だと誤認識してしまうことがあるんですね。
私の目指している女声は艶のある大人の女性の声なのですが、ボイチェンでこれを実現しようと思うとかなり難しいです。というのも女性の艶のある声は男声に似た低い響きを含むものですが、これは同時に男声成分も含むので配分が難しくなるのです。
かといって高い声に調整しすぎるとミッキーマウスのようになったり、ケロケロカエルボイス(ケロる)になる。ここの微調整が本当に難しい。
調整には録音必須
これを防ぐためには女声を録音して聞き直すのが良い方法ですね。ハードウェア系ボイチェンはリアルタイムで女声に変換できるメリットがありますが、調整は録音しつつ行うべきでしょう。
子供の頃、自分の録音した声を聞いたら別人の声のように感じたことはありませんか。あのような状態が、ボイチェン調整時に起きてきます。他人が聞いている声=自分が聞いている自分の声ではないのですね。
あくまで、他人が聞いている声は録音して自分が聞いた声に近い、という訳です。なので自分の声を録音して聴くことが必須となります。
しかし、録音して調整というのも完璧ではないのです。
自分の女声に慣れるという恐怖
女声の調整をしていると、段々とボイスチェンジした自分の声に慣れていってしまいます。慣れというのは怖いもので、自分の女声の違和感に段々と気づかなくなっていくのですね。怖い。
この状態に陥ると、他人から聞いて違和感のある声であったとしても自分には判別が付かなくなってしまいます。例え自分の声を録音したものを聞いても違和感を感じなくなるんです。
こうなると自身のみでの微調整は難しくなってしまうんですね。
可能ならば他人に自分の女声を聞いてもらって調整するのが良いのですが、環境的にそれが難しいケースが多いですよね。
ボイチェン調整は長期戦
私のように一人でボイス調整はをする場合、長期戦となります。
声の違和感は録音した声を翌日に聴くとよくわかります。録音をしている当日には例え録音データを聞いても、微妙な違和感に気づかないんですね。
なので女声でゲーム配信をし、翌日にこの配信を自分できいて、女声の違和感を感じる部分を調整する、というPDCAを回していくスタイルになります。
この調整はボイチェンの調整は数ヶ月という長い期間で突き詰めていく事になります。その間、声に違和感を感じたリスナーさんは離れていく事になるため、できればリスナーがあまり着いていない初期の段階で女声を煮詰めていきたいですね。
自分の声質を見極める
数ヶ月かけてボイチェンの調整をしてきましたが、試行錯誤の中ですこしずつ自分の声質に関して理解を深めてきました。
イコライザーのどの部分を弄るとどのように変化するのか、高音をどの程度に配分すればいいのか、低音を入れすぎるといやらしくなるだとか、そう言った自分の声に対する理解が深まってくると、調整がやりやすくなってきます。
人間の声は千差万別ですから調整の方法も色々です。基本的に年齢が若い人は地声が高くボイチェンには有利となります。私のように年齢がある程度高いと地声が低くなりボイチェンが誤変換を起こしやすくなるので、とにかく誤変換を抑える調整を優先し、声を整えていきます。上で貼った動画はそのようにして微調整をしてきました。
配信時の女声
さてさて、またまた厄介な事に、オフラインで自分の声をうまく調整して身、YouTube配信すると声質が変化してしまうという事に悩まされる事になります。
これはOBSなどの配信ソフトでのエンコーダーとYoutube内の再エンコードによるもののようです。なのでいくらオフラインでいい声を作っても、アップロードすると声質が変わってしまうんですね。
これもやはり配信後に自分の動画を見直して、声の違和感部分を調整して・・・という繰り返しになるので、長いスパンで調整を考えていかなければなりません。これって結構大変です。
基本的にようつべに上げる際は高ビットレートが有利だと感じます。48khzの音声ビットレートよりも192khzのハイレゾのほうが女声のひずみが少なくて美しく聞こえる印象です。が、単純に192khzといってもオーディオインターフェース機器の価格、性能によって声質が天と地ほども差が出るため、オーディオインターフェースは予算の許す限り高額のものを選定する必要があるでしょう。
オーディオインターフェース
筆者のようにハードウェア系ボイチェンを目指す人にとってもイコライザーの調整は避けて通れません。イコライザーにはコンプレッサー、周波数調整、ローカット、ハイカットなど様々な調整ができます。これらの調整項目はオーディオインターフェースの性能に応じて設定項目が変わってきます。
筆者は高額なオーディオインターフェースを所有していますが、AGー03やus−366といった普及帯のものと比較するとその性能差は圧倒的です。
中古の車が買えてしまう程高額なオーディオインターフェースは女声変換で生じる違和感を極限まで取り除いてくれます。イコライザーの調整もやりやすく微調整も容易でありますし、入力、出力端子数も多いため私のようにシンセサイザーを繋いだり一人デュエット用にマイクを数本繋いだりもできます。
私が所有する機械は業務用の機器ですので、メーカーのサポートも非常に良いです。
可能な限り高額なものを選択するのがよいと感じました。
コメント