【字幕はもっと楽に、軽量に】ゆかりねっとコネクターNEO使ってみた!

この記事の概要を簡単まとめ!

  • 以前に2部構成でゆかりねっと+ゆかりねっとコネクター記事を執筆
  • 配信や動画制作で「字幕を使いたいが軽量化したい」と考える人もいる
  • 設定項目を極力絞り応答性向上を目指したのが「ゆかりねっとコネクターNEO」
  • ゆかりねっとコネクターから「字幕表示に必要な部分」を抜き出した形
  • 字幕の細かい設定についてもなるべく簡単にできるようになっている
  • 各種連携プラグインが実装されており、制作者のnao氏が要望に応じて随時更新している
  • ゆかりねっとコネクターより低負荷であり、実はゆかりねっとコネクターとの差が埋まりつつある
  • 余談:ゆかりねっとコネクター多言語字幕アンバサダーclea氏もここで軽く紹介
  • 字幕を簡単に使えるようになれば、言語の壁をクリアできるようになる

法人向けのPCは、発表当時には一般ユーザーが買えないものであるが、不思議なことに1年くらい経過すると中古市場に流れ始めて、発表当時よりも圧倒的に安くなり、スペックも現行のものより少し低い程度で十分に使えるものが多い。不思議なことに私は運がいいのか、競合が少ないためにオークション形式のものを安値で競り落としたり、少しの傷や問題によって「ジャンク」扱いされているために安くされている所を真っ先に見つけては購入し、実際に試している。先日公開した記事であるVKT12/SG-5も、早速使いこなしている。

さて、ここしばらくは本業が忙しいために配信そのものはできるタイミングが少なく、それに関する記事も書くことが難しかった私であるが、前に執筆したゆかりねっとコネクターを使用した2つの記事は度々閲覧されているものとなっている。またこの記事、実は書いてしばらくしてからゆかりねっとコネクター制作者のNao氏から反応があり、加えてゆかりねっとコネクター公式アンバサダーとして活動しているclea氏と相互フォローとなった。このことから、字幕に関する関心は一定数存在していると分かる。

ゆかりねっとコネクターは字幕表示以外にも様々なソフトウェアと連携可能なものであるが、プラグインが多数搭載されている関係からPC自体の動作が重くなることも少なくない。そこでNao氏から字幕表示に特化し、軽量化を行った「ゆかりねっとコネクターNEO」が公開されている。字幕表示に限定して調整されている結果、応答性が高いものとなっているこれ。ゆかりねっとコネクターとはどう違うのかについても見ていくこととする。

ブンブンハロー軽量化された字幕表示ソフトウェア、どうもKIBEKINです。

ゆかりねっとコネクターと字幕表示

前提条件:2つのゆかりねっとコネクター記事について

本題の前に、ゆかりねっとコネクターについて書いた以前の記事について振り返る。当初の目的は「音声を出さずして配信者の意志を伝える方法」を探していて、それを実現する方法が「音声認識を用いて字幕表示をする」という結論に行き着いた。それを実現するソフトウェアやシステムを探していた時に発見したのが、音声認識と結月ゆかりが喋っているように見せる「ゆかりねっと」(おかゆぅ氏制作)と、字幕表示と他ソフトウェアとの連携プラグインが多数標準装備となっている「ゆかりねっとコネクター」(Nao氏制作)の2つだ。最初はこれを組み合わせることで字幕表示を実現させていた。

その後も調査を進めていくと、ゆかりねっと以外のアプリとも連携が行えるものの中に、UDトークが存在した。使用するマイクにもよるが音声認識度はかなり高く、スマートフォンとPCを直接接続することで送信ラグを極力低くしてPC(ゆかりねっとコネクター)に送信することが可能である。ただし私の当初の目的は翻訳システムに満足いかなかったので、UDトークの翻訳システムをそのままゆかりねっとコネクターで使用できないかと考えたが、残念ながら翻訳結果までゆかりねっとコネクターに送信することはできず、翻訳はゆかりねっとコネクターの設定に準拠するものであった。音声認識精度の高さとUDトーク側で単語設定ができる点で便利なものであったことは判明した。

スポンサーリンク

スポンサーリンク

上記のこれらの記事は、ゆかりねっとコネクターに関しての情報をまとめたものであり、この2つを読むことで殆どのことが分かるようになっている。字幕に関する研究は動画ベースでは多数存在するが、記事ベースでも多数存在するようで、ゆかりねっとコネクターで検索をかければ様々な情報を得ることができるはずである。この手の物は困ったときは検索して情報を集めるのが基本である。

字幕を使う状況はどんなときか

動画型コンテンツにおける字幕とは、難聴でもコンテンツを楽しめるというところや、単純に喋るだけではなかなか伝わりにくい言葉を視聴者に伝えたいときなどに役に立つものである。多くの動画型コンテンツは映像=視覚、音声=聴覚に依存するものであるため、それのどちらかに「異常」があると、まず楽しめるものではない。が、視覚が生きている場合は失われている聴覚の「補助」となる字幕があれば、雰囲気を読み取って楽しめるはずである。これは地上波等のテレビで実際に行われている補助機能の1つとして存在する。流石に字幕だけでは音楽まで再現することは不可能だが。

ところで動画投稿ないし配信においても、字幕は一般的なものになりつつある。特に動画投稿において字幕のない動画は(単にBGMを流すだけなどが目的でない限り)全くないはずだ。その場合はエフェクトも追加して、動画の見栄えや強調したい部分の強化を行い、世界中に存在する似たような動画と「差異」を付けて視聴者の目を引くようにしている。その方法に関しては最初はオマージュから始まることであろう、それを繰り返し使用していくうちに1つのフォーマットとして確立していくことなるはずだ。

それとは別に、配信でも字幕は使うものになっている。それがどんな状況になるかといえば、配信時声があまり出せない時、声だけでは伝えにくいことを伝える時、解説の補助、翻訳の表示、様々なことが考えられる。広義の配信であるテレビで考えると、生放送のニュースで字幕(テロップ)が次々にその内容に合ったものに切り替わって、視覚的に何の内容についてなのかをわかりやすくし、同時に映像とアナウンサーが読む内容だけでは伝わりにくいことの補助に使われていて、なんとなくイメージが掴めるはずだ。それも視聴者の最適なタイミングで字幕が表示されるが、これはTV局という大きな組織であるため、放送前には原稿が用意され、その通りに進めて、それぞれ役割分担された人(テロップ専門)によってタイミングを合わせて表示するようにしているためだ。原稿から逸れた進み方になると字幕がなかったりするのはそのためである。また、先の読めないタイプの生放送でテロップを出すときは、ある程度の「テンプレート」を用意して結果が判明次第すぐに反映して表示するようにしていることであろう。お笑い番組ではよく見る光景である。

配信となるとTVとは事情が違うため、1人で全て管理して配信しているのなら流石に派手なエフェクトを持った字幕・テロップを狙ったタイミングで出すということは難しいはずだ。テンプレートを用意しているのなら不可能ではないにしろ、通常は作業或いはゲームのコントローラーから手を放すことが難しいはずなので、ここぞというタイミングで出すことは無理だ。ただ、喋っている内容については、現在の技術の進歩を上手く使えば、音声認識によってその内容を読み取らせ、ある程度の「日本語」になるように補正を行ってそれを表示する、というものになる。表示した字幕は背景をクロマキー合成できる色で別ウィンドウで表示し、それを配信ソフトウェアのソースとして取り込んだ後にクロマキー合成のフィルタを用いて背景を透過すれば、字幕として使用可能になる。これが配信における一般的な字幕の表示方法となる。

ゆかりねっとコネクターの負荷

このブログではゆかりねっとコネクターで字幕表示を行う方法について書いてきている。したがって私もゆかりねっとコネクターで字幕表示をしていたわけだが、少しだけ気になったことがあった。それはソフトウェア自体の負荷である。原則として音声認識→翻訳処理→字幕表示を行う。このとき翻訳には標準(無料)のもの、個人契約で設定または支援プランによって解放される翻訳APIのうちいずれかを選択するが、それらAPIはいずれもインターネット接続していなければ使用できないものである。したがって翻訳のラグが多少なりとも発生するが、これは正しい現象である。あまりにも驚異的に長いラグがあるなら、インターネット環境を見直す必要がある。



それとは別に、翻訳を表示する際の処理やゆかりねっとコネクター自体の他のプラグインや連携中のソフトウェアとの動作の関係から、どうしても表示で重くなる瞬間がある。もし1台のPCで配信・ゲーム・字幕生成・その他YouTuberないしVTuberの運用に必要なソフトウェアの起動及びエラーが出ないよう安定的に稼働させることを同時に行うと仮定すると、石油王並みのスペックを求められることは間違いない。しかし昨今の事情を考えると、LGA1200のマザーボード+i7またはi9(11th Gen)+RTX 2080以上+DDR4-2666以上のRAM(16GB以上)+ストレージ用のM.2 SSD(1TB以上を想定)+1000W(80plus gold以上)、他にも各種パーツやモニタを用意しなければならない中での半導体不足から、それらのパーツは販売しているのを見つけることすら難しく、仮にあったとしても超高額であり、普通の人が気軽に買える価格ではない。全て新品なら最低でも100万円以上はかかると推測している。石油王と比喩したのは、このことがあるためだ。

したがって多くの人はそれよりも下の性能の、全ての設定を最高設定にはできないがゲーム”のみ“を考えた場合にはプレイするに支障のない設定ができる構成になっていることであろう。だがここに、配信ソフト・VTuberのアバターを動かすソフト・ゆかりねっとコネクターを同時に動かしたとしたら。私は試したことがないが、おそらくまともにはプレイできなくなるはずだ。そうでなくとも、字幕と配信ソフトを同時に動かしている場合、負荷はそれなりにある。字幕表示の応答性にも影響が出ることが予想され、それは視聴者の体験に影響することも想像に難くないはずだ。リアルタイム(に近い)字幕表示を行うためには、可能な限り修正したい要素である。

設定項目を極力絞り応答性向上を目指したのが「ゆかりねっとコネクターNEO」

私の場合はゲームと配信・字幕を分離して運用していたので、上記に挙げたことは発生することはまずない。だがその状態でも、頻度は少ないがゆかりねっとコネクターで字幕を生成するとき、インターネット関係でなく、スペック不足でもない、表示のラグが発生することがあった。プラグインで使わないものは切っておくなどの軽量化手段を取っていても、様々な用途に対応できるように多機能化されたゆかりねっとコネクターはソフトウェアとしては重い方にはなるであろう。それに多機能でも使わない機能があるなら、デッドウェイトになってしまう

そこで新たに生み出されたのが、設定項目を極力絞り応答性向上を目指したゆかりねっとコネクターの軽量版、「ゆかりねっとコネクターNEO」である。ゆかりねっとコネクターがエンターテインメント性を重視した設計であるため、多機能で多彩であるのが特徴である。ゆかりねっとコネクターNEOは、そこから字幕表示に関わる部分を中心に必要となるものを取り出し、字幕設定についても簡略化を行って、音声認識から表示までの時間を短縮したものとなる。したがってゆかりねっとコネクターNEOの位置付けは字幕表示特化のコミュニケーションツールとなる。できることはゆかりねっとコネクターよりも少なくなってはいるものの、字幕だけ欲しい、負荷低減及び字幕に早さを求める人にはちょうどいいものになる。

今回はゆかりねっとコネクターNEOを使用し、字幕を表示し、調整をするところまでを行う。なお前提として、ゆかりねっとコネクターとNEOはインストール済みであるものとし、以下ゆかりねっとコネクターをゆかコネ、ゆかりねっとコネクターNEOをゆかNEOと省略する。次項よりゆかNEOをしっかり見ていくこととする。

ゆかりねっとコネクターNEO、設定備忘録

ゆかNEOも基本はゆかコネに準ずるものである。そのため以前の記事で使用したゆかりねっとやUDトークとの接続も可能である。ゆかりねっとコネクター使用者やVTuberとして活動している人であるなら、おそらくはこれらのソフトウェア(アプリ)もインストール済みであるはずだ。したがってこれらのインストール方法、設定方法、接続方法についてもここでは省略する。あくまでもメインはゆかNEOである。




ゆかりねっとコネクターNEO:設定

インストールについては何も難しいことはないはずだ。まずはインストールを行う。インストールが完了すると、以下の状態になっている。

ゆかNEO初期画面
ゆかりねっとコネクターNEOのインストール直後の状態。縦型。ウィンドウ幅は自由に伸ばせるが、横に伸ばしても項目が増えないので伸ばす意味はない。

この状態が初期状態であり、元となるゆかコネと比較すると縦型でコンパクトな印象を受ける。ところでゆかコネでは各メニューはタブ形式でそれぞれのメニューを切り替えて色々設定する形式であるが、ゆかNEOではそれはなく、縦にスクロールして設定したいメニュー欄を探し、そこから設定を変えていく方式となる。まずは基本設定から確認していく。

基本設定を呼び出すには左上にあるスパナとドライバーっぽいアイコンをクリックして、オプションを呼び出す。基本的に変える部分はないが、次の項目については確認しておくといい。

  • ブラウザウィンドウサイズ:字幕を表示するためのウィンドウの大きさを変更できる。「ウィンドウサイズをロック」をチェックすると設定した幅で固定される。OBSに取り込む前はロックせず、取り込んで位置を確定させた時にロックするといいだろう。
  • 翻訳APIオプション:「翻訳APIの使用を節約する」のみ。これをチェックすることでAPI使用量を減らすことができる。個人で契約したDeepL(無料・50万文字/月)や有料APIの使用の際は必須項目である。
  • オプション(ブラウザの位置):音声認識をブラウザ経由で行う場合に使用するブラウザの設定を行う。音声認識にはChromeとEdgeの2つがあり、それぞれは特性がある。説明によればChromeは応答性、Edgeは変換精度に優れている。どちらが良いかは任意である。もちろん、それぞれのブラウザがインストールされていない場合は使用できないので注意。ブラウザの位置は基本的にデフォルトのインストール場所がセットされるが、手動入力も可能になっている。デフォルト以外に置いている場合は手動入力で指定する。
ゆかNEOオプション初期画面
ゆかりねっとコネクターNEOのインストール直後のオプション。必要に応じてここにある設定を変更しておく。ブラウザは標準でEdgeが指定されている。

とはいえ変更点については現段階では特にないので、ブラウザは好きなもので設定しておくといい。もっともUDトークやゆかりねっと経由の場合、ここは全く関係なくなるので設定すら開く必要はなくなるであろう。なお、ここでは軽量化を目指すため、UDトークとの連携を中心に記述し、ゆかりねっととの連携は追加項目として記述する。

UDトークとの接続設定の調整

ゆかNEOの「音声認識の種類」の欄までスクロールする。これまでゆかコネを使用したことことがない、またはゆかコネをインストールしていてもUDトークの設定を行っていない場合、まずはUDトークから招待を送り、トークが認識できるようにする必要がある。今回は最もディレイがなくなる方法である、スマホをサーバー化して接続する方法で解説する。

手順1:UDトークアプリでスマホをサーバー化し、ゆかNEOに招待を送る

第2回記事ではUDトークをゆかコネと接続する方法を記述しているが、実は説明不足であったので再度作ることとした。改めて解説するにあたって、スマホをサーバー化し、ゆかNEOに招待を送るまでを画像付きで構成した。その手順が以下である。なお、検証はAndroidで行っている。

  1. UDトークアプリを開き、右上のメニューから設定を開き、中央くらいにある「接続先(サーバー)として起動する」にチェックを入れる。また、その上にある「名前」はデバイス名を設定するものであり、任意のわかりやすい名前にしておくことでゆかNEOからの接続時に迷わなくなる。
  2. ホーム画面の一番上に「[デバイス名]に接続する」が表示される。これを開いてトーク画面に移動する。
  3. トーク画面の右上のメニューから「トークを公開する」を選択する。
  4. 中央の「トークを公開する」を選択してトークを公開する。公開するとQRコードが表示された状態になる。この状態で上から「招待する」を選択する。
  5. 表示されたボックスにゆかNEOのユーザーID(8桁数字)を入力し、OKで送信する。これでUDトークでの設定は完了である。
ゆかNEO UDトーク設定(新)
ゆかNEOと接続する前にUDトーク側で設定する内容。アプリはAndroidである。この手順でスマホをサーバー化し、ゆかNEOに招待を送るまでがUDトークで行うこととなる。

iOS版については事情により検証不可能であるが、おそらくそこまで変わらないはずだ。ここまで出来たら、次はゆかNEOの設定になる。



手順2:ゆかNEOから招待を確認する

ここまで出来たら、ゆかNEOを操作する。と言っても簡単で、「音声認識の種類」はUDトークにセットされているはずなので、そこの「招待確認」をクリックする。UDトーク側でユーザーIDが正しく入力されていれば接続先一覧の中にその「名前」が表示されるはずだ。接続できるかどうかについては、接続したい接続先に合わせて「接続」をクリックし、ステータスが「接続中」になれば完了となる。

ゆかNEO UDトークの接続先を追加
ゆかNEO側でのUDトークの接続先を追加する。入力したユーザーIDが正しければ「招待」をクリックすることで接続先が追加される。接続には接続先を選択して「接続」をクリック、終了する場合は「切断」で終了できる。

上記のようになっていれば、UDトークの接続設定は完了である。接続ができることを確認したら忘れずに「切断」で接続を終了しておく。これでいつでもUDトーク経由の入力が可能となる。

追加項目:ゆかりねっとと接続する場合

内容は原則としてUDトーク経由を前提とするが、ゆかりねっととの接続もここで解説しておく。と言っても設定は非常に簡単である。ただし1つだけ注意したいのは、ゆかNEOでは設定項目が省略されているため、それぞれのソフトウェアを起動する順番が重要になる。

肝心の接続方法は、ゆかりねっとを起動していない状態で「音声認識の種類」をゆかりねっとプラグインに変更し、その状態でゆかりねっとを起動するだけである。使用するポートはTCP/50000以降のポートで、これは自動で接続される。後はゆかりねっと転送プラグインを有効にしてやれば、音声認識した結果がゆかNEOに転送され、字幕表示と翻訳を行ってくれるようになるのである。

表示前の設定調整

翻訳言語を変更する

今すぐにでも字幕を表示したい気持ちはあるだろう。しかし先に翻訳する言語について変更しておく。調査した段階では、ゆかNEOではゆかコネと違い、初期状態でも4つの言語を同時に翻訳して使用することができるようになっている。したがって様々な言語で翻訳する際には非常に便利なものとなっている。ただし本記事においては解説のため翻訳は1つに絞って話を進める。

翻訳設定を行うには、ゆかNEOの「翻訳設定」までスクロールする。この欄は初期状態であると、次のように設定がされている。

  1. 「17:英語」「Google翻訳」
  2. 「108:中国語(簡体)」「OFF」
  3. 「50:韓国語」「OFF」
  4. 「19:スペイン語」「OFF」

どういうわけかこの初期状態となっている。選択できる言語はおよそ110種類であるようで、その中から任意の言語を1つ選択することができる。翻訳エンジンについては原則としてGoogle翻訳以外は使用できないのでそれを選択する。だが前述の通り、ここでは英語以外の設定について、それぞれのプルダウンメニューから一番下にある「999:表示なし」に変更する。設定変更については、変更内容を手動でセーブする機能は存在しないが、閉じるときに設定が自動セーブされるためそこは気にしなくても問題ない。これで基本設定は完了である。

表示する字幕のフォント設定

字幕を綺麗に見せるには、字幕の調整を行わなくてはならない。これはゆかNEOでは「設定」の欄にある。設定できる内容は以下の通りである。

  • フォントサイズ(全ての言語対象):母国語・翻訳全てのフォントを一律で調整する。調整はスライダーで行う。値は2.00~100.00。フォント位置は左寄せをデフォルトとし、中央と右寄せが選択できる。フォントそのものはプルダウン選択式で、デフォルトがMS ゴシック。以下、数値で調整できるものは全てスライダーで調整するものとなる。
    • 個別にフォントを調整する:チェックを入れることで翻訳単位で調整可能になる。調整できる内容は上に同じ。
  • 縁取りサイズ:表示される全ての文字の縁の大きさを変更する。値は0.00~20.00。
  • 保持時間:字幕を保持する時間を変更する。値は1.00~30.00だが、30.00にすると字幕が消えない設定になる。よって通常は30以下の長すぎない時間に設定するべきである。
  • 音声区切り:音声を区切るタイミングを変更する。値は100.00~10,000.00。短くすると反応が良くなる分文章の区切りが細かくなるため、意味の通らなくなる文章が生成されやすくなる。特に用事がなければデフォルトで問題ないであろう。
  • 行間:行間を設定する。値は0.50~4.00。設定しないとまず使い物にならないので、最低限1.00にしておく。
  • 段落間:段落間を設定する。値は-3.00~20.00。ただ、変更してみたものの、どこが変わったか分からなかった。
  • 文字間隔:1文字単位の感覚を調整する。値は-0.50~2.00。最低限0.00以上にしないと使い物にならない。
  • 整形モード:1行・2行・加工なしの3つから選べる。デフォルトは加工なし。基本的には加工なしで問題ない。
  • 色の変更:以下の色について変更可能である。
    • 言語名:言語名の表示を変更する。左が文字、右が背景。表示のチェックはデフォルトでチェックされており、これを外すと言語名(英字略称)がなくなる。必要ない場合はチェックを外すといい。
    • 文字色:字幕ないし翻訳の色を変更する。左が文字、右が背景である。
    • 縁取り色:縁取りの色を変更する。単色のみ。
    • 枠の色:枠の色を変更する。右が区切り、左が全体背景である。
  • レイアウト:プルダウン選択式で、「多言語・リスト・ゲームメッセージ風・多言語(縁取りくっきり/言語表示なし)・ゲーム風(カーソルあり)」から選択する。デフォルトは多言語で、変更の反映は一度字幕表示ウィンドウを閉じてから再度ウィンドウを開く。なお、特定のレイアウトは一部の設定が無視される



画像解説については最初の方のものを参照してもらうとして、字幕調整はゆかコネよりも設定方法が簡単になっていることが分かる。その分特殊な操作や調整は難しいが、音声認識を字幕化すること「だけ」が必要ならこれで十分になるであろう。なお、標準搭載されたプラグインで一部の特殊動作をさせることは可能になっている。ただしここではそれらについては考えないものとする。

調整した結果については実際に字幕を表示させないと分かりにくいはずだ。字幕を実際に表示するウィンドウはゆかNEO左上のアイコンの一番左にあるウィンドウマークのアイコンをクリックすることで表示される。実際に表示させてみると次のようになるはずだ。

ゆかNEO 字幕表示
ゆかNEOで実際に字幕を表示させている状態。ゆかNEOにもテスト入力して送信できる場所があり、ここで字幕の状態を確認できる。テストを繰り返しながら最適な状態に調整する。

ゆかNEOはゆかコネと同様、テスト入力できる場所がある。それを利用することで実際に音声入力をしなくても字幕を表示させることができる。調整は通常1回で決まるものではないため、何度もテスト表示して最適な字幕表示ができるように調整していくといいだろう。

字幕を配信に反映させる

ゆかNEOで出来る設定はここまで行えば、後は実際に配信に反映させるだけである。今回の方法はウィンドウキャプチャとクロマキー合成を用いて透過させる方式で行う。なお、使用するOBSはSLOBSとし、背景はクロマキー合成のために緑を使用するものとする。

OBS設定:ウィンドウキャプチャ追加

OBSについてはあえて解説する必要はないであろうが、一応手順は示しておく。任意のシーンで新規ソースとしてメニューから「ウィンドウのキャプチャ」を選択し、そこから「[msedge.exe]: ●ゆかりねっとコネクター 多言語表示」を探して選択する。その際の設定項目は、一致優先順位に「ウィンドウのタイトルに一致する必要があります」にセットし、「カーソルをキャプチャ」のチェックを外しておく。これで完了をクリックすれば、そのウィンドウが追加されているはずである。

ゆかNEO字幕窓をSLOBSへ取り込む
ゆかNEOの字幕ウィンドウをSLOBSへ取り込んだ状態。この状態から調整を行っていく。

OBS調整:クロマキー設定とトリミング

次にクロマキーを設定して透過を行い、さらにトリミングを行う。どういうわけかゆかNEOのウィンドウはクライアント領域にチェックを入れていてもウィンドウタイトル部分が消えないことが判明した。したがってクロマキーを行うと同時、トリミングも行う必要がある。その方法については以下にまとめている。

  • トリミング:対象のソースに対し右クリックメニューから”変換/変換を編集”を選択し、その中の「トリミング」から上に28~30pxで設定する。通常タイトル幅が変わることはないのでこれで問題ない。
  • クロマキー:対象のソースに対し右クリックメニューから”フィルター/フィルターを編集”を選択する。表示された画面から”Add Filter”をクリックし、フィルタータイプをクロマキー、フィルタ名は任意で、色キーの種類を透過したい色に設定する。他の項目は変更する必要は特にない。
字幕のフィルタとトリミング調整
取り込んだウィンドウをフィルタと変換で調整し、使えるようにした状態。これで基本的な見栄えは良くなる。

ゆかNEO設定:ウィンドウサイズを直接変更

従来であれば各要素のサイズ設定はOBSで行うが、字幕をウィンドウ表示する場合のみ、表示するウィンドウそのものの大きさを変更する方法で配信画面では対応させる。これはOBS側からウィンドウ幅を変更すると、字幕が非常に小さくなってしまうためである。よってここではウィンドウを直接変更することで対応させる。なお、どこに置くかはそれぞれの配信画面に依存するので、調整に関しては私のものは参考として見てもらいたい。

字幕の幅調整
字幕の幅をウィンドウサイズで直接調整した状態。調整はOBSの画面を見ながら行うといい。

ゆかNEO設定:字幕が見えるようにする

調整していると、字幕が見えにくいことが分かるはずだ。そこでフォントサイズやフォントカラーを変更して、配信画面を見たときに見えにくく、しかし見辛いことがないように調整していく。このあたりは何度も調整していくことで見えやすい字幕を作っていくといいだろう。私の場合は調整すると以下のようになった。

字幕の幅調整2
字幕の文字の大きさを調整した状態。文字の大きさのめやすとしては、表示している方で見えている枠線が見えなくならないように調整するくらいである。

なお、字幕テストの際に発見したのが、ゆかNEOで一定時間無操作でいると、テスト入力も音声入力も認識しなくなることを発見した。これは仕様であると思われるが、テストの際は注意したいことである。もっとも、実際に使用する場合には常に音声認識して字幕を表示しているはずなので問題ないであろう。或いは最新版更新することで、この問題は解決するはずだ。

ここでは2つの字幕で最適表示になるように設定をしたが、他の翻訳も表示する場合はウィンドウ幅を十分大きく取らなくてはならない。しかし字幕スペースを広げすぎると映像や他の部分のスペースが小さくなり、字幕を使用する意味があまりなくなる。その場合は映像内に直接字幕を配置するか、字幕の大きさを小さくすることで対応することになる。このあたりは実際に試して調整してもらった方が早いであろう。

字幕表示の方法については、これで完了である。この通りに行えば、今すぐにでも翻訳字幕を使うことができるであろう。




余談1:ゆかNEOはゆかコネとの差が埋まりつつある

最初の画像で表示したのでおおよそ想像はついているかもしれないが、実はゆかNEOでも多数のプラグインが存在し、他のソフトウェアとの連携をサポートしている。したがってゆかコネで出来たことが、ゆかNEOでも殆どが出来ることを意味している。プラグインの導入については制作者であるNao氏が要望に順次対応する形で追加されており、更新も常に行われている状況だ。

また本人Twitterのツイートによれば、「ゆかりねっとコネクターとゆかりねっとコネクターNEOとの差は埋まりつつある」とも発言したことを見たことがあり(ただし私の記憶違いの可能性もある)、一部の機能が省略されていることだけを考慮すれば、ゆかNEOはほぼゆかコネと変わらないところまで来ていると言っても過言ではないはずだ。両方使用してみて、自分が使いやすいと思った方を使う、そんな対応でも十分問題なく使っていけるはずだ。

余談2:ゆかりねっとコネクター多言語字幕アンバサダーclea氏

特定のジャンルの内容について話題にして、制作したことをSNSに流すとたまに反応がある。しかし多くは事実上の「無反応」に近く、視認しても読むことやそれについての感想を言う者は少ない。もっともこれは私自身、弱小ブログクリエイターであり、胡散臭い「ブログで(実質詐欺で)稼いでます!」のアヘカス野郎系とは路線を大きく外れた、逆にそれを嫌うスタイルでやっているが故の結果であるのは重々承知している。

しかし以前、ゆかコネ2部作の記事を流したときには、制作者のNao氏が反応し、さらに面白いことに『ゆかりねっとコネクター多言語字幕アンバサダー』(公式)として活動しているVTuber・clea氏が反応し、これによってお互いに繋がる結果となった。clea氏はYouTubeを主戦場とし、配信及び動画制作においてゆかコネのリアルタイム翻訳字幕を使用している。そのコンセプトが『1つのゲームを世界で楽しめる』『難聴の人にも楽しんで貰いたい』というものである。動画以外にはバーチャルスタッフ等で活躍する姿が見られる。

動画コンテンツとはどうしても音声に依存してしまうものがあるのだが、そこに字幕があれば難聴であっても話者=配信者ないし動画投稿者の会話を「観る」ことができるようになり、一般視聴者と共に楽しむことができるようになる。また、動画コンテンツは総じてグローバルコンテンツの現代では、世界中の人物が母国語以外で構成されるコンテンツを観ることすら一般化している。その際に翻訳も同時に表示できるとなれば、動画投稿型なら話している内容を理解でき、配信ならリアルタイムでコミュニケーションを取ることも可能になる。そんな「境界を取り除く」活動をしているclea氏、今回は紹介のみに預かるが、いずれはclea氏で1つの記事を書く予定である。またclea氏が気になる人は、まずはTwitterとYouTubeをチェックするといい。

clea YouTubeチャンネル
clea氏のYouTubeチャンネル。字幕と翻訳で様々な「境界」を取り除き、1つのゲームやコンテンツで同時に盛り上がれるよう常に試行錯誤をしている。

字幕を簡単に使えるようになれば、言語の壁をクリアできるようになる

現在は事情により配信そのものには手を付ける余裕がなくなってしまってまったくもってサボってしまっているが、「字幕表示をもっと楽にできないか」ということで、ゆかりねっとコネクターの軽量版であり設定も簡易化されたゆかりねっとコネクターNEOを実際に試し、字幕表示までの基本的な設定と実際に表示させた結果についてここまで書いてきた。

以前にゆかコネを使っているのだから当然のことだが、使用時の感覚はゆかコネとほぼ同じでありながら、設定が実に楽で手軽に使えたので、ゆかコネを現在使用している人でも不満がなく使えると感じた。また、それ以前に字幕や翻訳を行うソフトウェアを全く触ったことがない人でも、説明書があれば問題なく扱えるものであるとも感じ、これから動画にまつわるコンテンツに関わっていくなら、「一応入れておく」という感覚でも十分なはずだ。

また、ゆかコネ共通の事項として、母国語の設定が可能である。つまり音声認識において中心に認識する言語をそれぞれ設定できるというものである。その時点でゆかコネはグローバルなソフトウェアであることが言える。ということは、それぞれの言語に対応した説明書とUIが搭載されれば誰でも様々な言語に翻訳できる字幕システムを使うことができるようになる。ゆかりねっとコネクターが世界的に広がれば、誰でも簡単に字幕を使うことができるようになる。それは同時に、言語の壁をクリアできるようになることも意味する。世界を見据えるなら、さあ、やってみようじゃないか。

 

以上、ゆかりねっとコネクターNEO使ってみた!であった。それでは、次回の記事で会おう。ン、バァーイ!

 

KIBEKIN at 00:00 Feb. 16th, 2022

 




 

特別追記1:clea氏のゆかNEO動画解説が完成

実はclea氏の解説動画の中では、ゆかりねっとコネクターについては存在するが、ゆかりねっとコネクターNEOについてはまだ解説動画をアップロードしていなかった。最近はゆかNEOの反響が非常に大きく、海外でもゆかNEOの存在が認知されるとともに、制作者であるNao氏もメインの開発をゆかNEOに移行することを真剣に検討しているほどの成果が出ている。その流れを汲み、clea氏も解説動画を制作し、2022年2月24日にその第1弾が公開された。その後第2弾(支援で利用可能な翻訳APIによる精度比較編)が3月9日に、第3弾(UDトーク連携編)が3月17日に公開された。以降も続編がアップロードされる予定である。文字・画像ベースとなる私の記事と、clea氏の動画の2つを併用していくことで、字幕や翻訳の設定はもっと簡単に、わかりやすく行うことができるはずだ。

 

特別追記2:ゆかコネ3周年と4周年以降のこれから

2022年3月25日、clusterではある熱気が高まっていた。ゆかりねっとコネクター3周年を記念したイベントが開かれ、イベント会場は入場自由、clusterで来場できない人は公式ガイドや各アンバサダーの配信からイベントの風景を観ることができるものが壮大に開催された。このイベントは従来型であるゆかりねっとコネクターを含めたゆかりねっとコネクターNEOの1つの節目であると同時に、4周年目以降に向けてのゆかコネ/ゆかNEOの普及率向上の強化も兼ねており、このイベントを経て唯一の公式アンバサダーであったclea氏は公式ガイドに肩書きが変更となり、同時に8人が第1期アンバサダーとして就任した。その8人は以下となる。実際のイベントのPRタイムでの登場順に書き、敬称略となっている。

  1. バーチャルシンガーソングライター L*aura (YT/TW) 歌とVRを中心に活動する。楽器はバイオリンやハープといったものが扱える。フルトラッキングは正義だ。
  2. 楽しくゲーム!Twitchストリーマー ニコ (TC/TW) 日本人では珍しい顔出し系であり主戦場がTwitch。フルートでゼルダの伝説(メインテーマ)を演奏できる凄腕。
  3. かわいさの化身 朝日ゆい (YT/TW) 昨今の増えすぎたYouTuber市場、それを見据えて海外進出の際にゆかコネを導入。先のことをしっかり考えている。
  4. バーチャルバルーンアーティスト 卯塚ウウ (YT/TW) 本職の大道芸人の家に住み着く妖精。YouTubeではよくバルーンドールを作っている。フルトラッキングVR大道芸をしたら強いはず。
  5. kawaii文化を世界に発信!バーチャルアイドル 猫入あこ (YT/TW) ゆかコネ導入前はコメントを直接DeepLで翻訳していた。これがゆかコネ導入で大幅に楽になった。
  6. バーチャルマルチクリエイター わたあめ子 (YT/TW) わたあめの精霊が女の子に乗り移った。ゲームもイラストもVRも3Dもやるマルチプレイヤー。
  7. エスペラント好きバーチャルフレンド 君友ゆるし (YT/TW) エスペラント語大好きという珍しい人。ゆかコネは語学学習に便利ということを教えてくれた。
  8. Inanaku Muu (TC/TW) アンバサダーで唯一の海外勢。アメリカ・テキサス州在住。実は日本語もかなりできる。彼女にとってclea氏は「先輩」である。
  9. ※TW=Twitter, TC=Twitch, YT=YouTubeを意味する

この8人が新たにアンバサダーとなったことで、ゆかコネの認知度はより上がることが期待される。そして開発者であるNao氏、公式イラストレーター担当あすまくん、clea氏もこれまでと同様、あるいはそれ以上に活動をして、ゆかコネ利用者の普及率向上に努めると同時、導入サポートやトラブルシューティングの対応もできるようにしている。利用者が増えれば想定されるのがトラブルシューティングへの対応であり、これがNao氏やclea氏だけではさばききれないところ、アンバサダーが増えることでその対応負荷を分散させることもできるはずだ。

また、海外での普及も考えるとMuu氏の存在はかなり大きなものになる。現段階ではまだアメリカだけであるが、活動を続けていけば将来的には各国に1人以上はアンバサダーがいる状態になるはずだ。そうなれば後は、サポート体制が整えば完璧だ。そうなったとき、ゆかりねっとコネクターは世界で最も必要とされる「マルチツール」になるだろう。ビクトリノックスのように。

個人的には、第2期生にいちやちゃんこと高城いちやが就任できるように頑張っていきたい。もちろん、本ブログでのゆかコネ関連ツール解説はこれまで通り行う。それが私にできる普及活動であるからだ。

 

追記情報

2022年2月24日 clea氏のゆかNEO解説動画の公開に合わせ、その情報を追記

2022年3月17日 第3弾公開に合わせ、文面を変更、動画リンクを追加

2022年3月25日 ゆかコネ3周年イベントに合わせ、特別追記2を追加し、8人のアンバサダーについての軽い解説を追加


スポンサーリンク




KIBEKIN
会社員という働き方が合わないのに会社員になってしまってから、半ば自分からリタイア後ブログクリエイターとなり活動してきた社会不適合者。今後の活躍の約束とHIKAKINリスペクトの意味を込め、リンクス岐部からKIBEKINに改名した。

コメントを残す

メールアドレスが公開されることはありません。
名前は必須項目となります。記入をお願いいたします。

CAPTCHA


日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)