【まだまだ進化する】ゆかりねっとコネクターNEO使ってみた!:2022新機能解説編

この記事の概要を簡単まとめ!

  • 字幕のリアルタイム表示と翻訳で有名になりつつあるゆかりねっとコネクターNEO
  • ゆかりねっとコネクターよりも利用者が増えたことで開発優先度が上がった
  • 定期的に新しい機能が追加され更新されるので再度記事を書くことに
  • 検証対象は開発版、安定性を保証しない分最速で最新機能が追加される
  • ゆかコネ3周年イベントで先行公開された話者表示機能も最近の更新で追加
  • わんコメコラボによりわんコメとの連携も可能になった
  • 字幕表示レイアウトも複数追加され、見せ方も多彩に選べる
  • 各種プラグイン、マニュアルはゆかNEOの取説ページに殆ど存在
  • 情報は十分揃っている、今から使い始めても大丈夫だ

「何かを始めるのに遅いはない」、これはどこかの誰かが言った、割と多くの人が同意していることである。しかし始めるのが遅いと、どうしてもそのコンテンツに既に触れている人と比較して気後れをしてしまう人がいることは、十分あり得ることだ。これはどんなコンテンツでも起こることであり、特にゲームにおいてはそれが顕著である。インターネット接続を前提とするものは尚更であろう。

逆にツールについては遅くから始めると、今まで触れてこなかったことに後悔を覚えつつも、その便利さに愛用し続けるようになることも珍しくない。その1つにゆかりねっとコネクターがある。リアルタイムで翻訳を行い、字幕表示も同時に行えるNao氏が制作したコミュニケーションツールである。単純に翻訳と字幕表示を行うためのツールであったそれは、多彩なプラグインを搭載し他のソフトウェアとも連携が行えるようになった。そして軽量版となるゆかりねっとコネクターNEOが制作されると、「ほぼ同じことができる」ことによってメインの開発がこれに移行することとなった。

通常の仕事の合間に開発が進められる関係で常時更新とはならないが、ユーザーの要望を常に聞いては取り込むことを行っており、更新頻度はかなり早い。そのスピードはiOSのアップデート頻度より上だ。気付けば新しいバージョンが既にアップデートされていて、中身を色々変わってくる。その関係もあり、短い間隔ではあるが、再度ゆかNEOについて書くことにした。

ブンブンハローゆかNEO更新情報記事、どうもKIBEKINです。

字幕と翻訳のゆかりねっとコネクターNEO

配信と字幕表示と翻訳

死のコロナウイルス情勢が必然的に「配信者」というジャンルの増加を後押しする時代になり、同じことを考える人が増えたため、その数はたった2年で大きく増えた。それはYouTuberの乱発的増加にも似ており、増えすぎるということは何を意味するか。それは簡単だ、「他と同じこと」をしていては誰も観てくれないということ。始めるのは簡単だが、続けるのは難しい。よって新人の出入りの激しい世界であり、続けていくには相当の覚悟と努力を必要とする。だが「他と同じこと」を婉曲して解釈した結果、問題児が発生するのもまたこの世界の闇である。

インターネット上での活動がメインとなる世界では、ターゲットはある意味で「全世界」である。それは現実世界と比較して、物理的制約を可能な限り排除できることが要因として大きい。通常なら現地に行かなければ見れないものが、インターネットに接続できる環境と常識的なインターネットのマナーさえあれば殆どのコンテンツを閲覧し、楽しむことができる。これは母国語以外のコンテンツも簡単に見れるので、興味があれば海外のサイトや海外で提供されているコンテンツもチェックするということが簡単にできるわけだ。



しかしここで1つ、問題が生じる。インターネットによって全世界を自由に渡り歩けるようになったことで発生するのは、言語の壁である。人間の本質的なものは殆ど変わらないのだが、言語に関しては、その言語と言語の国の文化を知らなければ、即時に母国語に変換して理解することが難しいものである。しかし言語習得と文化の理解については、教科書だけで完全に習得するというのは難しく、実際にその場所に行くか一定期間住んで、無理矢理にでもその言語を使うような状況に置かなけば完全に習得はできない。しかしこのことは時間と場所と資金的制約が大きく関係し、インターネットの活動のためにそれらの制約に引きずられてしまうというのはナンセンスである。折角の自由も、それに縛られては不完全な自由と言わざるを得ない。

そこで注目されるのが翻訳ツールである。これはインターネット上でサービスの1つとして提供されているGoogle翻訳、DeepL翻訳をはじめとした、任意の言語で文字を入力し、それを指定した言語に自動で翻訳するものである。それ以外の辞書型翻訳もあるが、辞書の場合は書籍化した、或いは電子辞書で更新機能がないものは情報が更新されないので新しい言葉が誕生したときにそれが存在しない、書籍型は検索する手間があるので、使用するタイミングは限定的である。これを読む、というのは実は難しい話で、発音方法を知らなければまず読めない。読ませる機能はあるが、それを直接聞かせるのは難しい。ということは、翻訳結果を直接見せた方が早くなる。つまり、字幕が要るのだ。もしあまり声を出せる環境でないなら、翻訳だけでなく母国語の字幕もあった方が見る人には優しいであろう。字幕をつけたらほぼテレビと同じ感覚で観れるようになる。

有名になりつつあるゆかりねっとコネクターNEO

ただ、リアルタイム翻訳と字幕表示の両方を同時に行ってくれるツールというのは、あまり存在しない。大抵は片方のみの専門家で、もう片方については全く考えないか、専門外なので扱わないというスタンスで開発しているものと考えれば、どちらかが入っていないことは何も珍しいことではない。

その悩みを解決したのが、Nao氏制作のゆかりねっとコネクターだ。元々はゆかりねっと(おかゆぅ氏作成、ゆかコネとは別)との連携を考えて作られたそれは、音声認識によって得た音声データをテキスト化し、それを字幕に表示すると共に、設定によって翻訳も同時に行ってそれを字幕として同時に表示するようにした、コミュニケーションツールである。かつては音声認識にゆかりねっと、字幕と翻訳にゆかりねっとコネクターという組み合わせが一般的だったが、字幕表示と翻訳が優秀で、各種プラグインによって他のソフトウェアやツールとも連携が可能であり、音声認識自体もChromeまたはEdgeのブラウザに搭載されている音声認識機能を利用して単独でも機能する。現在はゆかコネ+他のツールという、ゆかコネが中心になる運用が多いようだ。

ゆかコネは色々と自分で調整できる項目が多いが、同時に多機能すぎて扱えない、ゆかコネ自体が重いと考える人も少なくない。そこで機能を字幕と翻訳に特化し、設定項目も簡易にして軽量化を目指したバージョンである、ゆかりねっとコネクターNEOが制作された。ゆかりねっとコネクターから必要な部分のみを取り出した設計となっているそれは、ゆかコネよりもRAMが約1/3まで軽量化されており、基本設定項目も縦にスクロールすることで全ての項目が確認・設定できるようになっている。その分説明も表示上は簡略化されているが、一部はマウスオーバーすることで説明が出る構造にもなっている。また、リファレンスはNao氏の(個人運営の)サイトに掲載されているため、解説が必要な場合はそこを参照することで、どうすればいいかが分かるようになっている。

ゆかNEOはゆかコネの簡易版という位置づけであり、普通のソフトウェアやツールで考えれば、一部機能が削られた「低機能版」としての扱いになるものだ。しかしゆかNEOの、ゆかコネと比較したときの軽量で設定のしやすさが多くのユーザーに受け入れられた。その結果利用率が向上し、当時ゆかりねっとコネクター公式アンバサダーであったclea氏も、その時点で使用していたゆかコネからゆかNEOに変更し、それに合わせたHow-to動画も新規に制作してYouTubeに投稿した。そして2022年3月25日のゆかコネ3周年イベントによって増えたアンバサダー8人と役職名を公式ガイドに変更したclea氏の存在もあり、ゆかNEOは少しずつだが利用率が上がっていて、日本だけでなく海外でも使われており、規模こそ小さいが有名になりつつある。




定期的に新しい機能が追加され更新されるので再度記事を書くことに

本ブログでは既に、ゆかコネを2回、ゆかNEOを1回、記事のネタとして書き上げている。しかもゆかNEOについては、執筆時点で約2ヶ月前であり、clea氏のゆかNEOのHow-to講座のアップロードによる記事内容更新と、イベント情報開催後の更新も行ったので、感覚的には間が全く空いていない状態でまた書いているようなものである。通常同じネタで何度も書くのは、中身が全く違わないのなら書く意味はなく、ブログクリエイターとしてはあまり推奨されないことである。

だがゆかNEOにおいては、これが例外適用となる。というのも、制作者のNao氏は通常の仕事(大学の業務と思われる)の合間にこれらのツールの調整を行っているため、毎日更新しているわけではないが、それでも要望があればそれをすぐに追加し、自身のサイトでアップロードしてTwitter上でその情報を流すほど更新が早い。その早さはiOSのアップデート頻度より上だ。

気付けば新しい機能が追加されたバージョンが出てくるため、あっという間に書いたことが古い情報になってしまうのである。これはおそらくclea氏の方でも同じことがあり得るが、ただしあちらは導入方法・支援プランのAPIの違い・UDトークとの連携を中心に取り上げられているため、情報としては永続的に見れるものとなる。では私がすべきことは、ゆかNEOの新機能について、何がどう変わったのかというところを中心に見ていけばいいということだ。ということで次項から、前回の記事からの更新されたゆかNEOの部分について、解説していくこととする。

ゆかりねっとコネクターNEO、更新の中身

前提:検証バージョンについて

更新が常時行われるタイプのソフトウェアやツールは、安定版と開発版の2種類が存在する。安定版は動作保証が確実な代わり、最新機能は追加されず、更新自体も非常に遅い。開発版は常に最新の機能が追加され、更新も頻繁に行われるが、全ての機器で動作保証がされず、詳細な動作確認も行っていないことが殆どのため、不具合が発生する可能性が高いものである。

一般ユーザーは大半が前者を用い、テストユーザーや最新版好きは後者を用いる。私は(クソフトバンクダメダーを強制された回線弱者のため)特に配信をするわけではないので前者でもいいのだが、ゆかコネについて書いたら反響があった関係から、試さないわけにもかない。よって今回は執筆時点での最新版を試すこととする。執筆時点としたのは、これを書き始めた瞬間からも更新が行われ、既にバージョンが上がっているためである。執筆時点でのバージョンは1.936である。また、ここではインストール作業や基本的な事項は、既に分かっているものとして省略して話を進める。

目玉更新:コラボ時に使える話者表示機能

ゆかNEOでは、字幕を表示するウィンドウで言語名を表示することと、いくつかのレイアウトパターンがあってそれを任意に変更可能な機能が存在している。言語表示は最大4言語(母国語+翻訳言語3種類)で、現在どの言語の字幕を表示しているのかを明示でき、レイアウトパターンは通常の表示方法からリスト表示・ゲームのメッセージウィンドウ風も設定できる。これらは前々から存在しており、配信内容によって変えることで雰囲気や見やすさが大いに変わるものとなっている。

通常の配信ではこれらをうまく使い分けることがポイントとなるが、たまに同業者同士でコラボ配信を行うこともある。このときの様子は主にゲーム内VCを利用、それがない場合はDiscordなどを利用してそれぞれがコミュニケーションを取り、同時にその様子(音声)も配信に載せることが一般的だ。しかし1つの問題点として、「誰が話しているか」が明確にはわからないということが挙げられる。Discordの場合はOBSでチャットメンバーを表示できるウィジェットが存在するが、しかし観ている人が難聴である場合は誰が「何を」話しているかはよりわからない。ただ、これに完全に対応するというのは、実のところ難しい話だ。



3月25日のゆかコネ3周年イベントでは、clea氏はclusterで参加できない人のためにYouTubeで同時にその様子を配信していた。その際に使用していたゆかNEOの字幕レイアウトが、話者の名前とアイコンを同時に表示できるもののバージョンであった。その当時のバージョンのイメージが以下である。

ゆかNEO トークセッション表示(プレ版)
3月25日、ゆかNEO3周年のclea氏のチャンネルでの同時配信時に使用されていた、トークセッションの字幕表示。このイベントのために急ぎでNao氏が作ったもので、このイベントの後に更新されたバージョンで実装された。

画像赤枠がその時の字幕で、名前と画像を表示することで「誰が話しているか」を明確にすることができ、音声だけではわかりにくい部分を補填することができるようになる。これは難聴の人でも会話の内容の殆どを読み取れるほか、一般視聴者でもゲームやその他の音声と重なって聞き取りにくかった部分の明確化にもつながるものとなるはずだ。

表示の仕方や設定方法

さて、実装されたのであれば実際に試してみるのが一番である。ということで、設定を行う。確認する場所は「設定」枠の一番下、「レイアウト」にある。ここはプルダウンメニューで選択するものとなっており、ここにトークセッションまたはトークセッション(高さ広め)があれば対応しており、ない場合は残念ながら古いバージョンなのでアップデートが必要だ。参考例としては以下の状態になる。

v1.936でのトークセッションのプルダウンメニュー
プルダウンメニューからトークセッションまたはトークセッション(高さ広め)を選択できるかどうかを確認。この項目があればトークセッションが使用できる。

2つのうちのどちらかをセットしたら、いつものように字幕表示用のウィンドウを表示してチェックする。テスト用の手動送信、音声認識のいずれかで字幕を表示させると、次のような表示になっているはずである。

レイアウトをトークセッションにしたときの字幕表示
レイアウトがトークセッションの時の、ゆかNEOのウィンドウでの字幕表示。このように字幕に加えて名前と(設定されている場合)画像が表示される。

このような表示となっていれば、基本的な設定は行えている。ところでプレ公開版となるものでは画像や名前についてはしっかり表示されているが、私が試した限りでは、名前は表示できるが画像がどうにも表示されなかった。ゆかNEO自体には「オプション」(上段3番目、レンチとドライバーのアイコン)から「話し手のイメージデータ」に画像があるフォルダを参照して指定することができるのだが、フォルダを指定するだけのため、それで読み込めるとは思えないものである。また、「誰の話し手」を示しているのかも不明であり、この部分についてはリファレンスも存在せず、不明瞭な点が多く見受けられる。プラグインの設定とはまた違うものとなるはずのため、詳細な情報が入手できたらこの部分については再検証を行う予定である。

これは1つの推測であるが、殆どの人は音声認識をUDトークにして、それをゆかNEOに送り込む形で字幕と翻訳を行っている。そのUDトークのトークルームは、ルーム状態を公開にするか一意な8桁のユーザIDに対して招待を送ることで、誰でも参加できるようになる。個人契約ないし有料APIを使用している場合はAPI消費量の関係から招待のみが原則であるが、1つのルームに複数人が存在する状態になる。UDトークには設定でデバイスの名前と画像を追加できる1)ただしAndroid版は、画像のアップロードをしようとしてもうまくいかない。私だけの現象であろうか。項目があり、これが正しく設定されていればそれぞれの名前と画像が同時に表示される字幕が実現するのである。これはゲームでも純粋な「雑談」でも使えるものとなるはずだ。なお、端末の関係でうまく再現できなかったため、再現できるようになったらここも再検証を行う予定である。

わんコメコラボによりわんコメとの連携も可能になった

配信に必ず付くのがコメントである。余程の過疎でない限りは必ず流れるものであるこれ、配信画面にコメントそのものを映し出す手順というのは、実は相当に面倒なものである。導入方法も各配信プラットフォームによって異なり、多くはHTMLのブラウザアプリを利用するものになっている。読み上げも同時に行う場合は読み上げアプリも別で立ち上げておき、それをOBSなどの配信ツールで、ウィンドウキャプチャやブラウザのソースを表示するといった形で対応させている。だがこれは慣れない人からすると、きっとどこかで混乱してしまうはずだ。



その面倒事を解決し、コメント関係の設定を1つにまとめたツールが「わんコメ」である。配信者の必須ツールの1つにも数えられるものであるこれ、ゆかNEOの字幕とは行うことが違うのに何故話題としたか。その理由は、ゆかNEOとわんコメのコラボにより、わんコメとの連携が可能になったためである。ただし現状ではわんコメがゆかNEOに対応しただけで、ゆかNEOがわんコメに対応しているという形ではない。今後はNao氏がわんコメのテンプレートをゆかNEOで扱えるようにするテスト実装を行う予定で、そのテンプレートを募集している段階である。わんコメについては別の記事で紹介するとして、イベント以降、同じ目的で使用されるソフトウェアやツールとのコラボは増えるものと推測される。

字幕表示レイアウトも複数追加され、見せ方も多彩に選べる

私が初めてゆかNEOを使用し、記事に仕上げたときのレイアウトパターンは、「多言語・リスト・ゲームメッセージ風・多言語(縁取りくっきり/言語表示なし)・ゲーム風(カーソルあり)」の5つのみだった。Ver1.936時点では、ゲーム風とリストに横ならべ、トークセッションとそれの高さ広めのものが追加されている。横ならべは左を母国語、右を翻訳(1番のみ)とその逆の配置が可能で、配置と広さの違いを含めれば6パターンが追加されていることが分かる。それらの字幕表示を比較した画像が以下である。

追加された6個の比較
レイアウトで追加された6個の新しいレイアウトの比較。横ならべのものは1つのみの翻訳に対応している。トークセッションは3つ全ての翻訳を利用可能である。

これまでの表示方法は母国語と翻訳を縦に並べて表示するものが一般的で、多くの配信者がそれに合わせる形で字幕ウィンドウを配信ソフトウェアの中に配置していた。その関係から、字幕をゲーム内に含めない場合はゲーム画面を小さくする必要があり、ゲーム内に含める場合は場所を考慮した上で若干の背景透過で表示する必要がある。このことから、プレイするゲームによって字幕の表示パターンを変えているという人が多いようだ。clea氏もそのパターンで、複数のゲームで表示と配置場所を変えていることを確認できる。

それが、横に字幕を配置するレイアウトパターンが新たに登場した結果、ゲーム画面を小さくしなくても字幕をゲーム画面の外に出すことができるようになる。あるいはゲーム内にそれを配置するにしても、画面下の方に置いて邪魔しないように表示することもできる。この更新は、今まで字幕を導入しようにも画面構成を崩したりゲーム内に余計なものを入れたくないと考えている人にとって、ゆかNEO導入検討の余地が生まれるものとなるはずだ。新しいゆかNEOユーザーを取り込むチャンスとも言える。

各種プラグイン、マニュアルはゆかNEOの取説ページに殆ど存在

ゆかコネでは、他のソフトウェアやツールとの連携を前提として、それらと接続するための各種プラグインが導入されている。一般にプラグインは少なければ動作にあまり影響を及ぼさないが、多すぎると処理に要する時間が増えるため、動作に影響を及ぼし、PC自体に負荷がかかる原因ともなる。そのため、使用しないものがある場合は機能を切っておくかアンインストールしておくことで軽量化する。

ゆかNEOの場合は、元々はプラグインについては標準で用意されていなかったであろう。しかしゆかNEOでもプラグインを使いたいという要望があったために、ビルド時点でゆかコネで使用されていたプラグインを移植する形で導入されたことは推測できる。そして現在、ゆかNEOの軽量かつ簡単な字幕と翻訳の設定が評価され、ユーザーが多くなったことに伴ってメインの開発がこちらに移行されると、積極的にプラグインが標準で導入されるようになった。配信者が必須とするものは殆どカバーしており、基本的に何もしなくても対応される形だ。自作のプラグインを適用させたい場合、用意されているゆかNEO用の開発キットを使用することで追加できるようになる。

これらのプラグインは標準でOFFになっており、必要に応じてユーザー自身がONにし、設定を行って使用するものとなる。ただ、プラグインによっては解説がなければどう使えばいいのかわからないことも多い。その場合のマニュアルはゆかNEOの取説ページにそれぞれ個別にページリンクが貼られており、基本的な使い方についてはそこを参照することで、初めて扱う人でもわかるようになっている。同時に新しいプラグインが追加された場合、その都度新しいプラグインのマニュアルページが作成されるため、新しいプラグインが追加されていればまずは取説ページに行って解説ページがあるかを確認するといい。そして実際に使用してわからないことがあれば、コミュニティで質問しにいく、くらいの姿勢で十分使いこなせるはずだ。




情報は十分揃っている、今から使い始めても大丈夫だ

配信者というジャンルが確立し、一気に増えた現代。広義のYouTuberないしVTuberにも分類されることの多いそれは世界的なコンテンツとなり、今では地域と国境を問わず存在するものとなった。それに伴って発生するのが言語の壁である。言語の習得は残念ながら時間が必要であり、その時間も膨大かつ集中的に行わなければ不可能と言えるほどには難しい話である。よってそれを解決する手段として翻訳という方法があるが、配信で使用する場合にはリアルタイムで翻訳できるかどうかに重点が置かれるため、Google翻訳やDeepLで文章を翻訳してからそれを口に出すというのは、あまり意味のないことである。

それを解決する手段としてゆかりねっとコネクターが存在し、その軽量版であったゆかりねっとコネクターNEOは利便性と軽量さと手軽さが買われて多くの人が利用するようになったものである。この手のツールのよくある問題点といえば、初めて使う人には機能が多すぎて使いきれない・項目が多すぎてどこを弄ったらいいかわからない・説明が不足していてどういう動作になるのかわからない。このようなことが想定され、特に登場してから頻繁に更新が続けられているものは、かなり複雑な状態になっていて、今から使うのに抵抗がある人も多いであろう。

ゆかNEOはNao氏自身が制作したサイト上でインストーラのダウンロードが可能で、そこに基本的なセットアップ・設定・解説と各プラグインの解説ページも存在し、それを参考にしてもわからないことがあればNao氏に直接質問するほか、公式ガイドであるclea氏と第1期アンバサダーの8人、加えてDiscordのコミュニティにて質問することができる。そのためサポート体制で言えば万能とも言える状態にある。よって今から使い始めたとしても、情報は十分に揃っているので大丈夫と断言できる。言語の壁を壊して世界的にしたいなら、ゆかNEOはあらゆる点で「初心者向け」である。試してみる価値は十分ある。

ちなみに、この記事を公開した時点で既に1.943に更新されていた。今日インストールすれば、明日にはもう1つ上のバージョンになっているというのも珍しくないであろう。

 

以上、ゆかりねっとコネクターNEO使ってみた!:2022新機能解説編であった。それでは、次回の記事で会おう。ン、バァーイ!

 

KIBEKIN at 00:05 Apr. 20th, 2022


スポンサーリンク



脚注

脚注
本文へ1 ただしAndroid版は、画像のアップロードをしようとしてもうまくいかない。私だけの現象であろうか。
KIBEKIN
会社員という働き方が合わないのに会社員になってしまってから、半ば自分からリタイア後ブログクリエイターとなり活動してきた社会不適合者。VRやVTuberに触れる機会が増え、今後はリスペクトだけではなく自分を作る意味を込め、VTuberならぬVBlogCreator"KIBEKIN"として新しいスタートを切る。

コメントを残す

メールアドレスが公開されることはありません。
名前は必須項目となります。記入をお願いいたします。

CAPTCHA


日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)