この記事の概要を簡単まとめ!
- ゆかコネでは様々な翻訳APIが利用できる
- 無料枠として用意されている「共用翻訳サーバ」
- ゆかコネのおためし枠として「テスト」に使える
- 利用者の増加に伴い増強する必要が出てきた
- ゆかコネv2.1beta8より強化されたサーバに接続できるものになった
- 精度は据え置きだが、反応速度は向上した
- 既知の問題に加えて解決したい問題も判明した
- 出来れば支援APIがいいが、念のために存在している
7月15日にVketが始まって、多くの人がVketを楽しんでいるが、その中に出展しているのがゆかコネである。Nao氏によれば2年ぶりの当選ということで、日々の業務の隙間に構築し、完成したブースの容量は19.96MBという20MBギリギリで完成させたものである。ただ、急いだこともあって少しエラーもあり、適宜修正している。
そのこともあってゆかコネは利用者も増えた。それに伴って発生したのが、完全無料枠として提供している共用翻訳サーバの限界である。2台体制のサーバの限界を超えるほどのリクエストが発生し、Nao氏は増強を決めた。その場合は運用コストが上がるので、調整のために負荷テストを募集した。今回はそれについてのメモを兼ねた結果記録である。
ひとっ飛びできる目次
丁度いいを見つけるのが難しい
ゆかコネの翻訳API
使用できるAPIの一覧
翻訳以外もできるゆかりねっとコネクター、現在のメインはゆかりねっとコネクターNEOである。これそのものの解説はもはや不要であろう。ここでは基本呼称をNao氏が公式で書いているゆかコネとし、ソフトウェアとして明確化したい場合はゆかNEOとする。したがって単にゆかコネとした場合、ゆかNEOを示すものとする。
ゆかコネのメインとなる翻訳機能は、ゆかコネが対応(搭載)する特定の翻訳APIを利用する。現在対応しているのは次の通りである。
- 支援レベル1から有効: Google翻訳v2, Microsoft翻訳システム
- 支援レベル3から有効: DeepL API Pro翻訳エンジン, Amazon翻訳システム(アジア向け/EU向けの分類あり), IBM Watson, NAVER Papago 翻訳システム, Google翻訳v3, OpenAI GPT3.5 API翻訳(現在はβ版提供)
- 個人設定API: DeepL API Free翻訳エンジン, NAVER Papago 翻訳(アプリキー版), Google Apps Script翻訳, Tencent Cloud Translator, Baidu Translator
- 無料(調整中): 共用翻訳サーバ(Lexicon/暫定β版/無料)
- 廃止: Google翻訳ライブラリ

支援プラン系は所謂商業エンジンが多く、そのため精度も非常に高く、支援レベル3でその効果を実感できるはずだ。その逆に個人で用意するAPI枠を設けているので、支援APIを使い切った場合の臨時枠としても機能させることができるようになっている。このあたりは1回の配信においてどれくらい喋るかというところに依存するので、それの回数を概算してプランを決め、足りなければ上位プランにするのが一般的である。なお、支援はここから行える。
一方で、ゆかコネ自体が動くかどうかを確認したいと思う人は多いはずだ。そのため精度や応答性能は落ちるが無料で使える枠を用意している。これまではGoogle翻訳ライブラリがそれだったのだが、商用利用不可に伴って廃止さぜるを得ず、無料枠が用意できない危機に陥った。そのため当初は支援プランでのみ使用できる予定だった共用翻訳サーバを急遽無料枠として用意することにし1)参照:支援の概要 – ゆかりねっとコネクターNEO|リアルタイム字幕・翻訳・連携ツール ここにある画像解説では、支援登録で利用可能とあり、このことから支援プラン用に準備していたはずである。、現在に至るまで共用翻訳サーバがゆかコネの「おためし枠」として機能しているのである。
共用翻訳サーバが追い付かなくなってきた
そんな共用翻訳サーバだが、果たしてどれくらいの利用ユーザーが存在するか、それはNao氏に直接聞かないと分からない。ただ1つ目に見えて分かってきたのが、共用翻訳サーバのスペックがついに追い付かなくなってきたということだ。特に2022年3月以降からゆかコネの運営体制が一新されて、これまで以上にゆかコネが広く知られるようになったことでユーザー数が明らかに増えている。それはゆかコネDiscordの活動状況からも読み取れる。
これ自体はいい傾向と言える。ユーザーが増えることでゆかコネを目にする機会が広くなるからだ。Nao氏とあすまくんとcleaちゃんをゆかコネの中心と置くと、アンバサダー群はその中心から木構造のように広がった点であり、そこから末端の配信者やリスナーへと同じように広がっていく、という形になる。ゆかコネとは、使い始めた瞬間からゆかコネを推すユーザーの1人となるので、公式役職だけが宣伝する立場にあるとかは考えなくていいとは、ゆかコネ4周年レポートの時にも書いたことだ。
ただ、ゆかコネユーザーの中には、アンバサダーではぽよ麻呂氏やそらなママのように、PCないしIT関係の情報には強くないという人も少なからず存在する。そのため理屈ややり方は分かっていたとしても、実際にどうやって使ったらいいか、APIの取得や支援はどうやったら行えるのかといったことが難しいこともあるので、共用翻訳サーバをまず使うという動きになるのではないだろうか2)ただしそらなママに関しては、アジア系言語に強いAPIを使用しているという情報を得ているため、十分扱えている模様。。また、お試しでゆかコネを使いたいとも思う人は、とりあえず動かせる共用翻訳サーバを使うことが容易に予想される。
更にそこから予想できることが、同じ考えを持つ人が以前よりも増えている可能性だ。これで先に挙げた、共用翻訳サーバのスペックがついに追い付かなくなることに繋がる。利用者が増えるということは負荷がより高くなることを意味し、翻訳速度はもちろん精度にも影響を及ぼし、他に翻訳自体が実行されないことや、翻訳結果を返すまでの時間が長くなることで他の機能にも遅延が発生するということが考えられるはずだ。実際、これは起きていたことであった。
共用翻訳サーバ強化を実施
そこでNao氏は共用翻訳サーバの強化を決定する。これまで2台のサーバで運用されてきていた共用翻訳サーバだが、この能力を超えるリクエストが来ているということで、スケールアップできる仕組みに変更した。新しいサーバを建てて安定した後、切り替えテストを行って負荷調整を行うとのことである。それに伴い、Discordコミュニティ内で共用翻訳サーバの変更を行ったバージョン(v2.1.0beta8以降)をテストで頒布し、その使用レポートをDiscordの特定のチャンネルで募集する。この結果如何で、今後の運用が決定するものとなる。
共用翻訳サーバについてはテスト前からの既知の問題として、翻訳スピードが遅い、音声認識の結果に依らずある一定の「意味のない単語出力」が見られる、連続発話向きではない、時々翻訳を放棄するといったことがあった。それらの問題を解消しつつ、しかし費用をどこまで抑えられるかという、運用コストの面でも調整を行うことが要求されるものになっている。今後のゆかコネの展開にも関わるところであるので、beta版運用によってどこが改善され、あるいは妥協すべき点かを確かめるために実験に参加することにした。
共用翻訳サーバ強化版レポート
強化の概要
Nao氏の公開している情報から、共用翻訳サーバの強化概要について確認する。
- 現状2台で運用しているところに加えて、台数は不明だが新しいサーバを建てた。
- スケールアップできる仕組みに変更する予定。
- 主に応答性能について改善。これは新サーバによる負荷が殆どないことによる応答性の上昇によるもの。
これを基本として、現在進行中のv2.1.0のβ版をDiscordで頒布している。共用翻訳サーバを含め、調整が行われると適宜更新される。共用翻訳サーバの変更が適用されたのはbeta8からで、これを基準に結果を書いていく。
共用翻訳サーバの結果
beta8 2023.07.17
最初の変更が適用されたのがbeta8である。頒布日が7月16日。これを実際に使用した際のアーカイブが次である。
検証時の条件として、英語2番を共用翻訳サーバとし、それ以外をGASで表示している。そのため英語については翻訳精度も比較可能である。
これまでも共用翻訳サーバを使ったことはあるのだが、実はその件についてはバグレポートの1つとして「変な翻訳が出る」としてDiscord内で報告したことがある。この時はうーちゃんとも相談した記憶がある。変な翻訳については後述するとして、反応速度は回線影響を除外して考えても明らかに早くなっており、これは以前に(疑似)配信していた時よりも反応が良くなっており、使い勝手は上がっている。
反応速度の向上は各種プラグインの応答速度にも影響する。翻訳結果の表示が遅いと、その結果を利用するプラグインの実行が遅れることにもなる。それを改善することができたようである。その代わり、以前から発生している問題である異常な翻訳結果についてはそのままである。これはおそらく一種のバグであるとされる。また、連続で喋ると翻訳が何故か実行されないことがあり、これについても対処が必要と分かった。これらがbeta8の結果である。
beta13 2023.07.19
次に検証したのがbeta13である。頒布日が7月18日。これを実際に使用した際のアーカイブが次である。
beta8からの改良点が以下である。
- 音声認識結果に関わらず意味不明な翻訳結果、例として”Home”, “Comment”, “Contact us”が一定確率で発生していた。これは現状ではどうやっても改善が難しいとのことで、それらの結果が返される場合は強制的に”–“とするようにした。
- 連続で発話した場合、翻訳が表示されないことがある。これはバグであったので修正した。
これらを改善し、連続発話においても問題なく使用できるようにしたものとなる。beta8と比較すると、連続発話を行っても翻訳が詰まる、または翻訳を実行しないことは少なくなったようだ。ただしたまに大文字で”HOME”がすり抜けていることを確認した。また、何故か日本語の句点「。」のみが表示されることもあった。どういう単語ないし記号になるかは実際に使用し、音声認識に対して全く合わない訳が出てくる場合はそれをマークしてNao氏に連絡することになるであろう。
全体としての動作は安定していることは確かで、連続発話は前よりも応答性能は上がっている。とはいえ変換精度の悪い翻訳を行うケースはまだまだ多く、これは将来的な共用翻訳サーバの強化によって解決するものとなる。ただし強化するには当然、ゆかコネ翻訳API全体の運用資金から捻出することになるので、共用翻訳サーバの利用者がどれくらい存在するかが今後の調整におけるポイントとなる。
beta14 2023.07.20
その後beta14も出ていたので、これも検証した。頒布日は7月19日。これを実際に使用した際のアーカイブが次である。
beta14では音声認識の確定周りを変更したものとなる。共用翻訳サーバ自体には変更が加えられていないものになると思われる。具体的にどのような変更を行ったのかは不明である。したがって共用翻訳サーバ自体にはbeta13との相違点は特に見られないものと考えていいだろう。
現在提供されている共用翻訳サーバの改良版はここまでである。今後追加された場合は追加で実験を行い、その結果をここに記す予定である。
出来れば支援APIがいいが、念のために存在している
現在のゆかコネの翻訳APIは、基本的に支援APIを利用することで翻訳が可能となる。ほかには個人で取得できるAPIを利用する方法もある。ただ、ゆかコネを初めて触る人やPCにあまり慣れていない人からすると、支援の仕組みとその方法、APIの取得方法について、なかなか難しく抵抗があるものだと感じてしまうことはあり得る。また、ゆかコネが果たして自分の環境に合うかどうかをテストするためには、おためしができなくてはそれが難しいものとなる。そのための無料枠として共用翻訳サーバが存在する。以前はGoogle翻訳ライブラリがあったのだが、Googleがケチって廃止となった。
共用翻訳サーバ自体もサーバを建てた上で利用されている以上、ランニングコストがかかっている。その関係で元々の計画では支援者のみが利用できる予定ではあった。だが前述のケチりによっておためしが難しくなってしまったので、現在は暫定β版という形での開放である。最初は軽いもので良かったこれが、利用者の増加で負荷が高くなり、全体動作の遅延という形で目に見えるようになった。そのためNao氏はサーバ増強計画に踏み切ったという形だ。
質の良い翻訳を求めるなら、それこそ商用レベルのAPIを利用するのが最も理想である。だがそれを用意するのはNao氏であり、用意するには当然、準備のための資金が必要である。同時に暫定の無料枠となる共用翻訳サーバも金がかかっているわけで、これを無駄にしないためには使うのが正解である。また、現状ではスペック不足の報告は上がってきていないので、今のところ安定しているという状態になると思われる。
理想は全員が支援していることだが、人には人の事情というものがある。もっとも、他人の事情など完璧には把握できるものではないが、それを考慮すれば共用翻訳サーバを完全に排除できないのである。なので、まずは使ってみるといい。その後で支援を考えればいいだけだ。
以上、ゆかコネ使用レポート:共用翻訳サーバはどこまで強化すべきか案、であった。一応の無料枠も、ゆかコネには必要な物である。
KIBEKIN at 00:00 Jul. 22th, 2023
スポンサーリンク
脚注
本文へ1 | 参照:支援の概要 – ゆかりねっとコネクターNEO|リアルタイム字幕・翻訳・連携ツール ここにある画像解説では、支援登録で利用可能とあり、このことから支援プラン用に準備していたはずである。 |
---|---|
本文へ2 | ただしそらなママに関しては、アジア系言語に強いAPIを使用しているという情報を得ているため、十分扱えている模様。 |