八楽の自然言語処理チームが執筆した研究論文が歴史ある機械翻訳専門誌に掲載 - ヤラク翻訳

より自然で読みやすい翻訳を実現するための研究成果｜アジア太平洋機械翻訳協会発行の「機械翻訳」に

生成AIを搭載した翻訳支援ツール（CATツール^*1）「ヤラク翻訳」を提供する八楽株式会社（本社：東京都渋谷区、代表取締役：坂西優、以下八楽）は、八楽の自然言語処理チームが執筆した研究論文が、国内の歴史ある“機械翻訳専門”の学術誌「機械翻訳」（発行：アジア太平洋機械翻訳協会=AAMT）に掲載されたことをお知らせいたします。
掲載された論文「Quality Estimation Reranking for Document-level Translation（文書レベル翻訳のための品質推定リランキング）」（以下、本論文）は、複数の訳文候補を生成し、それらを別のAIモデルが評価して最良の訳文を自動的に選び出す手法が、文書全体の自然さや一貫性を高めるうえで有効であることを示した研究です。
「機械翻訳」への掲載は翻訳技術分野における八楽の研究活動が、外部の専門コミュニティから評価されたことを示すものです。

^*1CATツールとはー翻訳作業を効率化し、品質を向上させるためのソフトウェア。機械翻訳（MT）や翻訳メモリ（TM）、用語集管理などを活用し、人とAIの協働によって効率的かつ高品質な翻訳を実現します

研究の背景と新規性

翻訳AIが作り出す複数の訳文候補の中から、品質推定（Quality Estimation：QE）を使って“より良い訳”を選び直す「QEリランキング」という手法を、文書全体を対象に検証しました。
従来は単文ごとに評価されることが多かったQEリランキングに対し、本研究では複数文のつながりを含む文書全体を対象に包括的な検証を行った点に新規性があります。
この“良さ”を点数化する方法として

文脈理解を評価する（SLIDE：Cometファミリーの文書レベル拡張モデル）
自然さを判定する（Comet：神経ネットワーク型評価モデル）
大規模言語モデル（LLM）による評価手法（GEMBA-DA）

など、複数の異なるアプローチを用いて検証しています。

検証したところ、翻訳候補の数を増やすほど品質が向上し、最大32候補まで継続的に改善が見られる結果に。これにより、リランキング手法を翻訳エンジンに組み込むことで性能を強化できる可能性が示されました。
また、このアプローチは効率的かつシンプルであるため、実際のビジネス文書や長文翻訳にも適用しやすいことが確認できました。