Homeニュース八楽の自然言語処理チームが執筆した研究論文が歴史ある機械翻訳専門誌に掲載

公開日: 2025/12/10

八楽の自然言語処理チームが執筆した研究論文が歴史ある機械翻訳専門誌に掲載

より自然で読みやすい翻訳を実現するための研究成果|アジア太平洋機械翻訳協会発行の「機械翻訳」に

生成AIを搭載した翻訳支援ツール(CATツール*1)「ヤラク翻訳」を提供する八楽株式会社(本社:東京都渋谷区、代表取締役:坂西 優、以下八楽)は、八楽の自然言語処理チームが執筆した研究論文が、国内の歴史ある“機械翻訳専門”の学術誌「機械翻訳」(発行:アジア太平洋機械翻訳協会=AAMT)に掲載されたことをお知らせいたします。
掲載された論文「Quality Estimation Reranking for Document-level Translation(文書レベル翻訳のための品質推定リランキング)」(以下、本論文)は、複数の訳文候補を生成し、それらを別のAIモデルが評価して最良の訳文を自動的に選び出す手法が、文書全体の自然さや一貫性を高めるうえで有効であることを示した研究です。
「機械翻訳」への掲載は翻訳技術分野における八楽の研究活動が、外部の専門コミュニティから評価されたことを示すものです。

*1CATツールとはー翻訳作業を効率化し、品質を向上させるためのソフトウェア。機械翻訳(MT)や翻訳メモリ(TM)、用語集管理などを活用し、人とAIの協働によって効率的かつ高品質な翻訳を実現します

研究の背景と新規性

翻訳AIが作り出す複数の訳文候補の中から、品質推定(Quality Estimation:QE)を使って“より良い訳”を選び直す「QEリランキング」という手法を、文書全体を対象に検証しました。
従来は単文ごとに評価されることが多かったQEリランキングに対し、本研究では複数文のつながりを含む文書全体を対象に包括的な検証を行った点に新規性があります。
この“良さ”を点数化する方法として

  • 文脈理解を評価する(SLIDE:Cometファミリーの文書レベル拡張モデル)
  • 自然さを判定する(Comet:神経ネットワーク型評価モデル)
  • 大規模言語モデル(LLM)による評価手法(GEMBA-DA)

など、複数の異なるアプローチを用いて検証しています。

検証したところ、翻訳候補の数を増やすほど品質が向上し、最大32候補まで継続的に改善が見られる結果に。これにより、リランキング手法を翻訳エンジンに組み込むことで性能を強化できる可能性が示されました。
また、このアプローチは効率的かつシンプルであるため、実際のビジネス文書や長文翻訳にも適用しやすいことが確認できました。

本研究の位置付け

本研究はCATツール「ヤラク翻訳」の性能にダイレクトに関係するわけではありませんが、八楽が進める技術的な方向性を学術的に裏付けるものです。
具体的には、

  • 文書全体の自然さや一貫性を高めるためのアプローチ
  • 複数の候補訳から最適な訳文を選択する仕組みの設計
  • 勘や感覚ではなく、客観的かつデータにもとづいて翻訳品質を向上させる取り組み

といった領域の有効性が確認されたことになります。

また、八楽では安定した翻訳品質を生み出す機械翻訳(NMT)を中心に、GPTやClaudeなどの大規模言語モデル(LLM)を補助的に活用することで、より自然で文脈に沿った訳文を実現するための改良を継続しています。

ヤラク翻訳ユーザーにとっての意義

本論文の成果は、ユーザー企業の皆さまにとって、以下のような意義があります。

翻訳技術の方向性に学術的な裏付け
 八楽が重視する「文書レベルの品質向上」という技術的方向性が、学術的手法にも適合していることが確認されました。

・継続的なプロダクト改善を支える技術基盤
 翻訳モデルが科学的な検証にもとづいて開発されていることから、今後の品質向上が見込める技術的な基盤が示されました。

・企業文書で求められる一貫性の向上
 契約書、マニュアル、IR資料など、複数文にまたがる文脈の整合性が重要な文書で、品質向上につながる方向性が明確になりました。

・データ駆動の開発姿勢の明確化
 感覚に頼らず、客観的な評価指標と研究にもとづいて品質改善を進める姿勢が示され、サービスの信頼性判断に活用できます。

・長期的な利用に対する安心材料
 翻訳技術への継続的な投資と研究体制が示され、長期的な利用を検討する際の安心材料となります。

論文概要

論文名
Quality Estimation Reranking for Document-level Translation
(文書レベル翻訳のための品質推定リランキング)

掲載誌
機械翻訳No. 83 2025年11月29日発行(発行人:アジア太平洋機械翻訳協会)

論文の主な内容

  • 文書レベルにおけるQEリランキングの検証
  • NMTモデルが生成した複数候補のQEによる再選択
  • SLIDE、Comet、GEMBA-DAなど複数手法の比較
  • 自動評価による品質向上の確認
  • 実務利用を想定した計算効率の検証

著者

Krzysztof Mrozinski
Minji Kang

リンク
AAMT Journal Machine Translation(機械翻訳), No. 83

※50ページから論文をお読みいただけます