LLM翻訳の最前線:
多言語・話し言葉・文学の翻訳とその評価について

プログラム概要

本講演では、機械翻訳の分野において最も信頼されているコンペである国際会議WMTの汎用機械翻訳タスク(General Machine Translation Task)を紹介する。大規模言語モデル(LLM)による翻訳は、他言語から英語に比べて、英語から他言語への翻訳の精度が低いことから、WMT-2024では、英語から他言語および非英語間に翻訳方向を限定し、非英語間の翻訳として日本語から中国語を新設した。さらにマルチメディア翻訳や長文翻訳の可能性を探るために、翻訳単位は文ではなく段落とし、翻訳対象として音声と文学を追加した。また人手による翻訳精度の評価方法として、MQMを簡略化したESA(Error Span Annotation)を採用した。本講演では、講演者が日中対訳コーパスとWMT日本語テストセットを作成した経験に基づき、今後の機械翻訳の可能性について私見を述べる。

講演日時（会場）

2024年10月25日（金）10:30～11:30

オンデマンド配信スケジュール

2024年11月12日（火）～2024年11月30日（土）

登壇者

ナガタマサアキ

永田昌明

NAGATA MASAAKI

日本電信電話株式会社
上席特別研究員

1987年京都大学大学院工学研究科修士課程修了．

同年，日本電信電話株式会社入社．

現在，コミュニケーション科学研究所上席特別研究員．工学博士．

機械翻訳，自然言語処理の研究に従事．

AAMT理事．

LLM翻訳の最前線: 多言語・話し言葉・文学の翻訳とその評価について