LEGALブログ（リーガル社員のここだけの話）: 機械翻訳について

こんにちは。開発部の橋村です。

最近 chatGPTやBardといった、対話的AIが話題になっていますが、
今日は古くて新しい話題、機械翻訳についてちょっとだけ。

今から30年ほど前、コンピュータによる翻訳は
構文解析によって文章の「意味」をデータ化して、
それを別の言語に変換する、というアプローチでした。
当時、C言語を覚えたてだった私も一所懸命トライした記憶があります。

なんというか、多分に哲学的なこの方法は、話し言葉や流行語、略語、古語、方言などなど、
イレギュラーな入力に非常に弱く、つまるところ、使われる言語の全てのシーンにおいて
共通するルールを予めプログラムに組み込まないと、期待したように動かない、という気が遠くなるような仕組みでした。
同義語辞書や文法のルールを組み込むことで、なんとか組み合わせの数を減らすことはできないか・・・と
足掻いた挙げ句、ギブアップしました。

大きく事情が変わったのは、AIやビッグデータが注目されてから、
特に、ぐっと翻訳の精度が上がったのは、ここ5～6年のことではないかと思います。

入力された文章を解析する部分は大きな変更はないのですが、
「翻訳」のコア部分に機械学習を導入することによって、
統計的に確率が高い訳語を充てる、という
アプローチを導入できるようになりました。

蓄積したデータや学習パターンが、ある一定のレベルを超えると、
突然それらしい（使い物になる）訳文を吐きはじめるようです。
今もあきれるほど沢山の実例とフィードバックによって、
日々更新が行われています。

実際に使われている言葉をもとに統計処理している関係か、
よく出現する言葉、たとえば流行語やテクニカルタームの
翻訳について、従前と比べて非常に高い精度が実現されています。

私は30年前に挫折した時点で諦めたクチなのですが、
もしかするとどこかに、Ａ案でダメならＢ案で、それでダメならＡＢ複合案で・・・と
執念を燃やし続けていた技術者さんがいたのかもしれません。

お陰様で、まだ日本語訳が出ていない英語の技術書（原書）も、
原著のＰＤＦを機械翻訳にかけることで、随分内容を把握しやすくなりました。
以前であれば、英和辞典を引きながら、ちまちま自家製の訳文を作っていたところです。

大きな感謝と敬意を捧げつつ、有り難く使わせて頂いています。
私も、もうちょっとだけ諦め悪くなろうかな、と思った次第でした。

0619

にほんブログ村ランキングへ

司法書士ブログランキングへ

日	月	火	水	木	金	土
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

LEGALブログ（リーガル社員のここだけの話）

株式会社リーガルの社員によるオフィシャルブログです。司法書士業界のホットな話題から業務におけるお役立ち情報まで毎週お届けします。

カテゴリ

最近の記事

アーカイブ

2023年6月19日 (月)

機械翻訳について

2026年7月

検索