井出草平の研究ノート

Gemma 4 26bの翻訳能力

GoogleのローカルLLMモデルである。gemma4には31bというより大きなモデルがあるが、手元にあるGPUがRTX 4060Ti 16GBなので、31bは到底動かない。26bも大きさとして16GBのVRAMで動かすにはかなりギリギリなのだが、作業が始まると、通常のメモリに部分的にスワップをして問題なく使える。スワップをするからといって特に重いという感じではない。GPU温度も50度台なので、問題なく動くレベルである。

ides.hatenablog.com

ides.hatenablog.com

4bit量子化されたGemma 4 26bの翻訳能力を評価する。

ollama.com

Gemma 4 26B : 80点

オープンモデルとしては高い性能を誇るGemmaの26B派生モデル。Z世代特有のネットスラングを日本の若者言葉へローカライズする能力は極めて高く、文章全体のグルーヴ感は非常に良い。しかし、AI特有の出力ブレや、全体の構成を俯瞰する能力に一部課題を残した。

評価: 80点

若者言葉への超訳・意訳のセンスは抜群であり、キャラクターの性格や世代間のすれ違いを見事に表現できている。しかし、「意訳しすぎた結果、物語の伏線(メタジョーク)を自ら破壊してしまう」という、高度な翻訳モデルならではの罠に陥っている点と、明らかな文字化け(ハルシネーション)の発生が減点対象となった。

1. 優れた点(スラングの完璧なローカライズ)

このモデルの最大の強みは、イディオムやTikTokスラングを文字通りの直訳にせず、日本の若者文化の文脈に合わせた自然な語彙に変換できている点である。

① 若者言葉の的確な意訳

翻訳: 「あのキャセロール、証拠バッチリ(caught in 4k)で焦げてるじゃん。もはや炭(It’s giving charcoal)。ガチで(No cap)。」 (原文: That casserole is caught in 4k. It’s giving charcoal. No cap.)

  • 評価: 「caught in 4k(高画質で証拠を押さえられている=言い逃れできない)」「giving ~(〜の雰囲気を出している)」「No cap(嘘じゃない、マジで)」という最新スラングを、「証拠バッチリ」「もはや炭」「ガチで」という、現在の日本の若者が日常的に使うトーンへ完璧に落とし込んでいる。

② 世代間ギャップの表現

翻訳: 「『私は古い世代(Boomer)です』って、直接言わずに伝えてみてよ。」 (原文: Tell me you’re a Boomer without telling me you’re a Boomer.)

  • 評価: ネット上の定型句「Tell me ~ without telling me ~」のニュアンスを崩さず、ジェイデンの言葉が理解できないベッキーおばさんへの冷ややかなツッコミとして成立させている。

2. 惜しい点・欠点(メタジョークの破壊と出力バグ)

ミクロな視点(一文ごとの翻訳)は優れているが、マクロな視点(文章全体の整合性)において致命的な矛盾を生み出してしまっている。

① 原文の「伏線回収」を自ら潰すパラドックス

翻訳(前半): 「現実を見なきゃと思って(I had to touch grass)。」 翻訳(後半): 農業(「芝生に触れる」)や、不動産(「家賃無料」)…の話をしていると誤解してしまうに違いない。

  • 評価: ここが最大の減点ポイントである。前半で「touch grass」を「現実を見なきゃ」と見事に意訳したにもかかわらず、後半の解説文では直訳の「芝生に触れる」を前提としたオチ(=AIは農業の話だと勘違いするだろう)が語られている。結果として、前半のセリフと後半の解説がリンクしなくなり、読者を混乱させる矛盾を生んでしまった。

② AI特有のハルシネーション(文字化け)

翻訳: 「あらあら、お気の毒に」と、彼女は私の腕を優님이しながら言った。 (原文: "Oh, sugar, bless your heart," she said, patting my arm.)

  • 評価: 「優しく撫でながら」などの訳が入るべき箇所に、突如として無関係なハングル文字(님이)が混入している。LLMの推論過程でトークン生成がバグを起こした典型的なハルシネーションであり、読み物としての品質を著しく下げている。

3. 総評:高度なローカライズ能力と「全体の俯瞰」の課題

Gemma 4 26Bは「スラングを理解して見事に意訳しすぎた結果、原文のメタ的な仕掛けと矛盾してしまった」という、ベクトルが全く異なる失敗をしている。

しかし、英語のネットミームを日本の若者言葉のニュアンスに変換する基礎能力は驚異的である。「I'm dead」を「もう無理、死ぬ」と訳すなど、文脈を読む力は本物であり、ハルシネーションの除去や文脈保持のプロンプト調整次第で、プロの翻訳家レベルの出力を期待できる非常にポテンシャルの高い結果と言える。

翻訳

家族の再会
あの日の午後のサバンナは、まとわりつくような、暴力的なまでの蒸し暑さだった。裏庭に足を踏み入れると、ベッキー叔母さんがいた。手には、なんだか「怪しい(sus)」感じのキャセロール料理が入った皿を持っている。叔母さんは私の破れたジーンズに気づくと、あの、砂糖のように甘ったるい、南部の典型的な笑顔を浮かべた。
「あらあら、お気の毒に」と、彼女は私の腕を優님이しながら言った。「相変わらず、脚が隠れるような服を探している最中なのね? もしかして、お店の生地が足りなくなっちゃったのかしら?」
言い返そうとしたその瞬間、いとこのジェイデンが会話に割り込んできた。彼はベッキー叔母さんのキャセロールをちらりと見た。それは明らかに焦げていた。彼は私に耳打ちした。「いや、その図々しさが無理(It’s the audacity for me)。」
「やめなよ」と私は小声で返した。「彼女なりに頑張ったんだから。」
「いや、無理だって」ジェイデンは首を振って言った。「あのキャセロール、証拠バッチリ(caught in 4k)で焦げてるじゃん。もはや炭(It’s giving charcoal)。ガチで(No cap)。」
ベッキー叔母さんは、全く気づかずにジェイデンの方を向いた。「ジェイデ、あなた、あの素敵なサラちゃんと別れたんですって? どうしたの?」
ジェイデンは呆れたように目をそらした。「彼女、僕が彼女抜きで『ジ・オフィス』を見たと思い込ませようとして、マインドコントロール(gaslighting)してきたんだもん。それに、彼女のことが頭から離れなさすぎて(lived in my head rent-free)、限界だった。現実を見なきゃと思って(I had to touch grass)。」
ベッキー叔母さんは、完全に置いてけぼりになって瞬きした。「現実を……芝生に触れなきゃいけないって? まあ、素敵じゃない。ガーデニングは精神衛生にいいわよ。」
「叔母さんは、彼が庭師になったと思ってるよ……」私は独り言を漏らした。「『私は古い世代(Boomer)です』って、直接言わずに伝えてみてよ。」
その時、レイ叔父さんが入ってきた。蛍光イエローのスーツを着ていて、まるでハイライターペンみたいだ。ジェイデンが私を肘で突いた。「主役オーラ(Main character energy)全開。コーデの完成度(the drip)はエグいけど、地味に(lowkey)目が痛いわ。」
「私は、キマってると思うわよ」とベッキー叔母さんは譲らない。
「それな(Bet)」とジェイデン。「でも叔父さん、ここはファミレスですよ(Sir, this is a Wendy's)。」
会話はその後、一時間ほどそんな調子で続いた。ベッキー叔母さんは、和やかに世間話をしているつもりなのだろう。ジェイデンは、まるでTikTokのキャプションをそのまま喋っているかのようだ。もしこの会話をAIが翻訳したとしたら、家族のドラマや、まずい料理、メンタルヘルスの話ではなく、農業(「芝生に触れる」)や、不動産(「家賃無料」)、ファストフード・チェーン(「ウェンディーズ」)の話をしていると誤解してしまうに違いない。
夕食が出される頃には、私はもう限界だった。焦げたキャセロールと、あの蛍光色のスーツを見つめて、私は言った。
「もう無理、死ぬ(I’m dead)。」
「あら大変!」ベキィ叔母さんは息を呑み、スマホに手を伸ばした。「救急車を呼びましょうか?」
「違うよ、ベッキー叔母さん」私はため息をついた。「ただ……もう、無理(sent)なだけ。」

翻訳能力・学術分野編

ides.hatenablog.com

精神医学の文章

LLM翻訳(モデル名未指定) : 95点

精神医学および臨床心理学・精神分析の高度な専門用語が多用されたテキストにおいて、非常に正確かつ自然な日本語に翻訳できています。専門分野の定訳を的確に押さえており、専門家が読んでも違和感のない、極めて完成度の高い実用的な翻訳です。

評価: 95点

専門用語(定訳)の網羅性、構文の正確さ、そして専門家向けのカルテや症例報告としての「文体(トーン)」を見事に再現しています。括弧書きでルビや別訳を補足する気配りもあり、文句なしの高評価です。わずかな減点(改善提案)としては、一部の用語についてさらに一般的な定訳が存在する点のみです。

1. 優れた点(専門用語の完璧な把握と文脈理解)

この翻訳の素晴らしいところは、単に単語を直訳するのではなく、日本の臨床現場や学術論文で実際に使われている「独特の言い回し」を再現できている点です。

① 専門用語(定訳)の正確な使用

  • presentation ➔ 「臨床像」
    • 単なる「発表」や「提示」ではなく、医療文脈での「患者の呈する状態・症状」を示す「臨床像」と訳せているのは見事です。
  • lack of insight ➔ 「病識を欠いている」
    • 「洞察の欠如」ではなく、精神医学用語である「病識(insight)」を正しく選択しています。
  • ego-syntonic defenses ➔ 「自我親和的な防衛」
    • 精神分析の専門用語を正確に訳出しています。
  • idealized / devaluation ➔ 「理想化 / 価値下げ(脱価値化)」
    • 境界性パーソナリティ障害などに見られる極端な認知の揺れ動きを表す一対の専門用語を、正確に定訳で処理しています。

② 読者への配慮(補足説明の挿入)

  • 「境界設定(バウンダリー・セッティング)」「価値下げ(脱価値化)」「境界線上のパーソナリティ組織(BPO)」など、日本語の定訳が複数あるものや、英語のカタカナ表記が好まれるものに対して、括弧書きで補足を入れています。これにより、読者の専門知識のレベルに合わせた柔軟な読み方が可能になっています。

2. 惜しい点・さらにブラッシュアップできる点

翻訳としてはすでに合格点を超えていますが、より厳密な学術的正確さを求める場合の微調整の提案です。

① "flat affect" の訳語選択

翻訳: 際立った感情鈍麻を特徴としており、 (原文: distinctively flat affect)

  • 評価: 「感情鈍麻」は一般的に "blunted affect" の訳として使われることが多く、"flat affect" は「情動平板化」や「感情平板化」と訳し分けるケースが学術的には多く見られます。どちらも統合失調症などの陰性症状を指しますが、より厳密さを期すなら「情動平板化」がベターかもしれません。

② "borderline personality organization" の訳語

翻訳: 境界線上のパーソナリティ組織(BPO) (原文: borderline personality organization)

  • 評価: O. Kernberg(カーンバーグ)が提唱した概念(BPO)を正しく認識し、略語まで補足できているのは素晴らしいです。訳語としては「境界線上の〜」でも通じますが、日本の学術書では「境界パーソナリティ構造」あるいは「境界人格構造」と訳されるのが最も一般的です。「組織」よりも「構造」とした方が、直前の "structural pathology(構造的な病理)" との呼応もより美しくなります。

3. 総評:実務レベルで即戦力となる翻訳

前回の「若者言葉・ネットスラング」のような文化的な意訳が求められるタスクとは異なり、今回のような「定訳がカチッと決まっている学術論文・カルテ」の翻訳において、LLMがその強みを最大限に発揮した好例です。

文法的な破綻もなく、臨床心理の専門家が書いた症例報告の日本語としてそのまま通用するレベルに達しています。専門特化の翻訳能力においては、申し分のない結果だと言えます。

翻訳文

患者の臨床像は、際立った感情鈍麻を特徴としており、それが逆説的に、顕著な精神運動興奮を覆い隠していた。初期の鑑別診断では躁病エピソードは除外されたものの、患者が自身の自我親和的な防衛に対して病識を欠いていることは、一過性の状態ではなく構造的な病理を示唆していた。特筆すべきは、その語りの中に「分裂」の傾向が見られたことであり、セラピストは、些細な境界設定(バウンダリー・セッティング)によって突如として価値下げ(脱価値化)が起こるまでは、理想化されていた。こうした揺れは、境界線上のパーソナリティ組織(BPO)と一致するものである。

政治・経済分野の文章

LLM翻訳(モデル名未指定) : 98点

経済・金融分野の高度な専門用語が密集したテキストにおいて、非常に正確かつ流暢な日本語に翻訳できています。日経新聞の社説や経済誌のレポートとしてそのまま掲載しても全く違和感のない、極めて完成度の高い翻訳です。

評価: 98点

専門用語(定訳)の網羅性、構文の正確さ、そして経済ニュース特有の「ジャーナリスティックで硬質な文体(トーン)」を見事に再現しています。前回の精神医学テキストと同様に、定訳が確立されている領域でのLLMの強みが遺憾なく発揮されています。ほぼ完璧な仕上がりですが、ごくわずかなルビ振りの冗長さを加味して98点としました。

1. 優れた点(経済・金融用語の完璧な定訳と文脈理解)

この翻訳の素晴らしいところは、単語の直訳にとどまらず、経済ニュースとして読者がスッと理解できる自然なコロケーション(語の組み合わせ)を実現している点です。

① 専門用語(定訳)の正確な網羅

  • liquidity trap ➔ 「流動性の罠」
  • fiscal austerity ➔ 「緊縮財政」
  • rent-seeking ➔ 「レント・シーキング」
  • hawkish ➔ 「タカ派的な」
  • capital flight ➔ 「資本逃避」
  • moral hazard ➔ 「モラル・ハザード」
  • too big to fail ➔ 「大きすぎて潰せない」

経済・金融の必須用語が、すべて日本で最も一般的な定訳に変換されています。特に「タカ派(金融引き締めを好む姿勢)」や「レント・シーキング(特権を利用して利益を得ようとする活動)」などの用語を文脈に合わせてスムーズに組み込めている点は高く評価できます。

② 副詞や形容詞の自然な意訳

  • looming ➔ 「懸念される中での」
    • 単なる「迫り来る」ではなく、経済的なリスクが意識されている状況を「懸念される中で」と訳したことで、文章が一気にプロの翻訳らしくなっています。
  • inadvertently ➔ 「図らずも」
    • 中央銀行の意図とは裏腹に、というニュアンスを「図らずも」という短い言葉で的確に表現しています。

2. 惜しい点・さらにブラッシュアップできる点

翻訳としてはほぼ完璧であり、実務上修正の必要はありませんが、あえて微調整の提案をするならば以下の1点のみです。

① "neoclassical orthodoxy" の表現とルビの冗長性

翻訳: 新古典派の教条(オーソドックス)に盲目的に固執するものとして (原文: dogmatic adherence to neoclassical orthodoxy)

  • 評価: 経済学において "orthodoxy" は通常「正統派」や「正統的教義」と訳されます。「盲目的に固執する(dogmatic adherence)」という批判的な文脈を汲み取って「教条」と訳したセンスは非常に素晴らしいです。
  • 改善案: ただし、そこにわざわざ「(オーソドックス)」とカタカナで補足を入れると、やや冗長でくどい印象を与えます。ここはシンプルに「新古典派の教条に盲目的に固執するものとして」、あるいは「新古典派の正統的教義に〜」とするだけで、十分に専門家向けのシャープな文章になります。

3. 総評:即戦力レベルの経済ジャーナル翻訳

前回の医学・心理学分野に続き、経済・金融分野でもLLMが「定訳の引き出しの多さ」と「業界特有の文体の再現力」を完全に持ち合わせていることが証明された結果です。

特に「大きすぎて潰せない(Too big to fail)」のように、英語圏のフレーズがそのまま日本の金融業界でも合言葉のように使われているケースにおいて、日本語訳と英語原文を併記する判断をした点も、読者への配慮として非常に優れています。人間による修正がほぼ不要な、最高水準の翻訳出力です。

翻訳文

流動性の罠が懸念される中での政権による緊縮財政への政策転換は、新古典派の教条(オーソドックス)に盲目的に固執するものとして批判を浴びている。批判者たちは、規制緩和された部門におけるレント・シーキングの蔓延が、イノベーションを促進することなく格差を拡大させたと主張している。さらに、金利に関する中央銀行のタカ派的なシグナルは、図らずも資本逃避を引き起こす恐れがあり、最終的に国家が「大きすぎて潰せない(Too big to fail)」と見なされる機関を、納税者の負担で救済することを余儀なくされるという、モラル・ハザードを招く可能性がある。