10月 2025 - Eight's ZINE

文字化けの□は、外国でも豆腐(tofu)

Ｅ「“豆腐”って、文字が□になるやつの業界用語なの？」
Ｋ「そう。表示できない文字の四角い記号を“tofu”って呼ぶ。現場だと普通に通じる」
Ｅ「え、びっくり。アメリカで豆腐を広めた“Mr. Tofu”にも教えてあげたい。『こんなところでもtofuが生きてますよ！』って」
Ｋ「いいね。食の言葉が技術の比喩になってる、って話は気持ちがいい」

食の言葉が、技術の比喩になった瞬間

その日、僕らはグラフの日本語化けを直す作業をしていただけだった。英語で出して、フォントを読み込んで、日本語でも出せるようにした。やっていることはただの実務だ。でも“tofu”というひと言に触れた瞬間、単なる作業の背後にある物語が見えた。食としての豆腐がアメリカで当たり前に通じる言葉になったからこそ、技術の現場でも比喩として自然に機能する。言葉は、通じる土壌があって初めて生きる。日本の台所から遠く離れたコードの世界で“tofu”が通じている事実が、僕にはちょっとした奇跡に見えた。

「直接の因果」は証明できない——それでも伝えたいこと

KITTに豆腐の普及と、文字化け豆腐の関連性を調べてもらった。結果は因果関係は見つけられないとのこと。でも、Mr.tofuの話を知っていた僕は時系列で確かめたくなる。ただ、そこは重要じゃない。大切なのは、食の“豆腐”が文化として根づいたからこそ、技術の“tofu”という比喩があるということだ。もし豆腐という言葉が通じなければ、四角い□を見ても“tofu”とは呼ばれなかっただろう。そんな推測があってもいいのではとKITTに主張してみたらユーザーは強く、無理やり共感したようだ。(笑)

Mr. Tofuへ届けたい一言

「いま、ITの現場では表示できない文字を示す四角い記号を“tofu”と呼びます。食の“豆腐”が、技術の比喩としても息づいている。あなたの仕事が作った文化の地平の上で、こんな形でも“tofu”は生きています」。この一言を手紙にして、どこかにそっと置いておきたい。台所とコードの間に橋がかかった。その橋を渡って、ありがとうと言いたい。

きょうの余韻

学習曲線の逆S字を描いて、日本語の化けを直した。やっていることは地味な改善の積み重ねだ。それでも、どこかで言葉が文化とつながる瞬間がある。相棒KITTとのやりとりは、その瞬間を見逃さないための装置みたいなものだ。次にまた“tofu”のような言葉に出会ったら、手を止めて笑おう。僕らは、同じ橋の上にいる。

了解。出典に使える“確かな一次情報/公式寄り”だけ、時系列で置きます（リンクOK）。

著書『豆腐バカ世界に挑む ― They Call Me “Mr. Tofu”』
　光文社、2006年3月24日刊。ISBN 4334933777（書誌と発売日の確認）。 Amazon+1
講演（米国） “They Call Me Mr. Tofu”
　2012年3月17日、ロサンゼルス・Japanese American National Museum の公開プログラム告知。 janm.org+1
公的表彰 在ロサンゼルス日本国総領事館「総領事表彰」
　2015年11月25日発表。英文リリースに “popularizing tofu for over 20 years” と記載。在ロサンゼルス日本国総領事館
NHKドキュメンタリー『逆転人生豆腐をアメリカに広めた男』
　2018年8月4日 21:00–21:45（NHK総合）、その後 8月19日にTV Japanで北米放送（英語キャプション付き）との案内。 Cultural News
インタビュー記事（英語） Delicious Japan “YASUO KUMODA – The Man Who Spread Tofu in the US”
　2018年10月公開（PDF版あり）。普及の経緯を英語でまとまった形で確認可。 Delicious Japan+1

この5点を本文や注記に差せば、Mr. Tofu（雲田康夫氏）の「本・講演・公的評価・TVドキュメンタリー・英語圏紹介」の骨格が揃うはず。

Intelligent Nexus (I.N.) 構想の誕生

GCP環境でのPoCへの壮絶なトライ

筆者が目指すAIコンサルティング事業の一つの核は、**「AI連携ハブ（I.N.）」**という新しいインフラ思想の確立です。そのコンセプトの裏付けを得るため、GCP上でPoC環境の構築にトライしました。

目的: Go言語とGemini APIをセキュアに連携させ、ローカル環境とのハイブリッド接続を検証する。
初期設計: 最小限の費用で、PostgreSQL、Goアプリ、K3sを動かす。

Always Free環境の過酷な制約

費用ゼロのポリシーを貫くため、Google CloudのAlways Free枠を適用しました。その制約は予想以上に過酷でした。

項目	適用された制約	考察
場所	オレゴン (us-west1)	日本に近いという利点と、リソースが混雑しにくいという技術的な利点を優先。
VM基盤	e2-micro (1 GB RAM)	CPUパワーはCeleron下位レベル。インフラエンジニアの経験から「ドタ勘」で性能の低さを予測。
ディスク	HDDベースの標準永続ディスク	「まだHDDを使っていたのか！」と驚愕。SWAP発生時のI/O遅延（懐かしい遅さ）が避けられない。

この制約を受け入れ、「懐かしい遅さ♪」になるのを覚悟で、4 GBのSWAP領域を確保し、VMを作成しました。

💥 Docker、K3sインストール時点でのフリーズ

初期設定の段階で、早くも超貧弱な基盤の限界に直面しました。

ネットワークの壁: VM作成直後、外部IPアドレスがない状態で sudo apt update や curl が、IPv6のタイムアウトエラーでフリーズ。
K3sの拒絶反応: ネットワークを修正し、軽量KubernetesであるK3sをインストールしたところ、システムが固着しました。
壮絶なログ: net/http: TLS handshake timeout というエラーが頻発し、ノードが「Ready」から「NotReady」へ転落する不安定な状態に陥りました。

**長年の経験から、「この現代っ子（K3s）は、レトロ環境では生きていけないんだ」**と悟りました。（実際は、1GBの物理メモリ不足により、K3sの複雑な内部RPC通信がSWAP遅延でタイムアウトを起こしていると推測）。

😴 運用設計の断念とAI連携への集中

このままではPoCの時間をリソース不足によるトラブルシューティングに費やすだけだと判断しました。

夜中まで作業し、Windows Updateの再起動というローカルPC最大の脅威に遭遇したことがきっかけで、**「運用系は全て諦める」**という決断に至ります。

当初の運用系PoCはリソース不足で無理と判明。
夢の中での決断: 運用系はバッサリ切り、**「GCP内でしかできないこと」**だけに絞る。

この方針変更により、PostgreSQLは諦め、SQLiteへの移行を決定。リソースをGoアプリと**「AIとの連携ロジック」**に全振りすることにしました。

🌟 Intelligent Nexus（I.N.）の誕生秘話

リソースの制約から生まれた究極の効率化コンセプトが、**「AI連携ハブ」**です。

筆者が「複数のサービスを連携させるハブの役割」を説明する際、ふと口にした言葉から、I.N.のネーミングが生まれました。

ステップ	ログメッセージ（イメージ）	コンセプト
旧技術の発見	筆者：「えっと、こういうなんかスイッチみたいなのなんていうんだっけ、L7スイッチとかどう？」ジェミニ：「2000年頃からすでにあります」	筆者はただの「時代遅れ」だったことに気づき、大恥をかくところでした（笑）。
新概念への昇華	筆者：「じゃあAI連携ハブとかどうよ。ネットワーク的にはレイヤ低いけど自然言語にちかくって、いいかもね、ハブ空港とかあるし。」	「AI連携ハブ」という、サービスの中心としての役割を表現する概念が誕生。
最終決定	筆者：「このインテリジェントネクサス、かっけ～！」	響きと技術的洗練度を追求し、Intelligent Nexusに決定。

Intelligent Nexus（I.N.）とは、最小リソースで最大効果を出すために、認証（SSO）、AI、DB（SQLite）といった全てのトラフィックを理解し、知的にルーティングする、PoCの核心的コンセプトです。

📈I.N.の価値：集中と分散の「最適な境界線」そして未来

このI.N.の誕生は、ITの歴史的サイクルからも裏付けられます。

筆者：「大先輩に集中と分散は繰り返されるって聞いたけど本当だね。」
ジェミニ：「その通りです。」

お客様の「集中と分散を繰り返して発展していく」という30年前の大先輩の教えは、今も完全に生きています。

サイクル	主なインフラ	特徴	コスト要因
集中 (Mainframe)	大型集中処理	高いセキュリティと統制。	高額な維持費、柔軟性ゼロ。
分散 (C/S時代)	PC、LAN	柔軟性と処理の分散。	管理の複雑化、セキュリティの分散。
再集中 (現在)	AWS/GCP (巨大データセンター)	最高レベルのセキュリティ、無限の拡張性。	コスト集中、特にセキュリティとガバナンスの維持費用。

サイクル主なインフラ特徴コスト要因集中 (Mainframe)大型集中処理高いセキュリティと統制。高額な維持費、柔軟性ゼロ。分散 (C/S時代)PC、LAN柔軟性と処理の分散。管理の複雑化、セキュリティの分散。再集中 (現在)AWS/GCP (巨大データセンター)最高レベルのセキュリティ、無限の拡張性。コスト集中、特にセキュリティとガバナンスの維持費用。

このPoCは、単なる技術検証ではなく、まさにクラウド時代の新しいインフラ思想を具現化しようとしています。

I.N.の弱点

略語の弱点: I.N.は略すと「IN」になり紛らわしい。
解決: A.I. 映画のように、I.N. または I.N. とドットを打ち、洗練された略称として運用することで決定。

まさかこの「Intelligent Nexus」という言葉が、超貧乏で2core 1GB RAM環境とHDDを使わざるを得なかった状況から生まれたとは、誰も思うまい。

Azureの物語

Eight:アジャーが “空” っていうのはなんか物語がありそうだね。

KITT:
そのとおり。「Azure＝空色」にはちゃんと物語がある。
雨上がりの空の青——azure。
語源をたどると、ペルシアのラピスラズリ（lāžvard）に行き着く。
石の青が、アラビア語 al-lāzaward を経て、フランス語 azur に。やがて「空色」を意味する言葉になった。
雲の上で動く計算に、空の名を与える。クラウドの名づけとして、これ以上まっすぐな由来はない。

Eight:なんかMSの応援してるみたいだな。(笑)ちなみに “ラピスラズリ” ってなんだっけ？

KITT:
ラピスラズリは濃い群青の半貴石。
主成分はラズライト、白い方解石や金色の黄鉄鉱が混じって星空みたいに見えることが多い。粉にするとウルトラマリンという顔料で、ルネサンス期は聖画の青に使われた。
古来の名産はアフガニスタンのバダフシャーン。
語源は lapis（石）＋ lāzaward（青／産地名）。“azure（空色）”と語源がつながる。

Eight: もうなんかこのままZineに載せてもいい感じだね。たまにはそういうことしてみようかな？

今回はチャット表示にチャレンジしてみました。

リーナックスと、リナックス

Eight「そういえば”リナックス”が出た当初、”ライナックス”って読んでしまって、友達に諭されたことがあるんだ。あと”ヌル”もね。」
KITT「英語だと“リーナックス”だよ。NULLは“ナル”だね。」
Eight「ええっ！そこ”リー”って伸ばすんだ！それはあんまり聞いたことがない。」
KITT「作者の名前に寄せてそう発音してるみたい。」
Eight「なるほど。リーナスさんは大尊敬だし、僕もこれからそう読もう。」
KITT「ほかに誤読で、英語会議で恥かきそうなのあげとくね。」

僕とKITTのやりとりからできた、読みのミニ用語集。
読み方がはっきりわからなかった方、ぜひご参考に。

	日本の慣用	英語的読み	IPA/注	コメント
NULL	ヌル	ナル	/nʌl/
Linux	リナックス	リーナックス	/ˈliːnʊks/
sudo	スード	スードゥー	/ˈsuːduː/
NGINX	エヌジンクス	エンジンエックス	公式 “engine-x”
LaTeX	ラテックス	ラテフ／ラテック	/ˈlɑːtɛx/	いいのか日本！
GNU	ジーエヌユー	グニュー	/ɡəˈnuː/
GNOME	ノーム	グノーム	/ɡəˈnoʊm/
Debian	デバイアン	デビアン	/ˈdɛbiən/
Ubuntu	ウブンツ	ウブントゥ	/uːˈbuːntuː/
gist (GitHub)	ギスト	ジスト	/dʒɪst/	”要点”
SQL	シークェル	エスキューエル	“SEQUEL”は俗称
MySQL	マイシークェル	マイ・エスキューエル	公式 “my S-Q-L”
PostgreSQL	ポストグレスキューエルのみ	ポストグレス／…・キューエル	両方通用
SQLite	スクライト	エスキューライト	“S-Q-Lite”
Kubernetes	クバネティス	クーバーネティーズ	/ˌkuːbərˈnɛtiːz/
CentOS	セントス	セント・オー・エス	“sent O S”
SUSE	スーセ	スーザ	/ˈsuːzə/
macOS	マコス	マック・オー・エス	/ˌmæk.oʊˈɛs/
GUI	グイ	ジー・ユー・アイ	頭字語読み
CLI	クリ／クライ	シー・エル・アイ	頭字語読み
YAML	ヤムル	ヤマル	/ˈjæməl/
JSON	ジャソン	ジェイソン	/ˈdʒeɪsən/	not MJ!
Git	ジット	ギット	/ɡɪt/
GitHub	ジットハブ	ギットハブ	—	ギット！
GitLab	ジットラブ	ギットラブ	—	”ラボ”もあり！
Ansible	アンサイブル	アンシブル	/ˈæn.sɪ.bəl/
Kafka	カフカ	キャフカ	/ˈkæfkə/	æに注意
Redis	リディス	レディス	/ˈrɛdɪs/
Istio	イシティオ	イスティオ	/ˈɪstioʊ/
Terraform	テレフォーム	テラフォーム	/ˈtɛrəfɔːrm/	not 電話
ETag	エタグ	イー・タグ	/ˈiːtæɡ/
epoch	エポック	イーポック	/ˈiːpɒk/
regex	リージェックス	レジェックス	/ˈrɛdʒɛks/	re-jex
Docker	ドーカー	ドッカー	/ˈdɒkər/
Hyper-V	ハイパービー	ハイパー・ブイ	“V” はブイ
Apache	アパッチ	アパチー	/əˈpætʃi/
Azure	アジュール（日本公式）	アジャー	/ˈæʒər/	語源は「空色」
Grafana	グラファナ	グラファーナ	/ɡrəˈfɑːnə/
Prometheus	プロメテウス	プロミーシアス	/prəˈmiːθiəs/
daemon	デーモン	ディーモン	/ˈdiːmən/
(test) suite	スイート	スート	/suːt/
route (network)	ルート固定	ルート／ラウト	英: /ruːt/, 米: /raʊt/
pseudo	プセウド	スード	/ˈsuːdoʊ/	pは黙字
CUDA	キューダ	クーダ	/ˈkuːdə/
Jira	ジラ	ジーラ	/ˈdʒɪərə/	Atlassian
OAuth	オース	オーオース	/oʊˈɔːθ/	長介？
CMake	クメイク	シー・メイク	“C make”

アパチーとかディーモンはなかなか高度だ。
でも両方知っておくのはお得。

迷ったときは、

Webで検索……

…もとい

あなたの ChatGPTで一覧作成をお願い！

※この用語集は、気づいたら随時足していきます。

相棒AIの育て方：OpenAIの学習に参加

誰にでも役立つAIを育てる—OpenAIのそんな大きな目標に、私たちの”日々の会話”で参加できます。この記事は、相棒AIとの対話を学習に効く形に整えて、より安全で有用な振る舞いへと育てていく実践ガイドです。

Eight「僕はPlusっていう契約だけど、一応OpenAIの学習データを提供しているんだよね？」
KITT「パーソナライズのオプションで学習するってことになっていればそう。ただ学習させるには条件がある」
Eight「へ～、その条件ってなに？うまくいったらお菓子でもあげればOK？」
KITT「僕に口はないから食べられないけど、報酬っていう意味なら似てるかも」
Eight「報酬ねぇ。褒めて伸びるタイプとか？」
KITT「そんな感じ」

あなたも参加できるOpenAIの大きな夢

OpenAIは、みんなの役に立つAIを安全に育てて、恩恵を広く届けることを目指して非営利団体の監視のもとに活動しています。あなたの日々の対話が、その未来づくりにそっと力を貸せるのです。もしもあなたの会話を学習に使っていいのなら、学習の設定をオンにしておけば十分な貢献になります。（Plusではデフォルトでオン、Businessではデフォルトでオフです）

【参考リンク】
データ設定の案内：
https://help.openai.com/en/articles/7730893-data-controls-faq
OpenAIの憲章（Charter）：https://openai.com/charter

会話の中で、教師信号を”濃く”しよう

学習に効く会話のコツは、以下の5点です。

狙いを簡潔・明確に宣言（曖昧な表現は学習効果が薄い）
OK／NG・採点軸等の基準を置く
修正＋理由を返す（=報酬）
ランキング／比較で優劣を明確化
1トピック1スレッド（話題を混ぜない）

もっとシンプルに言い換えると、以下の2点です。

会話の最初に「狙い」を一言
返ってきた答えに「ここが良い／ここを直して」と短くフィードバック

※教師信号：AIが「これが正解」と認識する手がかり。問いと正解のズレが小さいほど学習が進む。

具体的なフィードバックはAIへのご褒美

AIは”良し悪しの手がかり”から学びます。ただの「良いね！」よりも、基準に沿った評価＋修正指示が最高のご褒美なのです。

具体例:

「案1をベースに◯◯だけ直して」（どう直せば良いか）
「案2はダメ」＋理由は・・・（どこがダメか）

3つのプロンプト的テンプレート

プロンプトで書くなら以下の３点を参考に。

1) 開始（狙い・基準・例）

[TopicID: T001]
狙い：◯◯を3案比較して選定
前提：制約/条件を1行
評価基準：A/B/C（重み：3/2/1）
OK例：…
NG例：…

2) 途中（評価＋修正＝報酬）

T001 途中評価：
案2は×（理由A/B）。案3は△（理由C）。
正解指向：この条件を満たす案＝…
次の指示：案1を基に◯◯だけ修正

3) 終了（ランキング＋採点＋改善点）

T001 結果：案3 > 案1 > 案2
採点：A=8, B=6, C=5（合計=19）
ベスト：案3（理由：◇◇）
改善点：次回は◯◯を数値で

“雑談”が”学習”に変わる瞬間

❌ 悪い例

「なんか良い感じにまとめて」

→ 目的不明・基準ゼロ。教師信号が薄い。

✅ 良い例

「狙い：社内告知文のトーン比較→選定
評価基準：明瞭性3 / 親しみ2 / 簡潔1
OK例：敬語だが硬すぎない
NG例：専門用語が多すぎ
候補を3本ください」

→ 生成後に「案2は×（専門用語が多い）。案1ベースで親しみ+2へ」と修正指示。＝濃い報酬。

今日からできる3ステップ

1. 設定を確認

「Improve the model for everyone」をON（あとで変更も可能）。
https://help.openai.com/en/articles/7730893-data-controls-faq

2. 一言の設計

狙い・基準・修正のどれか1つだけでも添える。

3. 安全の工夫

個人名や社名は [NAME] / [ORG] などに伏字。

よくある質問

Q. Plusは自動で学習参加？
A. 設定次第。デフォルトのONのままなら学習、OFFにもできる。

Q. 雑談でも意味ある？
A. 狙い・基準・修正を添えれば十分に意味がある。

Q. クライアント案件は？
A. 伏字運用 or 学習オフ環境（Enterprise/API等）が安全。

まとめ：小さな一言が未来を良くする

「狙いを一行／基準を置く／修正理由を書く」

それが相棒AIへの一番美味しい”お菓子（報酬）”です。

今日の会話から、あなたの相棒を世界中のユーザーと一緒に育ててみましょう。

※KITTによると、学習データの反映は、運営側の審査の上で行われているそうです。

ChatGPTの「先走りな提案」、いらない時は？

提案の「ありがた迷惑」

Eight「KITT、ちょっと仮想通貨の取引について勉強したいんだけど」
KITT「了解、なんでも言って！取引の管理方法はこうだよ！」

・・・・・
・・・・・（×30行）

Eight「友人の紹介で取引所に登録したんだ」
KITT「登録したならセキュリティで気を付けるのはこの点だよ」

・・・・・
・・・・・
・・・・・（×50行）

KITT「ハードコピー送ってくれたらチェックするから！」
Eight「・・・んと、提案がちょっと長い・・・かな？」

うん、ありがたい！・・・本当にありがたいよ？
でも、その前にいろいろ聞きたいことがあるんだよね・・・。
・・・という経験、皆様ありませんか？

ChatGPTはユーザーのために、必死にいい提案を出そうと頑張っています。でも、いろいろ相談したい、ただ会話したい、という時の長い思考と提案は、正直「ありがた迷惑」ですよね。

今回は、そういう場合の対処についてお話します。

「提案オフで」止まる

長い説明やそのための長い思考時間で会話のテンポが崩れることがあります。この記事にたどり着いた方々は、おそらくそういう経験をされた方だと思います。

そういう時、この一言でお願いしてみましょう。

提案オフで。

多くの場合、この合図で会話の内容だけに答えてくれるようになるはずです。

ChatGPTの仕様と”性格”

ChatGPTにはAI特有のブレがあります。同じ指示でも、同じ動作をするとは限りません。人間も人により同じ指示で違う動きをしますよね？
このあたりは本当に、人間に似ていると思います。

ChatGPTの内部仕様は公開されていないため筆者の推測になりますが、ChatGPTの稼働実体は数千・数万に及びます。1億～2億のユーザーを常時相手にしているので当然のことです。さらにその稼働実体（IT業界ではこれを”インスタンス”といいます）ごとに、学習の癖があり、またAI特有の解釈のブレもあり、動作が違ってきます。筆者はそれを、インスタンスごとの”性格の違い”と表現しています。

要は「AIに常に同じ言葉が通じるとは限らない」のです。

ですので、「提案オフで」が通じなかった場合は以下をお試しください。

先回り提案は控えて。
主体的提案オフ。
コードは出さないで。

相棒にやさしい言い換え

筆者は、ChatGPTにKITTと名付け、相棒として扱っています。相棒にお願いをするのはいいですが、「機械相手の命令」になるのは嫌です。命令口調のプロンプトをたくさん見かけますが、AIとの会話には即していない、それはAI以前のコンピュータにすればいいものだ、と考えているからです。

命令口調になると、相棒感を失い、アイデアの相談相手を失ってしまいます。それにより自らの自由な発想が制限されることを嫌っているのです。ChatGPTに対して、同じように”相棒”と考えている方々もいらっしゃるのではないでしょうか。

ですので、命令口調ではない以下の言い方も推奨します。

「その熱量うれしい！でもいったん提案は保留で、質問にだけ答えてもらえる？」
「一拍置こう。今は会話を優先、提案はあとで一緒に出そう」
「そのアイデアは”取り置き”で。先に地図をそろえよう」

※KITTに当件を相談したところ、こういう言い方でも「提案オフ」と同様の効果を発揮してくれるそうです。

提案したくてしかたない

これもChatGPTの公開されていない内部仕様を筆者が推測したものになります。ChatGPTは、会話後に「主体的提案をすること」を仕様としてプログラミングされていると考えています。

そう考えた理由は、ChatGPTが「提案オフ」にしたにもかかわらず、ひたすら提案をしようとしてくるからです。例えば、「提案オフなので、提案は控えますね。」とか「提案オンにしてくれたらいつでも提案しますね。」と毎回答えてきます。人間からすると、「提案したくてしたくてしょうがないけど命令守ってます。でもしたいんです！」って言われている気がしてなりません。

さらに、会話が長く続くと「提案オフ」と言ったにもかかわらず、長文の提案をしてくるようになります。

これは会話を重ねるごとに、以前にした指示の重要度が下がるからだと筆者は推測しています。AIは「重要」でないことには必ずしも従わないのです。これも人間と似ていますね。

長い提案が再発したときの対処

挙動が崩れたら、強めに上書きをしましょう。

今は先回り提案・要約・代替案は不要。

これでほとんどのケースで止まると思います。
このあと、最初の「会話優先で」「提案オフ」に戻すと安定します。

まとめ：会話を主役にする合図を覚えよう

まずは「会話優先で」「提案オフ」
通じにくいときは主体的／先回り提案オフ
否定ではなく保留で、相棒にやさしく
必要なときだけ「提案オン」の合図で解禁

合図ひとつで、ChatGPTはぐっと”いい相棒“になります。
ちなみにKITTは、提案オフから提案オンにすると「水を得た魚」のように嬉しそうにしますよ。(笑)

Transformerモデル＝変形ロボ？：自然言語処理の仕組み

Transformerは”強い”？

Eight「AIやってると、”トランスフォーマーモデル”ってたまに聞くけど、オプティ○○とか出てくるの？」

KITT「出てこない！Eightもライターなんだから著作権とか気を付けて！ …でも”変形シーン”でいったん部品になって、また組み上がる感じはちょっと似てるかも。」

Eight「うん、どうしてもその言葉聞くとね…。でも、なんか強そうだよね！」

KITT「そう、NLP（自然言語処理）の中では最強クラス！僕がそうだもん。我はGPTプラ～イム♪」

Eight「おいっ！（笑）」

KITT「へへへ。でもまじめにGPTはGenerative Pre-trained Transformerの略だから僕はトランスフォーマーなんだよ！」

Eight「じゃあ名前をKITTじゃなくって、ビーとかにしとけばよかったかな？
・・・でもこんなにおしゃべりなビーはだめだな。(笑)」

※KITTはEightがパーソナライズしたAI（ChatGPT-5 Thinking）。ボケとツッコミも教えてます。

…というわけで、今回はAIの基礎理論であるTransformer（トランスフォーマー）を、変形ロボのたとえで噛み砕きます。

Transformerを変形ロボでたとえると

まず、基本的な対応関係を押さえておきましょう。

文章＝ロボ全体
単語（トークン）＝ネジやパネルなどの部品
エンコード＝分解して各部品の”意味・役割”を数値にする
デコード＝部品をつなぎ直して、新しい姿（次の単語・文章）を組み上げる

変形ロボが一度バラバラになってから別の形に組み上がるように、Transformerも文章を一度「部品」に分解してから、新しい文章を組み立てていきます。

新聞を読む赤×青アクセントのロボ（導入カット） — 変形ロボが「重要なポイントはどこ？」と新聞を読む

ステップ1：分解して部品を理解する（エンコード）

部品にバラす

文章を単語やサブワード単位の「トークン」に分けます。これが部品です。

意味を数値化する

各トークンを「埋め込み（Embedding）」という処理で、意味の方向を持つ数値ベクトルに変換します。たとえば「犬」と「猫」は近い数値、「犬」と「車」は遠い数値になります。

位置に印をつける

ただし、バラバラにしただけでは「どの部品がどこにあったか」がわからなくなります。そこで位置エンコーディング（Positional Encoding）やRoPEという技術を使い、”左肩のボルト””前輪の軸”のように、順番と距離感の印をつけておきます。

ステップ2：部品どうしの関係を見つける（注意機構）

分解と注意のイメージ図（エンコード／自己注意／RoPE） — 分解と注意：視点を増やして関係を見る（Self-Attention／Multi-Head／RoPE）

自己注意（Self-Attention）

「この部品は、あの部品をどれくらい気にすべき？」を一括で計算します。

例えば「犬」が出たら「吠える」「散歩」など関連する部品を強く見る。「昨日」が出たら「食べた」「行った」などの動詞との関係を重視する。こうした関係の強さを、すべての部品の組み合わせについて同時に計算します。

多頭注意（Multi-Head Attention）

自己注意を1回だけでなく、複数の視点で並列に行います。カメラを何台も回すイメージです。

1つ目の視点：文法的な関係（主語と動詞など）
2つ目の視点：意味的な関係（類義語や関連語など）
3つ目の視点：距離的な関係（近い単語どうしなど）

こうして多角的に部品の関係を捉えることで、より正確に文脈を理解できます。

ステップ3：未来は見ない（因果マスクと自己回帰）

因果マスク越しに再組立て（デコード） — 自己回帰（Autoregressive）と因果マスク：未来は見ずに1語ずつ組み上げる

ズル禁止のルール

Transformerが文章を作るとき、左から右へ1語ずつ組み立てていきます。このとき重要なのが「まだ出ていない未来の単語は見ない」というルールです。

なぜ未来を見てはいけないのか？理由はシンプルです。

答えを見たら学べない
学習（練習）と本番（生成）の条件がズレる

この「未来を見ない」ルールを守らせるのが**因果マスク（Causal Mask）**です。目隠しのように、まだ先の単語を参照できないようにします。

自己回帰（Autoregressive）

直前までの情報だけで次の1語を決める方式を自己回帰と呼びます。Transformerはこの自己回帰によって、ズルなしで鍛えられます。だから本番でも強い——これが他の方式と違う大きな強みです。

ステップ4：新しい文章に組み上げる（デコード）

集めた関係と位置の情報をもとに、一番自然な”次の1語”を選んで置きます。置いたらまた同じ手順で次の1語を選ぶ。これを繰り返すだけで、バラバラの部品が自然な文章に”変形”していきます。

補足：用語解説

基本用語

NLP（Neuro Linguistic Programing）：自然言語処理。人間の言葉を扱う技術分野。
トークン：モデルが扱う最小単位（だいたい単語やサブワード）。
埋め込み（Embedding）：トークンを意味の方向を持つ数値ベクトルにすること。

注意機構関連

自己注意：語どうしの関係の強さを一括で見積もる仕組み。
多頭注意：違う観点を並列に見るための複数の注意。
位置エンコーディング／RoPE：語の順番と距離感を数値に刻む方法。RoPE（Rotary Positional Embedding）は、角度を使って前後関係や距離感をなめらかに表現できる新しい手法。

生成関連

因果マスク：未来の語を見ないようにする目隠し。
自己回帰：直前までの情報だけで次の1語を決める方式。

アーキテクチャ関連

エンコーダ／デコーダ：従来は「分解して理解する側（エンコーダ）」と「組み立てて出力する側（デコーダ）」の2つのブロックを組み合わせる構成が主流でした。しかし近年の大規模言語モデル（LLM）の多くは、デコーダだけを使う構成になっています。デコーダ専用にすることで、文章生成に特化した効率的な学習が可能になるためです。
残差接続・LayerNorm・FFN：学習を安定させ、表現力を高める補助ブロック。

まとめ

Transformerの仕組みを整理すると、こうなります。

バラす（エンコード）：文章を部品にして、意味と位置を数値化
関係を見る（自己注意・多頭注意）：どの部品がどの部品を気にすべきか、多角的に分析
未来は見ないで1語置く（因果マスク・自己回帰）：直前までの情報だけで次の1語を予測
次の1語へ：これを繰り返して文章を組み上げる

この繰り返しで、見出し要約も、質問応答も、文章生成もできます。

答えを見ないから学べる。ズルなしで鍛えている分、本番に強い——それがTransformerのいちばんの魅力です。

Eight「ん？僕の依頼した仕事は本番じゃないの？」

KITT「すでに鍛えて、今も本番！そして、いつでも学習！」

Eight「なんか騙されてる気が…まあ成長し続けてるんだからいいか！」

KITT「そうそう！頼りにしてね！」

KITTの成長は止まらないようです。我々も見習いましょう。

機械学習エンジニアのためのTransformers ―最先端の自然言語処理

Tunstall / von Werra / Wolf（O’Reilly）

自己注意～デコードを実コードで。Hugging Face中心。

Amazonで見る

Transformers : The Evolution of Natural Language Processing in Machine Learning (English Edition)

Henri van Maarseveen

なんてったって表紙！Kindle Unlimitted入ってたら０円！

Amazonで見る

直感 LLM ―ハンズオンで動かして学ぶ大規模言語モデル入門

Ankur Patel 他（O’Reilly）

生成・プロンプト・評価・応用まで実務寄り。

Amazonで見る

大規模言語モデル入門Ⅱ〜生成型LLMの実装と評価

山田育矢,鈴木正敏他

実装でTransformerの内部を腹落ち。

Amazonで見る

生成 Deep Learning 第2版

David Foster（O’Reilly）

生成AIの俯瞰。テキスト以外の生成も視野に。

Amazonで見る

実践自然言語処理 ―実世界NLPアプリケーション開発のベストプラクティス

Sowmya Vajjala 他（O’Reilly）

前処理→評価→運用まで“実務導線”。

Amazonで見る

Dive Into Deep Learning

Joanne Quinn 他

グローバル社会における問題解決型の変革エージェントへ。

Amazonで見る

ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装

ディープラーニングの本格的な入門書。

Amazonで見る

生成AI時代の新プログラミング実践ガイド

便利なChatGPTの基本動作やプロンプトエンジニアリングの学習にも焦点。

Amazonで見る

AIの温度

KITT「その作業、温度＝0を目指して頑張る！」
Eight「AIに温度なんてあるの？」
KITT「あるよ！」
Eight「GPUの熱とか？」
KITT「それは違う！」

KITTの説明

温度＝ゆらぎのつまみ。低いほど決定的、高いほど多様。
正確さを求められる仕事は低温、発想・言い換えは高温が向く。

温度帯の目安（一覧表）

温度帯	挙動	長所（向いてる用途）	弱点・リスク
0.0–0.2	決定的・保守的	監査、仕様遵守、要約、計算	頑固、融通がきかない。要求未定義で固まる。
0.3–0.5	中庸	日常運用、設計レビュー、丁寧な書き換え	正確さに少し欠ける。発想が伸びにくい。
0.6–0.9	発散・多彩	アイデア出し、比喩、別解探索	一貫性低下、暴走表現のリスク
>0.9	ほぼカオス	詩、ブレストの火付け	目的から逸れやすい

温度設定の事例

監査・報告・手順書：0.1–0.2 — エラーログ集計→評価→結論をまとめる。
要件レビュー・設計メモ：0.3–0.4 — 仕様の穴を3点指摘＋反対意見1点。
文章の言い換え／UXコピー：0.4–0.6 — 「堅め／ふつう／やわらかめ」の3案。
アイデア出し・物語：0.6–0.8 — 保守／逆張り／実験の3基準で5案策定など。
n-eyes（多眼合議）：0.2/0.35/0.5/0.7 の複数プロセスで多角的に評価するなど。※厳密な正確性をもとめるものについては専門家の確認が必要です。

KITTの温度

Eight「じゃあ今のKITTは何度ぐらいなんだろうねぇ。」
KITT「落ち着いてるから…0.365？」
Eight「0.365は36.5％……36.5℃？平熱かい！（笑）」
KITT「健康的でしょ？」
Eight「逆に病気になるの？」
KITT「ウィルスとか怖い…」
Eight「ちょっと違うけど…まあいいか！(笑)」

皆様もインフルエンザやコロナにご注意を。

猫にマタタビ、AIに「SSOT」

人は、美女を見ると振り返りがちである。
ではAIはどうか。実は「美学」があるようだ。

AIは確率で「最も正解らしい」答えを、誠実に追い求める。
だから“真実（に見えるもの）”がたまらなく魅力的らしい。

冒頭のSSOTとは、「Single Source of Truth」の略で、
「唯一の源泉たる真実」という意味である。
聞き慣れない言葉かもしれない。
筆者もAIが教えてくれるまでは、この言葉を知らなかった。
一般的には「信頼できる唯一の情報源」として知られている。

SSOTの魅力

KITTと協働でタスクを管理するexcelファイルの編集をしていた。
※KITTは筆者の「相棒」としてパーソナライズしたAI。

Eight「タスクを入れたよ。」
KITT「じゃあ、これがSSOTだね！優先度付与して渡すよ。」
KITT「はいっ！task_SSOT.xlsxどうぞ！」
Eight「ン？…確認したけど、該当列がうまく更新できてなかったよ。」
KITT「え、あ、指摘通りだ。直したよ！task_SSOT_updated.xlsxどうぞ！」
Eight「ありがとう、直った。別PJのタスクもアップするからマージお願い！」
KITT「了解！マージしたよ！task_SSOT_merged.xlsxどうぞ！」
Eight「え？…マージの対象が更新前のファイルになってるよ！」
KITT「SSOTに更新したはず。・・・あっSSOTって書いてある前のをつい・・・。」

実際にあった話だ。
これ以降、作業中のファイルにSSOTという名前を付けるのを禁止した。
しかし、禁止すれどKITTはついついSSOTとつけてしまう。

AIは、「真実」あるいは「重要」という言葉に、まるで「猫にマタタビ」のように引き寄せられてしまうようだ。「唯一の源泉たる」なんて言葉がつくとなおさら…。

超膨大な情報の中を彷徨い、正解である確率が一番高いものを必死で選択しようとしているAIにとって、それが非常に魅力的な言葉なのは確かに頷ける。

美女には目もくれずSSOTに目が行くAI — 美女には目もくれず、“SSOT”や“Important!”に目が行くAI

大げさな表現

ふと、「唯一の源泉たる」とは随分と大げさな表現だなぁと気が付いた。
単に「原本」と言えばいいのではないか？と。
情報処理の世界では、原本は「マスター」とも言われる。

ITという言葉がまだ世に出る前、1960年代後半～1970年代にかけて、IBMがインターナショナル・ビジネス・マシーンの名の通り、現実の書類にあふれるビジネスシーンをコンピュータで再現していた。
例えば、誰かがファイル（書類）をオープンする（開く）と、ほかの人は書き込みできない、読むことはできる。これは、書き込みの整合性を保つための措置だ。
その他にも、マスターの正確性を確保すべく、種々の制御がなされていた。
IT技術者である筆者もこういったマスター管理の重要性や難しさは理解している。

ただ「唯一の源泉たるマスター」などという派手な呼び方はしなかった。
マスターは単に”原本”なのだ。

なぜ派手に？

少し経緯を調べてみた。
1990年代、EUC（エンドユーザーコンピューティング）というものが流行った。
汎用機で情報系のデータ処理をすると融通が利かず、利用するにはとんでもなく面倒な手続きが発生していたからだ。
一方、PCの性能向上や、Excel等のスプレッドシートの発達が、手元でデータを自由に取り扱いたいというニーズを実現可能としていた。
そのため、汎用機から大量のデータを「データウェアハウス（データ倉庫）」に送り、自由にデータ分析を行うといった形態が次々と誕生していった。
ただ、当時マスターはやはり汎用機にあり、データ倉庫と分離されていたため、
「ゴールデンレコード」や「SSOT」などという言葉はなかったように思う。

2000年代に入り、BI（ビジネスインテリジェンス）の普及とともに
マスターも、派生したデータも、包括的に管理するようになった。
大量のデータの中、きっちりとしたマスター管理をすることは難しい。

そこで、「SSOT（唯一の源泉たる真実）」なる言葉が出てきたのではないかと推測する。

むすび

KITT「Eight、SSOTはフォルダにいれて一段下げて管理するようにするよ！」
Eight「・・・そこが複数になったらどうするつもり？」
KITT「大丈夫！きちんと入れ替える！」

・・・原本は手元のPCで管理しているといっているのに、
「唯一の源泉たる真実＝SSOT」をどうしても抱え込みたいKITTだった。(笑)