流暢さの正体
生成AI、とりわけChatGPTのような大規模言語モデル(LLM)は、人間のように自然な文章を書き、質問に答え、翻訳や要約までこなします。まるで意味を理解しているようです。しかしその中身は、多くの人の想像とは違います。理解しておくと、AIを賢く使い、その落とし穴を避けられます。
核心は「次の単語予測」
言語モデルがやっていることを一言で言うと、「これまでの文章に続く、次に来そうな単語を予測する」——ただそれだけです。「日本の首都は」と入力されれば、膨大なテキストから学んだパターンにもとづき、「東京」が続く確率が高いと判断して出力します。そしてその「東京」を含めた文脈から、また次の単語を予測する。これを高速で繰り返すことで、長い文章が紡がれていきます。
前レッスンの機械学習の応用です。インターネット規模の膨大な文章を学習し、「言葉と言葉のつながりやすさ」のパターンを極限まで精密にした結果、驚くほど自然な文章が生まれます。
ここに決定的なポイントがあります。言語モデルが最適化しているのは「正しさ」ではなく「もっともらしさ」だということです。事実かどうかを確かめているのではなく、「それらしい言葉の連なり」を作っているのです。
だから「堂々と間違える」
この仕組みを知ると、生成AIの最大の弱点が理解できます。ハルシネーション——事実でない内容を、さも本当らしく自信たっぷりに述べる現象です。
なぜ起きるのか。AIは真偽を検証していないからです。存在しない論文の題名も、間違った歴史の年号も、実在しない人物の経歴も、「もっともらしい言葉の連なり」としては正しい文とまったく同じように、流暢に生成されてしまいます。流暢さは正確さの保証にならない——これは生成AIを使ううえで最も大切な注意点です。
得意と不得意を仕分ける
仕組みから、得意・不得意が見えてきます。
- 得意:文章の要約・翻訳・言い換え、アイデア出し、文体の変換、下書きの作成——「もっともらしさ」がそのまま価値になる作業
- 不得意:正確な事実の保証、最新情報、複雑な論理計算、出典の正確な引用——「正しさ」が問われる作業
だから生成AIは、答えを鵜呑みにする相手ではなく、下書きを作らせて人間が検証する相棒として使うのが理にかなっています。
ニュースで使う視点
「AIが◯◯と回答」「AIが作った偽情報」といったニュースを読むときは、AIは事実ではなく、もっともらしさを生成しているという前提を思い出してください。生成AIは偽情報(選挙とディープフェイク)の製造コストを劇的に下げました。本物そっくりの文章・画像・音声が誰でも作れる時代に、確証バイアスを突かれない受け手であることの価値は、これまで以上に高まっています。
次のレッスンでは、生成にとどまらず、AIが人に関する決定を下すようになった社会の論点を扱います。