AI(人工知能)の過去・現在・未来
AIは人間を超えるのか

学術講演会 ● 講演録

 スタンフォード大学が選ぶ「世界で最も影響力のある研究者トップ2%」に4年連続選出された田口善弘教授が、最新の生成AIの機能を紹介。AIのしくみと賢い使い方とは――。(2025年8月3日、千葉市で開催された学術講演会より。学員会千葉県支部共催。取材記事・学員時報)

簡単な質問は適当、難問は得意!?

 今日はまず、最新のAI の一つ、Gemini 2.5 Proに「千葉駅から1時間以内の映画館を教えてください」と聞くところから始めたいと思います。結果は、京成ローザ⑩、T・ジョイ蘇我、ユナイテッド・シネマ幕張、TOHOシネマズららぽーと船橋、シネマイクスピアリ、TOHOシネマズ錦糸町でした。千葉の方の多くが「違うな」と感じられたのではないでしょうか。錦糸町は確かに1時間で行けるかもしれませんが、かなり遠いですよね。一方で、もっと近いイオンシネマ幕張新都心やTOHOシネマズ市原が無視されています。
 Gemini 2.5はハルシネーション率0.7%という驚異的な正確性を達成しています。1000回質問して7回しか間違わないというこです。今回の例も厳密には「嘘」ではありません。でも「適切性」という観点では問題があります。
 なぜこうなるかというと、現状のAIには「地理感覚」や「相手がどう考えているか」という部分が抜けているからです。「千葉から1時間」と聞かれれば、近場の映画館を知りたがっているのだなと察しますが、そういう気の利いたことができず「1時間」という正解を優先するのです。
 ところが、難しいことはちゃんと答えられたりします。医師の国家試験にAIを受験させたところ、合格してしまいました。今、問診して処方するという業務をAIで置き換えることが、視野に入っているそうです。マルクスの資本論を説明させても、現代貨幣理論を聞いても、見た範囲では明らかに間違っているようなことは答えてきません。
 要するに、生成AIというのは「近くの映画館を知りたい」みたいな簡単そうなことは適当に答え、難しいことは完璧に答えるという特徴を持っています。

文章作成も画像、映像も同じ原理

 今の生成AIは文章だけではなく、いろいろなものを作ることができます。
 「日本のアニメに出てくる戦闘少女の絵を描いてください」と言うと、かなりレベルの高い絵を描きます。主要な生成AI のChatGPT、Gemini、Grokに同じ質問をすると、絵が微妙に違います。それぞれ異なる解釈で戦闘少女を描いてくれます。
 音楽も作れます。「美しい鳥が飛んでいる様を描く歌」という短い指示を入れただけで、歌詞付きの完全な楽曲を作ってくれます。さらには「東京を侵略する宇宙人の動画を音声付きで作ってください」という指示だけで動画を生成できます。ただし、よく見るとおかしなところもあります。それは、人間が見たときにもっともらしい動画を作っているだけだからです。
 生成AIがやっていることは実は簡単です。文章の途中まで与えて、その次どういう単語が来るかを予想させるということをやらせます。「今日は」と来たらその次が「さつまいも」である場合より「晴れて」である場合が圧倒的に高いでしょう。しかし、ある程度長い文章なら次にくる単語は限られます。それを予測して組み合わせます。
 ChatGPTの場合は数千億語という単語を学んだと言われていますし、画像だったら数十億枚学んでいます。これだけの学習をするのがとても大変なんですが、それができるようになったので、ああいうことができるようになりました。
 100文字の文章をひらがなだけで作ろうとすると、50を100回かけた数、つまり8×10の169乗という天文学的な数の組み合わせがあります。しかし、人間が読んで意味がある文章はごく僅かです。
 機械学習は、意味のある文章が集まっている空間の「隙間」を指定すると、そこに相当する新しい意味のある文章を作ることができます。「今日は晴れです」「今日は雨です」を学習していれば、その間の隙間には「今日は曇りです」という文章が来ると予想できるのです。
 これは画像、音楽、動画でも同じです。意味のある画像や音楽は、ランダムなノイズ全体のごく一部に過ぎません。そこの空間構造を学習することで、新しい創作が可能になります。

AIが間違える試験問題を出す

 人間は複数の感覚や情報を同時に処理するマルチモーダルということができます。私が今こうやって喋ったときに、皆さんは私の声を聞きながら、私の姿を見て、かつスクリーンに映っている文字を読んでいます。現在のAIはそこができていませんが、徐々にできるようになってきました。
 最先端のAIは、現実から直接学ぶということです。今までのAIは人間が作ったものを学んでいましたが、最新のAIロボットは現実世界から直接学んでいます。だから逆立ちや側転といった複雑な動作ができるようになりました。
 ChatGPTはリアルタイムで通訳ができるようになって、日本語で喋ったら英語やイタリア語で翻訳してくれます。数年から十年くらいの間に、イラストは生成AIが作成するようになるので、これを使いこなせないイラストレーターは、職が危うくなります。文章の作成も同じで、ライターの仕事も同様です。ただし、クリエーター関係が失業するわけではなく、生成AIにはできないことができる人間だけが生き残ると思います。
 法的な問題として、生成AIは人間が作った文章、画像や映像を「学習」して生成しているので、オリジナルの製作者にどうやってベネフィットを還元するかが課題です。世界的には多くの訴訟が起きているので、今後の見通しは不透明です。
 最終的には、朝起きたら「こんな映画がみたいな?」と言ったら、それっぽい90分の映画を作ってもらって楽しめるようになると思います。教育も様変わりして、個別対応が可能なAIに補強された機能が付加されるでしょう。
 私は学生には「どんどん使え」と言っています。試験のときに「何でも持ち込んでいい、ChatGPTに聞いても良い」としています。でも、事前にこれらのAIに投げて間違うことを確認した問題を出題しています。
 AIが進化すると人間はやることがなくなるんじゃないかと言う人がいますが、私は違うと思います。人間というのはこういうものを使いこなして、より高度なことをできるようになるはずですから。

主催者謝辞より
高齢者もぜひ使うべき

前島 一夫 氏 (千葉県支部元支部長。昭35経)

  田口先生ありがとうございました。
 とても面白いお話で、もっとお聞きしたい。私もAIを使い始めたが、文章を直す程度。こんなにいろいろできるなら、我々高齢者もボケ防止のためにもっ
と使うべきだと思いました(笑)。

田口善弘氏

田口 善弘 氏
講演者
中央大学理工学部 教授

たぐち・よしひろ 理学博士。1984年、東京工業大学卒。1988年、同大学院博士課程後期修了。1997年中央大学理工学部に助教授として着任、2006年から同教授。著書『知能とはなにか ヒトとAIのあいだ』(講談社現代新書)、『砂時計の科学』(講談社学術文庫)、『学び直し高校物理』(講談社現代新書)ほか。

関連投稿

検索語を上に入力し、 Enter キーを押して検索します。キャンセルするには ESC を押してください。