検索結果を要約する「AI Overviews」の“誤情報問題”は、生成AIの根本的な限界を浮き彫りにした

検索結果の概要をAIが生成して表示するGoogle 検索の「AI Overviews」に誤った回答を生成する問題が発生し、その対応にグーグルが追われている。この問題は、虚偽や誤りを示すことがある生成AIの現時点での限界を改めて浮き彫りにしたといえる。
Multi layered paper cut outs of a blue and green magnifying glass with a red question mark in the center on a yellow...
Photograph: MirageC/Getty Images

Google 検索のアルゴリズムが、ユーザーに「岩を食べる」ことや「ピザに接着剤を塗る」ことを推奨してから約1週間が過ぎた5月30日(米国時間)。生成AIを用いたこの検索機能について、手直しを加える必要があったことをグーグル認めた。今回の出来事は、生成AIの収益化に向けたグーグルの積極的な取り組みにおけるリスクや、このテクノロジーが当てにならず根本的に限界があることを浮き彫りにしている。

人工知能(AI)が検索結果の概要を生成して表示するGoogle 検索の機能「AI Overviews」は、検索クエリ(検索ワード)に対してネット上で見つかった情報を要約することで、テキストによる回答を生成して提示する。これはOpenAIの会話型AI「ChatGPT」の基盤をなす技術である大規模言語モデル(LLM)を活用した機能だ。

現在のAIブームは、文章を驚くほどうまく扱うLLMの能力が根底にある。しかし、LLMはその器用さを駆使することで、虚偽や誤りを説得力のあるかたちでもっともらしく説明することも可能だ。この技術によってネット上の情報が要約されることで検索結果を理解しやすくなることが期待されるが、オンラインの情報源に矛盾がある場合や、提供された要約に基づいてユーザーが重要な意思決定をする可能性がある場合にはリスクになりうる。

「LLMを使えば、いまでは素早くきびきびと反応するプロトタイプをかなり簡単につくれるようになりました。しかし、実際のところ『岩を食べる』ことを推奨しないようにするには多大な労力がかかるのです」と、リチャード・ソーチャーは語る。彼は研究者としてAIの言語処理に多大な貢献をしたことで知られ、2021年後半にYou.comというAIを中枢とする検索エンジンを立ち上げた人物だ。

ソーチャーによると、LLMの基盤となる技術は世の中のことを実際には理解していないうえ、ウェブに信頼できない情報が満ち溢れていることで、扱いには相当な労力が必要になるという。「場合によっては単にユーザーに回答を示す代わりに、複数の異なる視点を示すほうが実際には役立つこともあります」

AIの「間違いをなくす」ことの難しさ

グーグルはAI Overviewsのリリースに先立って広範なテストを実施していたことを、検索部門の責任者であるエリザベス・リードは公式ブログへの5月30日付の投稿で明らかにしている。一方で、「岩を食べる」ことや「ピザに接着剤を塗る」といったグーグルのアルゴリズムが風刺記事や冗談めいたネット掲示板のコメントから情報を引き出したことによる誤りがあったことで、さらなる修正が促されたという。グーグルによると、その修正には「理にかなっていないクエリ」の検出の改善や、システムのユーザー生成コンテンツに対する依存度の低減が含まれるという。

これに対してYou.comでは、LLMが検索に使われた際に誤った動きをしないようにする十数種類の効果的な方法を開発しており、普段からグーグルのAI Overviewsのような誤情報が表示されることを回避していると、ソーチャーは説明する。「正確さを期して多くのリソースを投入しているので、より正確になっています」

特筆すべき点としてYou.comは、LLMが誤った情報を避けられるように設計されたカスタムメイドのウェブインデックスを使用しているという。また、特定の検索ワードに対して複数の異なるLLMから選択して回答すると同時に、情報源に矛盾がある場合に説明可能な引用メカニズムを採用している。

それでもAI検索で間違いがないようにすることは難しい。実際のところ、ほかのAIシステムでもつまずくことで知られている検索ワードに対して、You.comも正しく答えられない場合があった。「入手可能な情報に基づくと、『K』の文字で始まるアフリカの国は存在しません」と答えたのである。以前のテストでは、この問いには完璧に答えていた。

専門家からは「拙速」との指摘も

グーグルにとってGoogle 検索は、最も広く使われていて収益性の高い製品である。それを生成AIを導入して刷新する取り組みは、OpenAIが会話型AI「ChatGPT」を2022年11月にリリースしたことを契機にテック業界全体で再燃したAI競争の一環といえる。

ChatGPTがデビューしてから数カ月後、OpenAIの主要なパートナーであるマイクロソフトはChatGPTの技術を採用することで、グーグルから後れをとる自社の検索エンジン「Bing」を刷新した。新しいBingはAIによって生成された誤情報や奇妙な動作に悩まされたが、最高経営責任者(CEO)のサティア・ナデラは、これをグーグルへの挑戦を意図した動きとしたうえで、「グーグルを焦らせたことをみなさんに知ってもらいたい」と語っている

一部の専門家は、グーグルがAIによる検索の刷新を急ぎすぎたと感じている。「医療や金融に関連したクエリなど、多くのクエリに関してそのままリリースしたことに驚いています。もっと慎重になると思っていましたから」と、検索業界を専門とするメディア「Search Engine Land」でニュースエディターを務めるバリー・シュワルツは言う。

シュワルツは、AI Overviewsを意図的に混乱させようとする人たちがいることをきちんと予見すべきだったとも指摘している。グーグルにとって最も価値ある製品の標準機能として検索結果に示すのであれば、なおさら「グーグルはその点について賢く対応する必要があります」

検索エンジン最適化(SEO)コンサルタントのリリー・レイは、AI Overviewsの初期バージョンが間違えやすかったことを考えると、今回の誤情報には驚かなかったと言う。彼女は初期バージョンとして提供されていた「生成 AI による検索体験(Search Generative Experience:SGE)」のベータテスターを1年間にわたって務めた経験がある。

「常にすべてを間違いのないようにすることは、実質的に不可能だと思います」と、レイは語る。「それがAIの本質ですから」

「岩を食べる」よう人々に促すような明確な誤情報が少なくなったとしても、AI検索は別のかたちで不具合を起こすかもしれない。レイはAI Overviewsのより微妙な問題を記録に残しており、なかには他の地域のウェブサイトやすでに閉鎖されたサイトなど、信頼性に劣る情報源を利用した要約も含まれていた。こうした事実は、例えば製品のおすすめを探しているユーザーに対して、有用ではない情報が提供される可能性があると彼女は指摘する。

こうしたなか、グーグルの検索アルゴリズムにコンテンツを最適化する人々は、いったい何が起きているのかを理解しようとしている。「いまのわたしたちの業界では、混乱の度合いが非常に高くなっています」と、レイは語る。

業界の専門家や消費者が新しいGoogle 検索の動作に慣れてきたとしても、間違いがなくなることを期待してはならない。AIを搭載したさまざまな検索サービスの比較を容易にするツールを開発している検索コンサルタントのダニエル・グリフィンは、グーグルがウェブサイトから引用した文章で検索ワードに回答する「強調スニペット」を2014年に導入した際にも、同じような問題に直面したという。

グリフィンは、グーグルがAI Overviewsにまつわる最も目立つ問題をいくつか解決することを期待しているものの、何が真実であるのかをLLMが把握できない問題や、情報を捏造する傾向がある問題を誰も解決していないことを忘れないことが重要であると指摘する。「単なるAIの問題ではありません」と、グリフィンは言う。「ウェブ全体の問題であり、世の中の問題です。必ずしも真実が存在するとは限りません」

(Originally published on wired.com, edited by Daisuke Takimoto)

※『WIRED』によるグーグルの関連記事はこちら


Related Articles
Google search engine seen through cracked phone screen
AIが検索結果の概要を生成して表示するGoogle 検索の「AI Overviews」が誤った回答を生成することが発覚し、これをグーグルが認めて技術的な改善を施した。一方で、ネット上で拡散した「誤回答の事例」には偽物が含まれていたことも明らかになっている。
Google logos and a person holding a smartphone
Google 検索で、AIが検索結果の概要を生成して表示する新機能「AI Overviews」の一般提供が米国で始まった。生成AIが不正確な情報を表示する可能性を考えると、検索結果の信頼性の低下にもつながりかねない。
Liz Reid
グーグルは検索サービスにAIを統合していくことで、その仕組みの再構築を加速させている。そうしたなか、検索におけるAIの台頭という“世界秩序の変化”に、どう対応していくのか。検索部門の責任者であるエリザベス・リードが語った。

雑誌『WIRED』日本版 VOL.52
「FASHION FUTURE AH!」は好評発売中!

ファッションとはつまり、服のことである。布が何からつくられるのかを知ることであり、拾ったペットボトルを糸にできる現実と、古着を繊維にする困難さについて考えることでもある。次の世代がいかに育まれるべきか、彼ら/彼女らに投げかけるべき言葉を真剣に語り合うことであり、クラフツマンシップを受け継ぐこと、モードと楽観性について洞察すること、そしてとびきりのクリエイティビティのもち主の言葉に耳を傾けることである。あるいは当然、テクノロジーが拡張する可能性を想像することでもあり、自らミシンを踏むことでもある──。およそ10年ぶりとなる『WIRED』のファッション特集。詳細はこちら