わたしの思い出はメタの“AI訓練データ”になる

メタ・プラットフォームズは、FacebookやInstagramにユーザーが投稿したコンテンツをAIの訓練に利用していくことを明らかにしている。わたしたちのデジタルな歴史は、AIに“人間性”を教え、人間模倣するために再利用されていくということだ。
Stylized graphic of AI head silhouette opening in front of facebook posts thumbtacked to a black background.
Photo-Illustration: Rosie Struve; Getty Images

ロバート・C・シェリフの小説『The Hopkins Manuscript』は、大災害により西洋文明が滅んでから800年後の世界へと読者を連れていく。新しい世界秩序に属する科学者たちが地球の空白の歴史を知る手がかりを求めていると、かつて「イングランド」と呼ばれていた荒れ果てた湿地帯で誰かの日記が発見される。新しくできた国の住民は、引退した教師の田舎での平凡な生活と、彼の小さな虚栄心や賞の獲得を目指して育てているニワトリの記録を通じて、20世紀の英国について学び始めるのだ。

わたしが未来の生命体に地球での生活について教えるとしたなら、シェリフの小説に登場する狭量な主人公、エドガー・ホプキンスよりも意味のあるタイムカプセルをつくれるはずだと、かつては信じていた。しかし、10年前のFacebook投稿をスクロールしていたところ、自分の人生の記録はホプキンス以上に退屈なものかもしれないという可能性が浮かび上がったのである。

過去の平凡な投稿がAIの訓練に使われる

メタ・プラットフォームズが、わたしが10代後半にしていたような投稿こそ、未来の人工知能(AI)モデルに引き継ぎたいコンテンツそのものであると発表したのは6月10日のことだ。そして6月26日から古い公開投稿、休暇中の写真、さらに世界中の何百万人ものFacebookInstagramユーザーの名前は事実上人類のタイムカプセルとして扱われ、訓練用データとして用いられるという

これはつまり、大学の小論文の提出期限についての平凡な投稿(「エナジードリンクを3本飲んだ。残り1,000ワード」)や、特筆すべきことがない休日の写真(停泊中のフェリーでスマートフォンを見ているわたし自身の姿を写したもの)がそのコーパスの一部に含まれるということである。こうした投稿は非常に退屈だが、非常に個人的なものであるという事実が、メタの行動に対し不安を掻き立てられる原因となっている。

同社は、すでに公開されているコンテンツのみ用いるとしている。プライベートなメッセージや友人にだけ共有した投稿、Instagramのストーリーは対象外だ。とはいえ、ここに来て突然、誰も訪れないインターネットの隅っこで何年も埃をかぶっていた個人的な記憶をAIが取り込もうとしている。欧州以外からこの記事を読んでいる人にとって、これはすでに現実のこととなっている。メタが発表した日程は欧州のユーザーにのみ適用される。メタの広報担当マシュー・ポラードによると、米国のFacebookおよびInstagramユーザーの投稿は2023年からメタのAIモデルの訓練に使われている。

各ソーシャルメディアのデータ利用方針は

ユーザーのオンラインでの活動の歴史をAIの“餌”にしている企業はメタだけではない。『WIRED』の記者は先日、グーグルのAI検索機能が彼の記事を盗用していることを発見した。しかし、未来のチャットボットに使われている個人的な記録がどれかを特定することは簡単ではなかった。長年使っていたサイトが現在どうなっているか調べることが難しかったのである。

初期のソーシャルネットワークであるMyspaceは2016年にTime Inc.が買収し、その2年後にはMeredith Corporationという会社が買収した。MeredithにMyspaceの古いアカウントについて問い合わせたところ、Myspaceはその後、広告会社のViant Technologyに分社化されたとの返答があった。そこでウェブサイトに記載されているViant Technologyの連絡先にメールを送ってみたが、アドレスが「見つからない」とのメッセージが返ってきたのである。

事業を継続している会社から、古いアカウントに関する回答を得ることはこれより簡単だった。WordPressを所有しているAutomattic傘下のブログプラットフォームTumblrは、わたしがオプトアウトしない限り、10代のころにした公開投稿は「AIモデルを訓練するパートナーを含む小規模なコンテンツおよび研究パートナーのネットワーク」と共有されると2月に発表している。何年も使用したYahooMailは、古いメールのサンプルを「匿名化」し「集計」した上で、メッセージの要約などをするAIモデルによって「利用」されると回答した。

マイクロソフト傘下のLinkedInも、公開投稿はAIの訓練に使用されているが、投稿に含まれる「個人的な」詳細の一部は除外されると、同社の広報担当者は説明している。ただし、その個人的な詳細が何であるかについての説明はなかった。

LinkedIn以外の企業は、仕事で作成したメッセージや文書をアルゴリズムの訓練に利用しない方針であることが多いようだ。法人向けメッセージサービスのSlackは、顧客のメッセージをAIの訓練に使用しているという報道を否定している。マイクロソフトもWordやExcel、PowerPoint、Outlook(旧Hotmail)、Teamsなど一連の職場向けサービスで作成されたコンテンツを基盤モデルの訓練に使用することはないと説明している。グーグルも、有料版と無料版とともにGmailなどの仕事用ツールのデータは利用しないとしている。ただし、YouTubeの動画に基づいてモデルを訓練する場合はあるということだった。

過去の記録は、未来を支配する存在のものに

メタが異例というわけではない。しかし、FacebookやInstagramのコンテンツのAI利用は、これらのサービスが非常に多くの人が非常に個人的な情報の記録に使っていることから注目を集めている。欧州に住んでいるわたしのFacebookとInstagramの投稿は、これまでメタのAIの訓練には使われなかった。投稿をAIの訓練に使う計画の発表は、メタと欧州のプライバシー規制当局の間で新たな論争を引き起こした。これに伴い、メタは英国のユーザーを含む欧州のユーザーの投稿をモデルの訓練に使用する計画の中断を余儀なくされたのである。

同社のAIが各地域の言語や文化を理解する上で欧州ユーザーのデータが必要だとメタが嘆くなか、オーストリアのデジタルライツ擁護団体「NOYB」のプライバシー活動家たちは、メタの計画の中断を暫定的な勝利であると祝った。NOYBはメタにとって以前から頭痛のタネとなっていたが、同団体はメタが欧州のユーザーに自身の投稿が訓練データに使われることからオプトアウトできる明確な方法を提供しなかったとして、すでに11カ国で苦情を申し立てた(メタはこの主張を否定し、ユーザーはフォームからオプトアウトできるとしている)。「AIの活用に反対しているわけではありません」とNOYBの広報担当を務めるミッキー・マナカスは『WIRED』に語る。「法律に準拠する方法で活用する必要がある、というだけのことです」

メタがどれくらいの期間、計画を中断するかは不明だ。また、テック企業が個人的な情報をどう扱うかについての大体の傾向は明らかだ。わたしたちのデジタル上の痕跡や記憶を訓練データに使おうとしているのだ。タイムカプセルを準備する時間はまだ残されていると思っているなら、それは間違いである。あなたの過去の記録は、すでに未来を支配する存在によって咀嚼されているのだ。

(Originally published on wired.com, translated by Nozomi Okuma, edited by Mamiko Nakano)

※『WIRED』による人工知能(AI)の関連記事はこちらメタ・プラットフォームズの関連記事はこちら


Related Articles
Image of a student writing at a desk and another student hovering over behind him, copying his work
検索結果の概要をAIが生成して表示するGoogle 検索の「AI Overviews」で、検索ワードに対して生成された概要の文章に『WIRED』の記事が“盗用”されていた。いったいどういうことなのか?
Shadow of a person operating a smartphone
一部のアプリでは、あなたのコンテンツが生成AIの学習に使われないように設定することができる。ChatGPTやグーグルのGeminiなどから(少なくとも多少は)主導権を取り戻す方法を紹介しよう。
Microsoft Copilot AI app icon
OpenAIのChatGPTやマイクロソフトのCopilotのような生成AIツールは、日々の仕事に欠かせないものとして定着しつつある。しかし、プライバシーやセキュリティへの配慮から、留意すべき点があることも事実だ。

雑誌『WIRED』日本版 VOL.53
「Spatial × Computing」

実空間とデジタル情報をシームレスに統合することで、情報をインタラクティブに制御できる「体験空間」を生み出す技術。または、あらゆるクリエイティビティに2次元(2D)から3次元(3D)へのパラダイムシフトを要請するトリガー。あるいは、ヒトと空間の間に“コンピューター”が介在することによって拡がる、すべての可能性──。それが『WIRED』日本版が考える「空間コンピューティング」の“フレーム”。情報や体験が「スクリーン(2D)」から「空間(3D)」へと拡がることで(つまり「新しいメディアの発生」によって)、個人や社会は、今後、いかなる変容と向き合うことになるのか。その可能性を、総力を挙げて探る!詳細はこちら