アップルには、これまで何度も出遅れたにもかかわらず成功してきた歴史がある。iPhone、Apple Watch、AirPodsなど、例を挙げればきりがない。
そしていま、 アップルは同じやり方が生成AIにも通用することを示したいと考えている。アップルは自らが提供するほぼすべてのデバイスとアプリケーションに生成AI技術を組み込む「Apple Intelligence」を発表したのだ。
アップルは6月10日(米国時間)に開催した開発者向けカンファレンス「WWDC 2024」の基調講演で、待望のAI戦略を発表した。「わたしたちはこの瞬間を長らく目指してきました」と、登壇した最高経営責任者(CEO)のティム・クックは語っている。「わたしたちは生成モデルの力に大いに期待しています」
確かにそうかもしれない。しかしアップルは、生成AIとは慎重に扱うべきものであることも理解しているようだ。この技術はデータを大量に消費し、エラーを起こしやすいことで悪名高いからである。
こうしたなかアップルは、Apple Intelligenceによってさまざまなアプリに新しい機能が搭載されることも示した。例えば、さらに高性能になった音声アシスタント「Siri」、複雑なメールの返信を生成する「メール」、ウェブの情報を要約する「Safari」などである。
誤った結果を生成する“幻覚(ハルシネーション)”や潜在的に不快なコンテンツを生成する問題など、生成AIの典型的な弱点を最小限に抑える必要もある。それでいて、ユーザーのプライバシーを守りながら進めていくことが重要だろう。
機密情報を守ることの意味
それにApple Intelligenceに関しても、個人のユーザー情報を利用することには変わりない。例えば、そのユーザーの興味や習慣、スケジュールなどをより深く理解することで、AIモデルをより有用なものにするためだ。しかし、こうした情報の取得にはアップルが避けようとしているプライバシーの問題とのトレードオフが発生する。
「AIが本当に役立つとはどういうことかを考えると、 ユーザーを中心としたものである必要があります」と、アップルのソフトウェア開発担当シニアバイスプレジデントのクレイグ・フェデリギは基調講演後のブリーフィングで語っている。「そのためにはプライバシーについて非常に深く考える必要があります」
「ChatGPT」を含む多くの生成AIはクラウド上で動作するが、Apple Intelligenceは主にデバイス上でローカルに動作するAIモデルを使用するとアップルは説明している。
またアップルは、クラウド上のより強力なAIモデルにクエリを渡す必要があるかどうか判断する方法のほか、「Private Cloud Compute」と呼ばれる技術も開発した。 Private Cloud Computeは、個人データがデバイス外に送信されたとしても安全を保つ仕組みだという。
アップルはPrivate Cloud Computeの概要を説明した公式ブログの投稿において、この技術はクエリで使用された情報がAIモデルやデバイス上のほかの場所に保持されないように設計されているほか、開発者やアップルが機密情報にアクセスできないようにすると説明している。また、このシステムはアップル独自チップを使う新しいサーバーのハードウェアを利用し、データをストレージの安全な領域に保管したえうで、データが盗み見されないようにエンドツーエンドの暗号化を施すという。
「このシステムは重要かつ難解な課題を解決すると考えています」と、フェデリギは言う。「クラウドコンピューティングは通常、プライバシーの保証という点で実質的にいくつかの妥協を伴います。たとえ企業が『あなたのデータで何かをするつもりはありません』と約束しても、ユーザーがそれを確認する方法はありませんから」
そのデータを非公開にすることでApple Intelligenceの機能が損なわれることがあってはならないと、機械学習とAI戦略担当シニアバイスプレジデントのジョン・ジャナンドレアは基調講演後のブリーフィングで語っている。アップルは「AXLearn」と呼ばれるフレームワークを使って独自のAIモデルを開発し、2023年にオープンソース化したことを別のブログ投稿で明らかにしている。アップルによると、レイテンシー(遅延)を減らしてAIモデルの効率を高めるために、いくつかの技術を採用したという。
ジャナンドレアによると、アップルはキュレーションされたデータを用いることでAIモデルの“幻覚”を減らすことに重点を置いているという。「これらのモデルを非常に注意深く訓練することに、わたしたちは多大なエネルギーを注いできました」と、ジャナンドレアは語る。「ですから、この技術を責任をもって利用していることには自信があります」
ChatGPTとの間に“一定の距離”
いわば自転車に補助輪をつけるような、「まずは安全に注意深く」ともいうべきアップルのAIへのアプローチは、アップルが提供するすべてのものに適用される。アップルが約束した通りに機能するなら、Apple Intelligenceは話を捏造したり不適切な内容を提示したりしづらくなるはずだ。
アップルは公式ブログへの投稿において、Apple IntelligenceのほうがOpenAIやマイクロソフト、グーグルといった競合企業のオンデバイスのモデルより有益で害が少ないことが多いと、Apple Intelligenceのテストに携わったテスターたちが感じていたと主張している。「ティーンエージャーを連れてきて、飛行機を操縦するように言っているわけではないのです」と、フェデリギは語っている。
熱望されていたアップルとOpenAIとの提携だが、ChatGPTとの間には“一定の距離”が置かれることになる。「書き直し」と呼ばれる新しい文書作成アシスタントとSiriは、一部の難しいクエリに対してのみChatGPTを利用する。それもユーザーの許可を得た上での話だ。
「ユーザーがChatGPTに移ろうとするときは、その前にきちんと確認します」と、フェデリギは言う。「アップルのプライバシー空間を離れて別のモデルを使用する際には、プライバシーの観点から常に状況がユーザーのコントロール下にあり完全な透明性が担保されるのです」
アップルとOpenAIとの提携は、まずありえない話のようにも見えたかもしれない。スタートアップであるOpenAIはChatGPTが優秀であるがゆえに急速に支持を広げたが、法廷闘争や経営をめぐる騒動、そして強力ながら信頼性に欠ける技術を絶え間なくプロモーションしてきたことで物議を醸し続けてきたからだ。また、フェデリギはアップルが将来的にグーグルの「Gemini」の上位モデルを組み込む可能性があるとも語っているが、それ以上の情報は出していない。
アップルは“約束”を守れるか
これまでのアップルは生成AIの開発が競合より遅いと嘲笑され、OpenAIのChatGPTやグーグルのGeminiほど強力なモデルはまだ何も発表していない。それでもアップルはAIに関する優れた研究をいくつか発表しており、例えばデバイス上で動作する独自のマルチモーダルなAIモデルの詳細に関するものなどが挙げられる。
アップルは2011年にSiriを初めて発表した後、一時はパーソナルコンピューティングにおけるAIの活用で一歩リードしたかのように見えた。音声アシスタントのSiriでは発話と音声認識の信頼性を高めるべく当時のAIのブレイクスルーとなる最新技術を活用し、利用範囲が限られていた音声入力をiPhone上の便利な動作へと転換しようと試みたのである。
それからほどなくして、アマゾンやグーグル、マイクロソフトといった競合がそれぞれ独自の音声アシスタントで後に続いた。ところが、複雑で曖昧な言語から意味を拾うことの困難さによって、それらの有用性は根本的に限られたものになったのだ。
ChatGPTなどのプログラムを動作させる大規模言語モデル(LLM)は、言語を扱うマシンの能力を著しく進歩させる可能性を秘めている。このためアップルをはじめとする各社は、AIを用いて自社の音声アシスタントを進化させることをさまざまな方法で目指している。
Siriなどの音声アシスタントがLLMによって複雑なコマンドをより深く理解し、比較的高度な会話を交わす能力が高まるかもしれない。もしくは、音声アシスタントがLLMによって状況に応じて最適なコードを書くことで、AIがソフトウェアを扱えるようにもなるかもしれない。
「情報を個人の元に安全に保ちながらコンテキスト・アウェア[編註:情報に基づいて最適な行動をとること]な特性をもつAIを実現するという約束に、アップルは応えたのです」と、アップルに2010年に買収されたSiriの開発元の共同創業者でAI起業家のトム・グルーバーは語る。そうした機能がアップルのデモで強調されていた様子を見てうれしく感じたと、グルーバーは言う。
また一部の観測筋は、アップルの発表は多数の失敗のリスクを負わずに競合に追いつこうとする試みを象徴しているのだと指摘している。「アップルが得意なことは、すばらしい新機能を提示して物事の新しいやり方を世の中に見せることです」と、ハーバード・ビジネススクール教授のデイヴィッド・ヨフィーは語る。「しかし、発表内容にはそうした感じのものが何もありませんでした。とはいえ、競合に追いつこうとしているところですから、驚きではありません」
アップルがデータのプライバシーとセキュリティを強調したことは、ChatGPTなどとのデータ共有に関する人々の懸念を考えれば驚きではないと、ヨフィーは指摘する。「生成AIはiPhoneを補完する存在です」と、ヨフィーは語る。「アップルがAndroidの世界から遅れをとっていないことを示すことが重要だと思います。そして今回、それを示せたのではないでしょうか」
生成AIは、いまもまだ定義からして予測不能なものだ。Apple Intelligenceはテスト段階ではうまく動作したかもしれないが、ひとたび多くのiOSユーザーやmacOSユーザーに放たれてしまえば、一つひとつのアウトプットを把握する方法はない。
アップルがWWDCで語った約束を守るには、これまで誰もAIには搭載できなかった能力をAIに覚え込ませなければならない。つまり、Apple Intelligenceが問題なく動作するようにしなければならない、ということなのである。
(Originally published on wired.com, edited by Daisuke Takimoto)
※『WIRED』によるアップルの関連記事はこちら。人工知能(AI)の関連記事はこちら。
雑誌『WIRED』日本版 VOL.53
「Spatial × Computing」6月25日発売!
実空間とデジタル情報をシームレスに統合することで、情報をインタラクティブに制御できる「体験空間」を生み出す技術。または、あらゆるクリエイティビティに2次元(2D)から3次元(3D)へのパラダイムシフトを要請するトリガー。あるいは、ヒトと空間の間に“コンピューター”が介在することによって拡がる、すべての可能性──。それが『WIRED』日本版が考える「空間コンピューティング」の“フレーム”。情報や体験が「スクリーン(2D)」から「空間(3D)」へと拡がることで(つまり「新しいメディアの発生」によって)、個人や社会は、今後、いかなる変容と向き合うことになるのか。その可能性を、総力を挙げて探る! 予約はこちらから。