“宇宙船”と呼ばれ、まるで別世界のようでもあるアップル本社の建物は、アップルにとって極めて重要な製品の大胆かつ未来的な全面刷新にふさわしい舞台であるように感じられた。iPhoneの売り上げが低迷し、ライバル各社が「ChatGPT」のようなツールのおかげで勢いを得るなか、アップルは開発者向けカンファレンス「WWDC 2024」で生成AIに関する独自の展望を打ち出したのである。
最近のアップルは、生成AIの波に乗り遅れていると思われてきた。一部の専門家たちはWWDCでアップルが発表した内容には納得せず、この発表を実に退屈なものであると断じたのだ。しかし、アップルが「Apple Intelligence」と呼ぶものを既存のアプリやOSの機能に導入することに重点を置いていることから、生成AIはそれ自体が製品ではなく、あくまで機能であるという点が重要なポイントである。
ChatGPTが示した見事な能力は一部のスタートアップを触発し、生成AIを応用した完全特化型の人工知能(AI)ハードウェアの開発に駆り立てた。例えば、「rabbit r1」やHumaneの「AI Pin」といったデバイスである。
残念ながら、こうしたガジェットは実際に使うには期待外れで、イライラさせられるものになっている。これに対してアップルの非常に多くの製品や異なるソフトウェアにまたがる生成AIの垂直統合は、はるかに妥当なAIの未来像に思える。
デバイス側で動作するがゆえの強み
アップルは独立したデバイスや体験よりも、生成AIによってアプリやOSの機能をわずかでも意味のある方法でいかに改善できるかに焦点を当てている。
確かにアーリーアダプターたちはChatGPTのような生成AIのプログラムに群がり、メールの下書きの修正や文書の要約、画像の生成を手伝ってもらおうとした。しかし、それはブラウザーの新しいウィンドウやアプリを開いたり、カット&ペーストをしたり、ときにはチャットボットの熱に浮かされたようなまとまりのない言葉を理解しようと努めたりする行為を伴うものだった。生成AIが真に有用なものになるには、人々がすでに使っているテクノロジーに対して、人々がより理解しやすく、信頼できるかたちで浸透していく必要があるだろう。
WWDCの基調講演の後、アップルは「Apple Intelligence」のデモを披露してくれた。「Apple Intelligence」とは、複数のアプリにわたって動作するAIを表す包括的な名称だ。その能力は生成AIの枠を出るほどのものではないが、とてもうまく組み込まれており、おそらくユーザーがより信頼できるようなかたちに機能を抑えている。
例えば「書き直し」という機能は、iOSやmacOSのユーザーが文の修正や要約をする際に役立つ。「Image Playground」は、整えられたイラストをスケッチや文章によるプロンプト(指示)に基づいて生成する。文章に基づいて新しい絵文字を生成AIで生み出す「Genmoji(ジェンモジ)」は、人々が絵文字をやり取りする頻度を考えれば、AIの導入事例としては驚くほどの人気になる可能性があるだろう。
さらにアップルは生成AIを用いることで、音声アシスタント「Siri」にとても必要とされていた改修を施した。生成AIは、言葉に間があったり訂正を含んだりする言葉をSiriが理解したり、より文脈に沿った対応をするために以前の会話を思い出したり、さらにSiriを有用なものにするためにデバイス内のアプリに保管されるデータを利用したりする。
アップルによると、Siriは開発者向けのフレームワーク「App Intents」を利用する。これはアプリを開いたり操ったりするような動作に使えるソフトウェアだ。例えば、「うちのネコがおもちゃを追いかけている写真を見せて」と指示された場合は、言語モデルが指示を解析し、「App Intents」経由で「写真」アプリにアクセスする。
アップルの生成AIは、主にデバイス内のローカル環境で動作する。だが、同時にアップルは、必要に応じてクエリを安全にクラウドに送る「Private Cloud Compute」という技術を開発した。
AIをデバイス上で動作させるということは、クラウドを用いた最新の会話型AIと比べて性能が低くなることを意味する。しかし、これは欠陥というよりも、むしろ強みになる可能性がある。Siriのようなプログラムが限界を超えて混乱に陥る可能性が低くなる、ということでもあるからだ。アップルは賢明なことに、最も難しい指示や問いかけについては、ユーザーの許可を得たうえでOpenAIのChatGPTに渡す仕組みを採用している。
「機能としてのAI」という歓迎すべき動き
投資家たちはアップルの発表を明らかに高く評価しているが、実際にどの程度うまく機能するかは、しばらく待たなければわからない。
これらの技術は年内にベータ版として展開される予定だが、その際にも対象機種は「iPhone 15 Pro」と「M」シリーズのチップを搭載するMacやiPadに限定される。このため古い機種を使い続ける人たちは、新しい機能をスムーズに体験できないかもしれない。
それに、「Genmoji」のような機能が“無作法”な使い方をされることも予想される。実際にメタ・プラットフォームズが生成AIを利用した「AIステッカー」機能を発表した際には、人々は重武装したマリオのキャラクターなどの好ましくない画像を生み出し始めた。
「製品としてのAI」ではなく「機能としてのAI」へのシフトは、ChatGPTをめぐる熱狂の後では歓迎すべき動きといえる。それは最近の他の発表にも見られるものだ。
グーグルとマイクロソフトは今年の開発者向けカンファレンスでAIにかなり力を入れていたが、より実用的な用途に人々の目を向けさせようともしている。例えば、「Gmail」やWindowsの「Copilot」に統合されたAIツールといったものだ。
生成AIブームの火付け役となり、ChatGPTという人々を最も魅了するAI製品を提供するOpenAIでさえ、最近はより自然で説得力のある、少し“あざとさ”も感じられるインターフェイスづくりに注力しているようだ。しかし、ありがたいことにアップルは、当面はSiriを過剰になれなれしくする代わりに、より便利なものにする目的で生成AIを使うことに注力する方針だという。
(Originally published on wired.com, edited by Daisuke Takimoto)
※『WIRED』によるアップルの関連記事はこちら。人工知能(AI)の関連記事はこちら。
雑誌『WIRED』日本版 VOL.53
「Spatial × Computing」6月25日発売!
実空間とデジタル情報をシームレスに統合することで、情報をインタラクティブに制御できる「体験空間」を生み出す技術。または、あらゆるクリエイティビティに2次元(2D)から3次元(3D)へのパラダイムシフトを要請するトリガー。あるいは、ヒトと空間の間に“コンピューター”が介在することによって拡がる、すべての可能性──。それが『WIRED』日本版が考える「空間コンピューティング」の“フレーム”。情報や体験が「スクリーン(2D)」から「空間(3D)」へと拡がることで(つまり「新しいメディアの発生」によって)、個人や社会は、今後、いかなる変容と向き合うことになるのか。その可能性を、総力を挙げて探る! 詳細はこちら。