SZ MEMBERSHIP

生成AIの生成性(Generativity) :徳井直生の『続・創るためのAI』

変化の速いAI技術の波に乗り、翻弄され、ときに抗いながら、AIとわたしたちの関係の望むべき未来像を考察していく、アーティスト・徳井直生による新連載。第1回は、現在のAI技術が矮小化されている原因や、生成という言葉/概念がもっていた豊穣な可能性をひも解いていく。
生成AIの生成性(Generativity) :徳井直生の『続・創るためのAI』
IMAGE BY NAOKI ISE, RYOSUKE NAKAJIMA@QOSMO

“Generative(ジェネラティブ)”、「生成的」という言葉をここまで頻繁に聞くようになるとは……。昨年末、何気なくつけたテレビニュースのキャスターやコメンテーター、さらには総理大臣の口から「生成AI」という言葉を聞いて大いに驚いたことが、はるか昔のことのように感じられます。

Generativeとはラテン語の”generatus(生む、生まれ出る)”に由来する言葉で、元来は生き物が生まれ、成長、繁殖する過程を指します。わたしがこの言葉を意識するようになったのは00年前後のことです。当時、最新の電子音楽に夢中になっていたわたしは、あたかもコンピューターから「生まれ出る」ように感じられる、アーティスト自身さえも予期できなかったであろう複雑なリズムや音色に魅せられていました。その後、博士課程に進んだわたしは、新しいアイデアや表現を生み出すために、人とコンピューターのインタラクション、つき合い方はどうあるべきなのかという問いと、まさにこの「生成的」という概念を軸に研究を進めることに決めました。そして、”Generative Human-Computer Interaction”と題した博士論文を書き上げたのは、2004年のことでした。

以来、この生成的という単語は、わたしのなかで常に特別な意味をもってきました。一方で、23年7月に新しく設立した会社を、生成AIの会社とは呼びたくないと思っている自分がいるのはなぜなのか? 本稿では、この「ジェネラティブ/生成的」という言葉に焦点をあて、23年8月現在の人工知能(AI)のあり方について考察を試みることとします。

00年前後からAI技術と音楽などのメディア表現にかかわってきたわたしは、21年1月末に『創るためのAI — 機械と創造性のはてしない物語』を上梓しました。自分がこれまでAIを用いて取り組んできた音楽やメディアアートの領域での活動などを題材に、AI技術が人の創作活動にどういった影響を与えうるのか、AIによって可能になる新しい創造性のかたちなどについて考察した一冊です。

この本を書き終えた時点で、AI技術の進歩が加速するであろうことは、容易に予想がつきました。それでも、本が出版された21年以降の進歩のスピードは、わたしの(そして世界中のAI研究者の)予想をはるかに凌ぐものだったと言えるでしょう。

22年の4月、OpenAIがそれまでのテキスト入力から画像を生成するモデルをアップデートした「DALL-E 2」を公開し、「Midjourney」や「Stable Diffusion」がそれに続きます。生成される画像の質の高さだけでなく、入力するテキスト(プロンプト)によって、多種多様な画像が生成される、その柔軟性が話題を呼びました。望み通りの画像を生成するために、プロンプトに特定のマジックワードを追加するなどの工夫を指す、「プロンプト・エンジニアリング」という言葉が生まれ、プロンプト・エンジニアが21世紀のクリエイター像、新しい職種として脚光を浴び始めたのもこのころです。

AIが創造性をもちうるか、人類の創造性に影響を与えるかどうかという議論自体は陳腐化し、クリエイターの仕事や具体的な活用方法、経済に与える実質的な影響に議論の焦点は移っていきました。

この間の技術の進展を象徴するもうひとつのAIモデルは、なんといっても会話型AIの基盤となるLLM(大規模言語モデル)でしょう。特に22年11月にOpenAIが公開した「ChatGPT」に関しては、社会現象ともいえる状況が現在進行形で続いています。ChatGPTで仕事のあり方が変わるといった話や、学校教育におけるChatGPTの取り扱いなどをめぐる議論が日々続いていますが、これらについて詳しく触れることは、別の機会に譲ることとします。

「生成AI」という言葉が、ニュースなどを通してお茶の間でも聞かれるようになったのも、ChatGPTが公開されたころからでしょうか。「Google Trends」によると、「生成的」という言葉の検索数は22年12月前後から少しずつ増え、現在では当時の10倍近い検索数にのぼっています。22年の年始、自社のプレスリリースのなかで音楽生成という言葉を使った際、「『生成』はとっつきにくいから使わないで」とPR担当者から諭されたことを思い返すと、まさに隔世の感があります。

生成AI以前の「ジェネラティブ」

テクノロジーと人の知的な活動に関する文脈で、「生成的」という言葉が使われるのは、生成AIが初めてではありません。例えば、ジェネラティブ・アート。 アーティストが定めたある手続き(言語化されたルール、あるいはコンピューターのプログラム)に基づいて、ある程度の自律性をもって新しい作品が生み出される、そうした創作のあり方を指す言葉です。必ずしもコンピューターが必要なわけではありませんが、プログラミングを用いて美しいイメージを生み出す表現行為がその代表的な例といえるでしょう。

また、ブライアン・イーノがルールに基づいて常に生成され、変化し続ける新しい音楽のあり方として、ジェネラティブ・ミュージックの考え方を提唱したことも知られています。同様に、ある制約下でルールに基づいてパラメーターを変化させることで、多様なフォルムを生み出すジェネラティブ・デザインの考え方も、建築やプロダクトデザインの世界ではお馴染みです。

関連記事:ブライアン・イーノ、気候変動危機と“ディープフェイクの鳥”について語る

ここで特に注意すべきなのが、これらの営みの根源にある関心や目的が、アウトプットを生み出すプロセスを自動化することではなかったという点です。むしろ、人の直接的なコントロールをある程度手放し、自らが定めたアルゴリズムやシステムに委ねることで、一貫性を保ちつつも、多様で、ときに驚きのあるアウトプットを得られる点こそが、その中心的な目的でした。

一見すると人任せで無責任な姿勢とも受け取れますが、自分が定めたルールにプロセスの一部を移譲するという考え方自体が、逆説的に、自分の創作のプロセスや創造性を方向づける力を自らの手に取り戻す試みだったというのが、その実践者の言葉です (ゴラン・レヴィンほか『Generative Design:Beyond Photoshop』)。その背景には、創作のプロセスがデジタル化されたことで、特定の企業が提供するソフトウェアツールに、表現の幅まで規定されているという危機意識、さらにはルールを定めるつくり手自身の創造性の限界をも超えて、未知のアイデアに到達することを目指そうとする強い意志があります(ここでの「ルール」をAIに置き換えると、わたしが『創るためのAI』で主張した内容と重なってきます)。

こうした過去の生成的なテクノロジーの文脈における「生成」は、既知の何かの置き換えではなく、冒頭で触れた「生む、生まれ出る」という言葉の原義が含む、ある種の予測不可能性を甘受しつつ、未知の何かをもたらそうとする姿勢を反映していました。子どもはその親のDNAを受け継ぎつつも親と同一ではなく、親とは異なる側面、親がコントロールできない側面を併せもっているという当たり前の事実とも通じています(だからこそ子育ては大変であると同時に面白いのでしょう)。

翻って、現在の生成AIのあり方における「生成」という言葉は、自動化、オートメーションと同義のように扱われています。例えば、ChatGPTを生成AIと呼ぶ場合、人が存在しないにもかかわらず、そこに人がいるかのように「会話」できるシステムであることに、画像生成AIであれば、人の手を借りずに、あたかも人が描いた/撮影したかのような画像を得られるという点が注目されます。実際に、データ解析などを可能にするChatGPTの追加機能「Code Interpreter」が先日発表された途端、面倒なプログラミングの作業をいかに簡単に解決できたかというツイートで、わたしのタイムラインは埋め尽くされました。

端的に言うと、現在の生成AIは、自然言語(わたしたちが日常的に使う言語)というインタフェースでシュガーコーティングしたオートメーション技術です。ChatGPT以降の流れを追っているかたには、何を当たり前のことと言われてしまいそうですが、以前から生成的なシステムと向き合ってきた身として、そこには強い違和感があります。ChatGPTブームとは裏腹に、画像生成や音楽生成AIに対するクリエイターからの反応に大きな温度差があるのは、こうした自動化の流れに対する直感的な忌避感があるからだと見てとることもできるでしょう。

わたしが自分の音楽AIの新会社を生成AIの会社と呼びたくないのも同じ理由です。わたしを含む多くのクリエイターやアーティストは、創作のプロセスをAIによって自動化したいわけではないのです(一部の退屈な作業を除いては)。

このように「生成」のニュアンスが変化した原因は、生成のルールを定める主体が、アーティストやクリエイターなど、システムを利用する側の手を離れ、AIモデルやAIシステムを提供する企業や研究者に移ったためと考えられます。経済と技術の論理が先行すると、オートメーションに焦点があたるのは自明な流れでしょう。

そう考えると、DALL-E 2などのテキストから画像を生成するAIモデルが、過去の創作物をまるっと模倣するようなかたちで進化を遂げたのも当然とも言えます。例えば、著名なアーティストの名前などを学習データから削除するなどしていれば、スタイルの盗用といった問題は起きなかったはずですが、そのようには開発されていません。アーティストの創作行為を助ける、権利を保護するといった視点よりも、〇〇風のそれらしい画像が自動で生成されるという技術のもつ話題性やそれがもたらす経済的なメリットを重視する姿勢がうかがえます。

OpenAIの最高経営責任者(CEO)であるサム・アルトマンは、マンハッタン計画を主導したオッペンハイマーの「テクノロジーが生まれるのは、それが可能だからだ」という言葉を引いて、AI技術の発展は必然で不可避であるとの立場を示しています。このあたりにも技術ドリブン、技術の論理で開発が進む現状を顕著に見てとることができるでしょう。

折しも、現在ハリウッドではAIによるクローニングなどに反対する俳優たちのストライキが進行中ですし、学習データとして作品を利用された作家やイラストレーターが生成AI技術を提供する企業を訴えるという事態も多発しています(そのハリウッドで現在最も話題を集めている作品がクリストファー・ノーラン監督の『オッペンハイマー』なのは不思議な巡り合わせです)。テキストから音楽を生成するメタの研究者たちの最新の論文でも、「生成AIはアーティストに対して不公平な競争を強いることになりうる」とあります。技術革新によって仕事を失う人が出てくるのは残念だが「不可避」だ、という声も聞こえてきますが、本当にそうでしょうか。

ChatGPT等の技術的な偉業にケチをつける意図は毛頭ありませんし、実際にわたしも日々の仕事に活用しています(本稿のキービジュアルの制作にも、Stable Diffusionを利用しました)。自動化による生産性の向上が創造性の拡張につながるじゃないかという意見ももっともです。ただ、それ以前の生成的なシステムが目指した創造性の拡張とは質的な違いがあります。米メリーランド大学の研究者らの研究では、最新の画像生成AIが学習データを意図せず複製する傾向にあることが示されていますが、学習データに内在するパターン、「それらしさ」を学習し模倣するAIモデルを用いた自動化は、既存の表現やアイデアの再生産につながりやすいのです(次稿以降に詳しく触れることにします)。

まとめると、自動化・省力化のための技術という現在の生成AIの隠れた性質が、生成という言葉の甘い響きに覆い隠され、それがもたらす影響が充分に議論されないまま突き進もうとする現状に危惧を覚えると同時に、もっと別のあり方がありえたのではないかを問うべきだというのがここでの議論の趣旨です。言い換えるならば、オートメーションの論理によってAI技術が矮小化されているなか、生成という言葉や概念が本来もっていた豊穣な可能性や創造性を方向づける力を自らの手に取り戻すために、わたしたちは今後どう行動すべきかという問いです。

すでにChatGPTやStable Diffusionのような新しいテクノロジーが世の中に解き放たれてしまった以上、その存在を否定したり、欠点だけをあげつらったりしても意味がありません。すでに多くのクリエイターや作家が、これらのテクノロジーを創作活動に活用し、話題を(ときに物議を)呼んでいますが、こうした流れはむしろ、大いに推奨すべきだと考えます。

バウハウスの教授で、シカゴのニュー・バウハウスの校長も務めたL. モホリ=ナギは、「芸術は必然性の寒暖計である」と言います(『ザ ニュー ヴィジョン』)。技術的に可能なものが必然的に生まれてくるという技術主導の考え方に対して、創作や表現、ものをつくったり鑑賞したりする行為を通して、その必然性の真偽を精査していく姿勢の重要性を述べた言葉です。ここでの議論に当てはめると、生成AIを人の創作に活用することこそが、創作活動という枠を超えて、この技術の社会への導入が本当に必然的だったのかを吟味する上での試金石になるというわけです。

わたしたちは、新しく登場する破壊的なテクノロジーの裏側にも生身の人間がいて、特定の目的意識をもって行動していることを忘れ、そのテクノロジーを決定論的に受け入れる傾向があります。だからこそ、現在のChatGPTやDALL-E 2が、生成AIの唯一のかたちではないことに改めて留意すべきでしょう。

現状ではオートメーション技術と化している生成AIを活用しつつも、AI技術が本来もちうる生成的(ジェネラティブ)な特性、生成性(ジェネラティビティ)とは何か、それが人間や社会、創作活動にとってどんな意味をもつのかを改めて問うことで、(一部の企業ではなく)わたしたちみなにとって望ましいAIのあり方を、本連載を通して探っていきます。


※なお、本連載の執筆にあたり、生成AIのアウトプットをそのまま使うことはしませんが、よりよい言い回しや類義語などを探すためや、キービジュアルの素材を得るために利用する可能性があることをあらかじめ明記しておきます。

徳井直生|NAO TOKUI
アーティスト/研究者。AIを用いた人間の創造性の拡張を研究と作品制作の両面から模索。アーティスト、デザイナー、AI研究者/エンジニアなどから構成されるコレクティブ、Qosmo(コズモ)を率いて作品制作や技術開発に取り組むほか、23年7月設立のNeutone(ニュートーン)では、AIを用いた新しい「楽器」の開発を手がける。2021年1月には、これまでの活動をまとめた『創るためのAI — 機械と創造性のはてしない物語』(BNN)を出版し、2021年度の大川出版賞を受賞した。慶應義塾大学SFC特別招聘准教授。博士(工学)。 https://naotokui.net/

(Edit by Erina Anscomb)


未来を実装する「実験区」へようこそ!
会員限定コンテンツの無料トライアルはこちら

WIRED SZ MEMBERSHIPは、厳選されたデジタル記事やイベント、編集長のレターや雑誌のデジタル版の提供を通じて、メンバーのみなさまに「インスピレーション」と「知的好奇心」を促す有料サブスクリプションサービスです。