快訊

    OpenAI推語音對話模型GPT-4o 可即時教數學還會調情

    2024-05-14 10:00 / 作者 李寧怡
    OpenAI。路透社
    美國人工智慧公司OpenAI週一(5/13)發表ChatGPT最新模型GPT-4o,不僅速度快於先前版本,且可與用戶即時進行語音對話,互動時還能在文字與圖像間切換。此外,GPT-4o還開放所有用戶免費使用,讓OpenAI在當前的生成式人工智慧模型競賽中維持領先地位。

    路透社報導,GPT-4o可在用戶說話後立刻回答,若用戶打斷GPT-4o時,它也會立即停止說話,這兩者都是人工智慧(AI)即時對話技術的重大突破。

    OpenAI執行長阿特曼(Sam Altman)在公司部落格貼文中說:「這就像電影裡演的那些AI技術……以前我和電腦說話從不覺得自然而然,現在就有這種感覺了。」



    根據OpenAI,GPT-4o中的「o」來自英文「omni」。這個字有「遍及一切」之意。

    英國廣播公司(BBC)則指出,GPT-4o可以讀出及討論圖像內容、翻譯語言、從表情判斷情緒。它還有記憶功能,可記起用戶之前輸入過的指令(prompts)。

    根據OpenAI的示範影片, GPT-4o語音版能為寫在紙上的數學算式提供解答方法,而非只是提供答案。它能分析程式碼、在義大利語和英語之間翻譯,還能從一名微笑男子的自拍照分析他的情緒。

    示範影片中的語音是使用美式英語的女聲,她會和用戶打招呼問候,甚至還會和用戶調笑。當示範者向GPT-4o表示自己心情很好,因為「妳表現得很有用,很厲害」,GPT-4o的回答是:「別鬧了,你害我臉紅了!」

    在OpenAI發表GPT-4o之後,阿特曼在X平台發文,只寫了一個字「她」(her),被認為是指電影《雲端情人》(her)。電影中,男主角與AI語音助理墜入情網,配音者是女星史嘉蕾喬韓森(Scarlett Johansson)。



    OpenAI技術長穆拉提(Mira Murati)表示,GPT-4o可以全面免費,是因為它的成本效益高於先前開發的AI模型。至於付費者則可獲得較免費用戶更大的容量。

    OpenAI表示,GPT-4o未來幾週就會出現在ChatGPT模型中。
    李寧怡 收藏文章

    本網站使用Cookie以便為您提供更優質的使用體驗,若您點擊下方“同意”或繼續瀏覽本網站,即表示您同意我們的Cookie政策,欲瞭解更多資訊請見