美國人工智慧公司OpenAI周一(13日)進行發表會,推出自家旗艦AI模型升級的新版本「GPT-4o」,反應速度更上一層樓,還有更新的語音助理功能,甚至在發表會中當場即興唱歌。
OpenAI春季新品發表會公佈最新模型GPT-4o的核心變化,OpenAI技術長穆拉蒂(Mira Murati)表示,最新的模型能看文本、圖片,還可以拍環境給它看。甚至能讀懂情緒,透過語音與人類即時互動。
值得注意的是,新的語音功能,還能在交談時打斷它,這點與先前所有的語音助理截然不同,大大超越了Siri等功能。
OpenAI也在YouTube頻道展示GPT-4o模型語音助理與人類的各種聊天互動,語音助理被提到今天的場合是要來介紹她時,女聲語音助理還使用帶有情緒反應的用詞羞笑回應說「我?是要介紹我?」
這次發表會震撼了所有觀眾,OpenAI表示,GPT-4o模型對語音輸入的反應最快可達0.232秒,幾乎和人們彼此對談的語速差不多。
除了戲劇化的聲音轉換,發表會甚至還有語音助理唱歌的橋段,新版本還懂50種語言、能言善道,反應機敏,且開放全部使用者免費使用,若付費可享有更多功能。