[情報] OpenAI提出GPT-4o模型 超級語音助理
https://openai.com/index/hello-gpt-4o/
GPT-4o是邁向更自然的人機互動的一步——它接受文字、音訊和圖像的任意組合作為輸入
,並產生文字、音訊和圖像的任意組合輸出。 它可以在短至 232 毫秒的時間內反應音訊輸入,平均為 320 毫秒,這與人類在對話中的反應時間相似。它在英語文字和程式碼上的表現與 GPT-4 Turbo 的效能相匹配,在非英語文字上的效能顯著提高,同時 API 的速度也更快,成本降低了 50%。 與現有模型相比,GPT-4o 在視覺和音訊理解方面尤其出色。
從影片中的範例可以發現:GPT-4o已經可以不用停頓地跟人類對話,你可以在它講話時中途打斷它,此外GPT-4o也更加情緒化-它可以理解你說話時的心情、有感情地跟你聊天、理解你話語中帶有諷刺意味。它可以即時翻譯而幾乎沒有延遲,也可以跟另一個AI互相對話。你可以叫它為你唱歌、隨意將鏡頭移到日常用品並詢問其西班牙文講法、將鏡頭移到紙本數學題並請它教你解題、將手機鏡頭環顧四周並問它你現在的地點、參加公司視訊會議。
發布會上OpenAI特別感謝黃仁勳提供大量GPU。GPT-4o將在未來數週內逐步整合到各項產品中,所有使用者都可免費使用,但付費訂閱戶可擁有免費使用者足足五倍的容量上限。
--
※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.253.145.59 (臺灣)
※ PTT 網址
推
這個猛
→
打工仔的賺錢飯碗要被AI一手端了
推
板上中國狂繼續吹中國電動車no 1 OpenAI不能變現
推
中斷插話比較像跟人對話
推
燒
34
[情報] 微軟將在9/26發布Windows 11 23H2最大的特點就是引入AI技術Copilot,同時也重新命名為Microsoft Copiliot和帶來 新的Logo。現在Insider通道下的copilot也換成新的Logo25
[閒聊] AI要畫得美又精準,得靠「提示工程師」!AI要畫得美又精準,得靠「提示工程師」!這項未來職業要具備哪些技能? AIGC 的特點是自動化生產、高效。隨著自然語言生成技術 NLG 和 AI 模型的成熟, AIGC 逐漸受到大家的關注,目前已經可以自動產生文字、圖片、音訊、影片,甚至 3D 模型和程式碼。然而,有玩過 AI 文字轉圖的人應該都知道,生成圖片的好看與否,有沒13
Re: [閒聊] AI終於進化到這步了嗎補完幾行應該還不算吧。 不過想知道有沒有會coding的AI? 別問,問就是有。 2年前OpenAI發表的GPT-3。它是一個自迴歸語言模型。 應用了深度學習,自然語言處理等等。11
Re: [標的] 3443創意 跳水台空Google 辛辛苦苦追趕 ChatGPT 好幾個月,還沒拿出什麼具體對策,OpenAI 今日又火上 加油發表 GPT-4 模組,在這條人工智慧賽道別說車尾燈,Google 現在要擔心的是被 OpenAI 套圈了。但究竟 GPT-4 有什麼威能,和現在聊天好好玩的 ChatGPT 有什麼差別 ?9
[iAPP] AI 智慧鍵盤 - 新增買斷方案(贈序號)我們在這個版本加入了「買斷」的版本 你可以申請自己的 OpenAI API Key,並在 app 內輸入 就可以永遠使用 AI 智慧鍵盤功能了! 可以參考本篇教學來申請 Key:9
[閒聊] 柯南變聲器算是實現了嗎阿栗博士的幾個黑科技道具之一 蝴蝶結變聲器 現在用AI可以很容易模擬出某人的聲線 只需 3 秒音訊,微軟新 AI 模型就能模仿某人聲音念稿 5 日微軟研究人員宣布推出 VALL-E 全新文字轉語音(Text-to-Speech)AI 人工智慧模型4
[問卦] ChatGPT有沒有辦法答對國中小數學題嗨,大家呷飽沒? ChatGPT是OpenAI開發的人工智慧聊天機器人程式 該程式使用基於GPT-3.5架構的大型語言模型並以強化學習訓練 目前仍以文字方式互動 而除了可以用人類自然對話方式來互動- 阿肥外商碼農阿肥啦!認真說,這幾年口說上字幕甚至翻譯,還有有字幕上語音這幾年都獲 得不錯的進展,包含openAI、Google、Amazon、Meta實驗室都有不錯的產出,而且這些都是 依靠當前所謂的多模態零樣本學習的大力進步,很多轉換錯誤或是機器音都減小很多,不 過偶爾還是會有出槌需要人工修正的部分。 所謂的多模態零樣本其實就是換一個思維過往很多工作需要大量標注工跟資料工程前處理來