智東西9月13日消息,OpenAI新模型無預警上新:o1系列,可以進行通用復雜推理,每次回答要花費更長時間思考。
在解決博士水平的物理問題時,GPT-4o還是“不及格”59.5分,o1一躍來到“優秀檔”,直接干到92.8分!
沒錯,傳說中的草莓終于來與大家見面了!
CEO奧特曼稱它是一種新范式的開始:可以進行通用復雜推理的人工智能。從今天開始,o1-preview在ChatGPT中會向所有Plus和Team用戶推出,并且在API中向tier 5開發者推出。
同時,OpenAI還發布了o1-mini——一種經濟高效的推理模型,非常擅長STEM,尤其是數學和編碼。
具體來說,o1系列是OpenAI首個經過強化學習訓練的模型,在輸出回答之前,會在產生一個很長的思維鏈,以此增強模型的能力。
換句話說,內部思維鏈越長,o1思考得越久,模型在推理任務上的表現就越好。
o1有多強呢?CEO奧特曼直給了答案:在剛剛結束的2024 IOI信息學奧賽題目中,o1的微調版本在每題嘗試50次條件下取得了213分,屬于人類選手中前49%的成績。如果允許它每道題嘗試10000次,就能獲得362.14分,高于金牌選手門檻,可獲得金牌。另外它還在競爭性編程問題 (Codeforces) 中排名前89%,在美國數學奧林匹克 (AIME) 預選賽題目中躋身美國前500名學生之列。
來源:第一電動網
作者:王宇寧
本文地址:http://www.155ck.com/news/jishu/245976
文中圖片源自互聯網,如有侵權請聯系admin#d1ev.com(#替換成@)刪除。