91久久精品无码毛片国产高清

中證網
返回首頁

接近理科博士生水準!OpenAI放大招

證券時報網

  北京時間9月(yue)13日凌(ling)晨,OpenAI重磅發布(bu)全新(xin)AI大模型——o1模型。

  據(ju)OpenAI官網介紹,這一模(mo)(mo)型“旨在花更(geng)多時間(jian)思(si)考后再(zai)作出反應。它們可以推理復雜的(de)任(ren)務,解決比(bi)以前的(de)科學、編碼和(he)數(shu)學模(mo)(mo)型更(geng)難的(de)問題”。不過,今天在ChatGPT和(he)大模(mo)(mo)型API中新發布的(de)是該系(xi)列(lie)中的(de)第(di)一款模(mo)(mo)型,而且還(huan)只是預(yu)覽版——o1-preview(o1預(yu)覽版)。

  事實上,此前外界曾流(liu)傳(chuan)OpenAI正在(zai)研發(fa)新模型(xing)“草(cao)莓(mei)(mei)”和“獵(lie)戶(hu)座”,其中(zhong)“草(cao)莓(mei)(mei)”具有(you)更(geng)強(qiang)的(de)推(tui)理能力(li)、擅長(chang)解決復雜(za)的(de)數(shu)理邏輯(ji)問題,而“獵(lie)戶(hu)座”則將基于“草(cao)莓(mei)(mei)”模型(xing)的(de)能力(li),是“ChatGPT”的(de)超強(qiang)繼任模型(xing)。

  OpenAI首席執行官(guan)山姆·奧(ao)特曼(man)在其個人(ren)社交平(ping)臺表示,“雖(sui)然(ran)o1的表現仍(reng)然(ran)存在缺陷,不過你在第一次(ci)使用它的時候(hou)仍(reng)然(ran)會感到震撼。” 

  OpenAI今(jin)天發布的(de)(de)o1模型(xing)雖(sui)然名字上(shang)與此前(qian)泄(xie)露(lu)的(de)(de)“草莓”不同,但(dan)功能、推理、性能等(deng)方面與外(wai)界揣測的(de)(de)基本(ben)一致。據了(le)解,o1的(de)(de)推理模式的(de)(de)特別之處(chu)在于,在回答用戶問題之前(qian),o1會進入(ru)擬人化思考模式,將問題分解成更小的(de)(de)步(bu)驟,逐一解決,然后生成一個較(jiao)長的(de)(de)內(nei)部思維鏈(lian),這一推理模式也(ye)使得回答的(de)(de)內(nei)容更加(jia)準(zhun)確(que)。

  “在我(wo)們的(de)測試(shi)中(zhong),下(xia)一個模(mo)(mo)型(xing)(xing)(o1模(mo)(mo)型(xing)(xing))更新(xin)在物理(li)、化學(xue)和生物學(xue)的(de)具(ju)有挑戰性的(de)基準任務上的(de)表現與博士生相似。我(wo)們還發(fa)現它在數學(xue)和編碼方面表現出(chu)色。在國(guo)際(ji)數學(xue)奧林匹克(IMO)資格考試(shi)中(zhong),GPT-4o僅(jin)正確解(jie)決了13%的(de)問題(ti),而推(tui)理(li)模(mo)(mo)型(xing)(xing)得(de)分(fen)為83%。他們的(de)編碼能力在比賽中(zhong)得(de)到了評估,并在Codeforces比賽中(zhong)達到了第89個百分(fen)位。”OpenAI對o1模(mo)(mo)型(xing)(xing)的(de)介紹表示。

  在數學競賽(sai)中,以AIME2024為例,GPT-4o平(ping)均(jun)只能解(jie)決12%的問(wen)題(ti),而o1平(ping)均(jun)能解(jie)決74%的問(wen)題(ti),若(ruo)采用(yong)64個樣(yang)本的共(gong)識,解(jie)決率能達到(dao)83%。o1在競爭性編程(cheng)問(wen)題(ti)(Codeforces)中排名第89位,在美(mei)(mei)國數學奧林匹克(AIME)預選賽(sai)中躋身美(mei)(mei)國前500名學生之列(lie),并(bing)在物(wu)理、生物(wu)和化(hua)學問(wen)題(ti)(GPQA)基(ji)準測試中超(chao)越(yue)人類博士(shi)級準確(que)度。 

  OpenAI表示,對(dui)于(yu)復雜的(de)推理任務來(lai)說,這是一(yi)個重大進步,代(dai)表了(le)人工智能能力的(de)新水平。鑒于(yu)此,OpenAI將計數器重置為1,并將該系列命名為OpenAIo1。

  另外,OpenAI在(zai)過(guo)去一段時間一直被質疑因加快產業(ye)開發而降低了對模型(xing)安全(quan)的(de)(de)(de)重(zhong)視,團(tuan)隊(dui)中多名安全(quan)團(tuan)隊(dui)的(de)(de)(de)人員(yuan)也(ye)接(jie)二連三離職(zhi)。對于模型(xing)的(de)(de)(de)安全(quan)問(wen)題,OpenAI表示,在(zai)開發這些(xie)新模型(xing)的(de)(de)(de)過(guo)程(cheng)中,公司(si)提出了一種(zhong)新的(de)(de)(de)安全(quan)訓練(lian)方(fang)法,利用模型(xing)的(de)(de)(de)推理(li)能力,使它們遵守安全(quan)和協調準(zhun)則(ze)(ze),能夠通(tong)過(guo)在(zai)上下(xia)文(wen)中推理(li)安全(quan)規則(ze)(ze),并且更有效地應用這些(xie)安全(quan)規則(ze)(ze)。

  “我(wo)們衡量安全性(xing)的(de)一種方法是測試(shi)當用戶試(shi)圖繞過安全規則(稱為(wei)‘越獄(yu)’)時,我(wo)們的(de)模型如何繼續遵循安全規則。在(zai)我(wo)們最嚴格的(de)越獄(yu)測試(shi)之(zhi)一中,GPT-4o得(de)分(fen)(fen)為(wei)22(0-100分(fen)(fen)制),而(er)我(wo)們的(de)o1預覽(lan)模型得(de)分(fen)(fen)為(wei)84。”OpenAI介(jie)紹稱。

  適用(yong)對象方(fang)面(mian),擁有增強的推(tui)理能力(li)的o1模型更適合(he)于解(jie)決科學(xue)、編碼、數學(xue)和類似領域的復(fu)雜問題(ti)。例(li)如,醫療研究(jiu)人(ren)員(yuan)可(ke)以(yi)使用(yong)o1來(lai)注釋細(xi)胞測序數據,物理學(xue)家可(ke)以(yi)使用(yong)o1來(lai)生成量子(zi)光學(xue)所需的復(fu)雜數學(xue)公式,各領域的開發人(ren)員(yuan)可(ke)以(yi)使用(yong)o1來(lai)構建和執行(xing)多步驟工(gong)作流(liu)程。

  除了(le)o1系列模(mo)型(xing)外,OpenAI這次(ci)還一(yi)(yi)并(bing)發(fa)布了(le)一(yi)(yi)個(ge)mini版(ban)OpenAIo1-mini模(mo)型(xing)。OpenAI在官網(wang)中(zhong)給出了(le)preview和mini版(ban)的(de)不(bu)同定義,“為(wei)了(le)給開發(fa)者提供更高效(xiao)的(de)解決方案(an),我們也發(fa)布了(le)OpenAIo1-mini,這是一(yi)(yi)個(ge)尤其(qi)擅長(chang)編程的(de)更快、更便(bian)宜的(de)推(tui)理模(mo)型(xing)。”據(ju)了(le)解,作為(wei)一(yi)(yi)款(kuan)(kuan)較小的(de)模(mo)型(xing),o1-mini比o1-preview便(bian)宜80%,使其(qi)成為(wei)一(yi)(yi)款(kuan)(kuan)功(gong)能(neng)強大、經濟高效(xiao)的(de)模(mo)型(xing),適用于需(xu)要推(tui)理但不(bu)需(xu)要廣(guang)泛世界知識(shi)的(de)應(ying)用程序(xu)。

  至于(yu)新模(mo)型(xing)(xing)(xing)的(de)使用方面,OpenAI稱,從發(fa)布之日起,ChatGPTPlus和Team用戶將(jiang)能夠(gou)(gou)在(zai)ChatGPT中訪問(wen)o1模(mo)型(xing)(xing)(xing)。o1-preview和o1-mini都可以在(zai)模(mo)型(xing)(xing)(xing)選擇(ze)器(qi)中手(shou)動選擇(ze)。不過,發(fa)送(song)消息的(de)次數(shu)目前還(huan)存(cun)在(zai)限制(zhi)。o1-preview每周(zhou)發(fa)送(song)消息次數(shu)限制(zhi)為(wei)30條(tiao)消息,o1-mini則為(wei)50條(tiao)消息。OpenAI稱正在(zai)努力提高這些發(fa)送(song)次數(shu),并使ChatGPT能夠(gou)(gou)根據(ju)給定的(de)提示(shi)自(zi)動選擇(ze)正確的(de)模(mo)型(xing)(xing)(xing)。

  價(jia)(jia)(jia)格(ge)方面,API的(de)價(jia)(jia)(jia)格(ge)上,o1-preview每(mei)百(bai)(bai)萬(wan)(wan)(wan)(wan)輸(shu)入(ru)15美元,每(mei)百(bai)(bai)萬(wan)(wan)(wan)(wan)輸(shu)出60美元。與之對比(bi),GPT4o每(mei)百(bai)(bai)萬(wan)(wan)(wan)(wan)輸(shu)入(ru)和每(mei)百(bai)(bai)萬(wan)(wan)(wan)(wan)輸(shu)出分別是(shi)5美元和15美元,o1-preview價(jia)(jia)(jia)格(ge)是(shi)GPT4o的(de)3倍(bei)。o1-mini會便宜一(yi)些,每(mei)百(bai)(bai)萬(wan)(wan)(wan)(wan)輸(shu)入(ru)為(wei)3美元,每(mei)百(bai)(bai)萬(wan)(wan)(wan)(wan)輸(shu)出為(wei)12美元。

  關于(yu)未(wei)來的計(ji)劃,OpenAI表示計(ji)劃向(xiang)所(suo)有ChatGPTFree用(yong)戶提(ti)供o1-mini訪問權限(xian)。同時(shi),除(chu)了o1模(mo)型宣布(bu)的這些更新之外,OpenAI還希望添(tian)加瀏(liu)覽、文件和圖片上(shang)傳(chuan)等功能,并(bing)計(ji)劃繼續開發(fa)和發(fa)布(bu)GPT系列中(zhong)的模(mo)型。

中證網聲明:凡本網注明“來源:中國證券報·中證網”的所有作品,版權均屬于中國證券報、中證網。中國證券報·中證網與作品作者聯合聲明,任何組織未經中國證券報、中證網以及作者書面授權不得轉載、摘編或利用其它方式使用上述作品。