首頁 > 產經

接近理科博士生水準！OpenAI放大招

證券時報網 2024-09-13 11:28

　　北京時間9月(yue)13日凌(ling)晨，OpenAI重磅發布(bu)全新(xin)AI大模型——o1模型。

　　據(ju)OpenAI官網介紹，這一模(mo)(mo)型“旨在花更(geng)多時間(jian)思(si)考后再(zai)作出反應。它們可以推理復雜的(de)任(ren)務，解決比(bi)以前的(de)科學、編碼和(he)數(shu)學模(mo)(mo)型更(geng)難的(de)問題”。不過，今天在ChatGPT和(he)大模(mo)(mo)型API中新發布的(de)是該系(xi)列(lie)中的(de)第(di)一款模(mo)(mo)型，而且還(huan)只是預(yu)覽版——o1-preview（o1預(yu)覽版）。

　　事實上，此前外界曾流(liu)傳(chuan)OpenAI正在(zai)研發(fa)新模型(xing)“草(cao)莓(mei)(mei)”和“獵(lie)戶(hu)座”，其中(zhong)“草(cao)莓(mei)(mei)”具有(you)更(geng)強(qiang)的(de)推(tui)理能力(li)、擅長(chang)解決復雜(za)的(de)數(shu)理邏輯(ji)問題，而“獵(lie)戶(hu)座”則將基于“草(cao)莓(mei)(mei)”模型(xing)的(de)能力(li)，是“ChatGPT”的(de)超強(qiang)繼任模型(xing)。

　　OpenAI首席執行官(guan)山姆·奧(ao)特曼(man)在其個人(ren)社交平(ping)臺表示，“雖(sui)然(ran)o1的表現仍(reng)然(ran)存在缺陷，不過你在第一次(ci)使用它的時候(hou)仍(reng)然(ran)會感到震撼。”　

　　OpenAI今(jin)天發布的(de)(de)o1模型(xing)雖(sui)然名字上(shang)與此前(qian)泄(xie)露(lu)的(de)(de)“草莓”不同，但(dan)功能、推理、性能等(deng)方面與外(wai)界揣測的(de)(de)基本(ben)一致。據了(le)解，o1的(de)(de)推理模式的(de)(de)特別之處(chu)在于，在回答用戶問題之前(qian)，o1會進入(ru)擬人化思考模式，將問題分解成更小的(de)(de)步(bu)驟，逐一解決，然后生成一個較(jiao)長的(de)(de)內(nei)部思維鏈(lian)，這一推理模式也(ye)使得回答的(de)(de)內(nei)容更加(jia)準(zhun)確(que)。

　　“在我(wo)們的(de)測試(shi)中(zhong)，下(xia)一個模(mo)(mo)型(xing)(xing)（o1模(mo)(mo)型(xing)(xing)）更新(xin)在物理(li)、化學(xue)和生物學(xue)的(de)具(ju)有挑戰性的(de)基準任務上的(de)表現與博士生相似。我(wo)們還發(fa)現它在數學(xue)和編碼方面表現出(chu)色。在國(guo)際(ji)數學(xue)奧林匹克(IMO)資格考試(shi)中(zhong)，GPT-4o僅(jin)正確解(jie)決了13%的(de)問題(ti)，而推(tui)理(li)模(mo)(mo)型(xing)(xing)得(de)分(fen)為83%。他們的(de)編碼能力在比賽中(zhong)得(de)到了評估，并在Codeforces比賽中(zhong)達到了第89個百分(fen)位。”OpenAI對o1模(mo)(mo)型(xing)(xing)的(de)介紹表示。

　　在數學競賽(sai)中，以AIME2024為例，GPT-4o平(ping)均(jun)只能解(jie)決12%的問(wen)題(ti)，而o1平(ping)均(jun)能解(jie)決74%的問(wen)題(ti)，若(ruo)采用(yong)64個樣(yang)本的共(gong)識，解(jie)決率能達到(dao)83%。o1在競爭性編程(cheng)問(wen)題(ti)（Codeforces）中排名第89位，在美(mei)(mei)國數學奧林匹克(AIME)預選賽(sai)中躋身美(mei)(mei)國前500名學生之列(lie)，并(bing)在物(wu)理、生物(wu)和化(hua)學問(wen)題(ti)(GPQA)基(ji)準測試中超(chao)越(yue)人類博士(shi)級準確(que)度。

　　OpenAI表示，對(dui)于(yu)復雜的(de)推理任務來(lai)說，這是一(yi)個重大進步，代(dai)表了(le)人工智能能力的(de)新水平。鑒于(yu)此，OpenAI將計數器重置為1，并將該系列命名為OpenAIo1。

　　另外，OpenAI在(zai)過(guo)去一段時間一直被質疑因加快產業(ye)開發而降低了對模型(xing)安全(quan)的(de)(de)(de)重(zhong)視，團(tuan)隊(dui)中多名安全(quan)團(tuan)隊(dui)的(de)(de)(de)人員(yuan)也(ye)接(jie)二連三離職(zhi)。對于模型(xing)的(de)(de)(de)安全(quan)問(wen)題，OpenAI表示，在(zai)開發這些(xie)新模型(xing)的(de)(de)(de)過(guo)程(cheng)中，公司(si)提出了一種(zhong)新的(de)(de)(de)安全(quan)訓練(lian)方(fang)法，利用模型(xing)的(de)(de)(de)推理(li)能力，使它們遵守安全(quan)和協調準(zhun)則(ze)(ze)，能夠通(tong)過(guo)在(zai)上下(xia)文(wen)中推理(li)安全(quan)規則(ze)(ze)，并且更有效地應用這些(xie)安全(quan)規則(ze)(ze)。

　　“我(wo)們衡量安全性(xing)的(de)一種方法是測試(shi)當用戶試(shi)圖繞過安全規則（稱為(wei)‘越獄(yu)’）時，我(wo)們的(de)模型如何繼續遵循安全規則。在(zai)我(wo)們最嚴格的(de)越獄(yu)測試(shi)之(zhi)一中，GPT-4o得(de)分(fen)(fen)為(wei)22（0-100分(fen)(fen)制），而(er)我(wo)們的(de)o1預覽(lan)模型得(de)分(fen)(fen)為(wei)84。”OpenAI介(jie)紹稱。

　　適用(yong)對象方(fang)面(mian)，擁有增強的推(tui)理能力(li)的o1模型更適合(he)于解(jie)決科學(xue)、編碼、數學(xue)和類似領域的復(fu)雜問題(ti)。例(li)如，醫療研究(jiu)人(ren)員(yuan)可(ke)以(yi)使用(yong)o1來(lai)注釋細(xi)胞測序數據，物理學(xue)家可(ke)以(yi)使用(yong)o1來(lai)生成量子(zi)光學(xue)所需的復(fu)雜數學(xue)公式，各領域的開發人(ren)員(yuan)可(ke)以(yi)使用(yong)o1來(lai)構建和執行(xing)多步驟工(gong)作流(liu)程。

　　除了(le)o1系列模(mo)型(xing)外，OpenAI這次(ci)還一(yi)(yi)并(bing)發(fa)布了(le)一(yi)(yi)個(ge)mini版(ban)OpenAIo1-mini模(mo)型(xing)。OpenAI在官網(wang)中(zhong)給出了(le)preview和mini版(ban)的(de)不(bu)同定義，“為(wei)了(le)給開發(fa)者提供更高效(xiao)的(de)解決方案(an)，我們也發(fa)布了(le)OpenAIo1-mini，這是一(yi)(yi)個(ge)尤其(qi)擅長(chang)編程的(de)更快、更便(bian)宜的(de)推(tui)理模(mo)型(xing)。”據(ju)了(le)解，作為(wei)一(yi)(yi)款(kuan)(kuan)較小的(de)模(mo)型(xing)，o1-mini比o1-preview便(bian)宜80%，使其(qi)成為(wei)一(yi)(yi)款(kuan)(kuan)功(gong)能(neng)強大、經濟高效(xiao)的(de)模(mo)型(xing)，適用于需(xu)要推(tui)理但不(bu)需(xu)要廣(guang)泛世界知識(shi)的(de)應(ying)用程序(xu)。

　　至于(yu)新模(mo)型(xing)(xing)(xing)的(de)使用方面，OpenAI稱，從發(fa)布之日起，ChatGPTPlus和Team用戶將(jiang)能夠(gou)(gou)在(zai)ChatGPT中訪問(wen)o1模(mo)型(xing)(xing)(xing)。o1-preview和o1-mini都可以在(zai)模(mo)型(xing)(xing)(xing)選擇(ze)器(qi)中手(shou)動選擇(ze)。不過，發(fa)送(song)消息的(de)次數(shu)目前還(huan)存(cun)在(zai)限制(zhi)。o1-preview每周(zhou)發(fa)送(song)消息次數(shu)限制(zhi)為(wei)30條(tiao)消息，o1-mini則為(wei)50條(tiao)消息。OpenAI稱正在(zai)努力提高這些發(fa)送(song)次數(shu)，并使ChatGPT能夠(gou)(gou)根據(ju)給定的(de)提示(shi)自(zi)動選擇(ze)正確的(de)模(mo)型(xing)(xing)(xing)。

　　價(jia)(jia)(jia)格(ge)方面，API的(de)價(jia)(jia)(jia)格(ge)上，o1-preview每(mei)百(bai)(bai)萬(wan)(wan)(wan)(wan)輸(shu)入(ru)15美元，每(mei)百(bai)(bai)萬(wan)(wan)(wan)(wan)輸(shu)出60美元。與之對比(bi)，GPT4o每(mei)百(bai)(bai)萬(wan)(wan)(wan)(wan)輸(shu)入(ru)和每(mei)百(bai)(bai)萬(wan)(wan)(wan)(wan)輸(shu)出分別是(shi)5美元和15美元，o1-preview價(jia)(jia)(jia)格(ge)是(shi)GPT4o的(de)3倍(bei)。o1-mini會便宜一(yi)些，每(mei)百(bai)(bai)萬(wan)(wan)(wan)(wan)輸(shu)入(ru)為(wei)3美元，每(mei)百(bai)(bai)萬(wan)(wan)(wan)(wan)輸(shu)出為(wei)12美元。

　　關于(yu)未(wei)來的計(ji)劃，OpenAI表示計(ji)劃向(xiang)所(suo)有ChatGPTFree用(yong)戶提(ti)供o1-mini訪問權限(xian)。同時(shi)，除(chu)了o1模(mo)型宣布(bu)的這些更新之外，OpenAI還希望添(tian)加瀏(liu)覽、文件和圖片上(shang)傳(chuan)等功能，并(bing)計(ji)劃繼續開發(fa)和發(fa)布(bu)GPT系列中(zhong)的模(mo)型。

91久久精品无码毛片国产高清

接近理科博士生水準！OpenAI放大招

中證路演Live

銅陵有色金屬集團銅冠礦山建設股份有限公司向不特定合格投資者公開發行股票并在北交所上市網上路演

金牛生態圈Golden Bull Awards

2024保險與信托發展論壇

2024股權投資創新會議

2024金牛私募發展論壇