第一av在线_日韩成人久久久_亚洲人成电影网站色_精品精品导航_亚洲综合中文_精品国产91久久久久久_可以在线观看的黄色_99热这里有精品

OpenAI最新模型o3展現(xiàn)強(qiáng)大推理能力
2024-12-26 13:02:03 來源:科技日報 編輯:
12月20日,美國開放人工智能研究中心(OpenAI)介紹了其最新的人工智能(AI)推理模型——o3及其輕量版o3-mini。該公司宣稱,o3具備更先進(jìn)、近似人類的推理能力,在代碼編寫、數(shù)學(xué)競賽和掌握人類博士級別的科學(xué)知識等方面,均超越了其“前輩”o1。

不過,英國《新科學(xué)家》網(wǎng)站在12月22日的報道中指出,盡管o3“實(shí)現(xiàn)了令人矚目的性能飛躍”,但仍未達(dá)到業(yè)內(nèi)翹首以盼的通用AI(AGI)水平。

多方面表現(xiàn)出色

OpenAI公司透露,在解決更復(fù)雜的多步驟問題時,o3模型會花更多時間計(jì)算答案,然后再給出回應(yīng)。這一推理能力的提升,使o3在多項(xiàng)測試中表現(xiàn)出色。

大型語言模型熱衷于在各種數(shù)學(xué)基準(zhǔn)測試上瘋狂“刷分”,o3也不例外。在2024年美國數(shù)學(xué)邀請賽中,o3模型的準(zhǔn)確率高達(dá)96.7%,僅答錯了一個問題。而在OpenAI研究人員認(rèn)為最嚴(yán)格的基準(zhǔn)測試之一——Frontier Math中,o3也解決了25.2%的問題。盡管這一得分看似不高,但此前其他大型語言模型曾在此“集體翻車”,正確率均未超過2%。

Frontier Math測試難度極大,曾被華裔數(shù)學(xué)家、菲爾茲獎得主陶哲軒評價為“可能會難住AI好幾年”。然而,o3只需思考幾分鐘便能解答其中一道題目,而人類數(shù)學(xué)家則要花費(fèi)數(shù)小時到數(shù)天。

在對科學(xué)知識的掌握方面,o3的表現(xiàn)也超出一般博士水平。在GPQA Diamond(衡量模型在博士級科學(xué)問題上的表現(xiàn),涵蓋化學(xué)、物理和生物學(xué)方面的專業(yè)知識)基準(zhǔn)測試中,o3的準(zhǔn)確率達(dá)到87.7%,超過了人類博士的70%,也比之前o1表現(xiàn)高近10%。

此外,o3的編碼能力也比之前的o1系列更勝一籌。在 SWE-bench Verified(衡量AI模型解決現(xiàn)實(shí)世界軟件問題的能力)基準(zhǔn)上,o3的準(zhǔn)確率約為71.7%,比o1高20%以上。在Codeforces編碼競賽平臺中,o3的得分為2727,相當(dāng)于榜單上第175名人類編程員的水平,而o1得分僅為1891。

在展示了o3取得的這些傲人成績后,OpenAI首席執(zhí)行官奧爾特曼強(qiáng)調(diào),o3的出現(xiàn)標(biāo)志著AI進(jìn)入了下一個發(fā)展階段,這些模型可處理需要大量推理的復(fù)雜任務(wù)。

與人類智能仍有差異

《新科學(xué)家》網(wǎng)站還報道,在被視為AGI重要衡量標(biāo)準(zhǔn)的抽象與推理語料庫-AGI(ARC-AGI)大賽中,o3模型也創(chuàng)下新紀(jì)錄:在低算力配置下,它以75.7%的得分登上公共排行榜前列。只因確定此項(xiàng)大獎得主的測試具有更嚴(yán)格的算力限制,在該算力限制下,o3的挑戰(zhàn)以失敗告終。

不過,在超出官方算力限制172倍的高算力下,o3采用“蠻力”取得了87.5%的成績,達(dá)到了代表人類水平的85%門檻。

對于o3的表現(xiàn),谷歌前工程師、ARC-AGI主要創(chuàng)建者弗朗索瓦·肖萊在博客中寫道,這是AI能力的一次驚人且重要的躍升。但o3尚未實(shí)現(xiàn)AGI,因?yàn)槠淙匀粺o法解決ARC-AGI比賽中一些非常簡單的問題,這表明其與人類智能存在根本差異。

AGI是一個假想中的未來系統(tǒng),它能夠模仿人類思維、決策,擁有自我意識,并能自主行動。然而,AGI目前主要活躍在科幻作品中,尚未走進(jìn)現(xiàn)實(shí)。

升級迭代并非易事

o3不僅是OpenAI公司的最新力作,也是AI巨頭競逐大型語言模型的生動寫照。

兩年前,OpenAI發(fā)布了ChatGPT,由此拉開了AI軍備競賽的序幕。從GPT-3.5到更準(zhǔn)確、更具創(chuàng)造性的GPT-4,再到o1,直至o3,OpenAI在不斷精進(jìn)自家產(chǎn)品。

其他頂級AI開發(fā)商也在利用日益先進(jìn)的技術(shù),推動自家產(chǎn)品迭代升級。此前不久,谷歌推出了其旗艦?zāi)P?ldquo;雙子座”(Gemini)的新版本,據(jù)稱其速度是上一代的兩倍,并且能夠“思考、記憶、規(guī)劃,甚至替代用戶采取行動”。元宇宙平臺公司計(jì)劃明年推出Llama 4。

然而,迭代之路并非坦途。包括OpenAI和谷歌在內(nèi)的幾家領(lǐng)軍企業(yè),正面臨新模型開發(fā)耗資巨大但回報遞減的困境。OpenAI的GPT-5模型開發(fā)工作進(jìn)展緩慢。據(jù)悉,僅6個月的訓(xùn)練,單計(jì)算成本就高達(dá)約5億美元,而性能僅比該公司現(xiàn)有產(chǎn)品略勝一籌。

關(guān)鍵詞:

相關(guān)閱讀
分享到:
版權(quán)和免責(zé)申明

凡注有"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶"或電頭為"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶"的稿件,均為環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶獨(dú)家版權(quán)所有,未經(jīng)許可不得轉(zhuǎn)載或鏡像;授權(quán)轉(zhuǎn)載必須注明來源為"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶",并保留"環(huán)球傳媒網(wǎng) - 環(huán)球資訊網(wǎng) - 環(huán)球生活門戶"的電頭。

日韩欧美高清在线视频| 国产在线日韩欧美| 日韩va亚洲va欧美va久久| 老汉av免费一区二区三区| 成人妖精视频yjsp地址| 中文字幕av不卡| 狠狠做深爱婷婷久久综合一区 | 久99久精品视频免费观看| 成人做爰69片免费看网站| 亚洲欧美日韩久久| 欧美无砖专区一中文字| av二区三区| 国产高清av在线| 电影一区二区| 成人在线免费观看网站| 视频一区二区国产| 国产精品日日摸夜夜摸av| 日韩欧美亚洲综合| jizz18欧美| 18加网站在线| 一区二区三区免费在线看| 欧美日韩岛国| 99久久国产免费看| 欧美色图在线观看| 撸视在线观看免费视频| 全球最大av网站久久| 国产精品一区二区av交换| 日韩极品在线观看| 中文字幕欧美一| 亚洲国产另类久久精品| 老司机在线永久免费观看| 秋霞一区二区| 美女黄网久久| 性做久久久久久| 最新中文字幕av专区| 交100部在线观看| 最新精品国偷自产在线| 韩国v欧美v亚洲v日本v| 欧美日韩午夜激情| 日本中文字幕一区二区有码在线 | 丝袜亚洲另类欧美| 日韩一区欧美一区| 亚洲国产精品va在线看黑人| a级网站在线播放| 成人vr资源| 337p粉嫩大胆噜噜噜噜噜91av| 精品婷婷伊人一区三区三| 992tv免费直播在线观看| 蜜臀av一区| 9l国产精品久久久久麻豆| 777午夜精品视频在线播放| 婷婷在线视频观看| 日韩深夜影院| 91麻豆精品在线观看| 欧美电视剧在线看免费| 国产99在线观看| 伊人影院久久| 婷婷久久综合九色综合绿巨人| a级在线观看| 大片网站久久| 国产清纯在线一区二区www| 亚洲激情在线观看| 韩国精品主播一区二区在线观看| 亚洲二区在线| 婷婷激情综合网| 日本最黄一级片免费在线| 成人精品中文字幕| 亚洲欧美一区二区不卡| 中文字幕中文字幕在线中文字幕三区 | 77成人影视| 99精品欧美一区二区蜜桃免费| 亚洲国产精品成人精品| 日韩欧美三区| 成人av资源站| 老鸭窝av在线| 蜜乳av综合| 亚洲视频一区二区免费在线观看| 在线观看av影片| 日韩电影在线视频| 五月综合激情网| 亚洲大胆人体大胆做受1| 国产日产高清欧美一区二区三区| 图片区小说区区亚洲影院| 精品麻豆一区二区三区| 国产精品久久久亚洲一区| 欧美日韩色一区| 精品欧美日韩精品| av电影天堂一区二区在线| 日本二区视频| 啪啪亚洲精品| 午夜亚洲福利老司机| 精品捆绑调教一区二区三区| 另类小说欧美激情| 亚洲女在线观看| 日本久久黄色| 91久久精品一区二区| 亚洲成人av观看| 久久久不卡网国产精品二区| 涩涩视频在线观看免费| 亚洲三级毛片| 亚洲精品v欧美精品v日韩精品| 好吊妞视频这里有精品| 亚洲精品国产无套在线观| 毛片网站在线看| 成人精品免费视频| 日韩一二三四| 蜜桃av一区| 好男人看片在线观看免费观看国语| 欧美最新另类人妖| 欧美日韩精品免费观看视频| 国产一区二区三区免费观看在线 | 亚洲精品久久在线| 嫩草一区二区三区| 色婷婷综合久久久久中文| 欧美电影免费看| 中文字幕在线不卡一区二区三区 | 欧美日韩在线视频免费观看| 国产在线国偷精品产拍免费yy| 五月天丁香婷| 国产精品嫩草99av在线| 日韩极品精品视频免费观看| 国产一区二区三区91| 欧美精品久久99| 欧美日韩爱爱| 欧美大片拔萝卜| 欧美一站二站| 精品国产免费一区二区三区四区| 狠狠色丁香婷婷综合影院| 337p亚洲精品色噜噜| 精品一区免费| 欧美成人精品1314www| 欧美电影《轻佻寡妇》| 日韩精品专区在线影院重磅| 久久国产中文字幕| 日韩成人久久久| 欧美日韩国产在线一区| 国产一级二级在线| 男女性色大片免费观看一区二区| 天堂中文字幕在线| 国产麻豆精品久久一二三| 黄色网址在线免费| 国产欧美日韩视频一区二区| 久草在线新免费首页资源站| 久久精品在线免费观看| 黄色在线观看www| 一级日本不卡的影视| 少妇精品在线| 精品少妇一区二区| 一本不卡影院| а√天堂中文在线资源bt在线| 91色婷婷久久久久合中文| 天天综合网天天| 色欧美乱欧美15图片| 日韩国产在线| 在线中文字幕av| av亚洲精华国产精华精| 一区二区视频免费完整版观看| 福利一区福利二区微拍刺激| 精品国产一区二区三区av片| 国产丝袜一区视频在线观看| 久久午夜电影| 丁香花在线影院| 五月开心婷婷久久| 久久中文字幕av| 亚洲激情文学| 国产精品久久99| 亚洲综合小说图片| 黄色福利视频网站| 99精品欧美一区二区三区综合在线| 一呦二呦三呦精品国产| 欧美日产在线观看| 性欧美videos另类喷潮| 七七成人影院| 欧美在线你懂的| 亚洲免费在线| 看黄在线观看| 制服丝袜亚洲播放| 美美哒免费高清在线观看视频一区二区 | 国产真实乱偷精品视频免| 亚洲人成在线网站| 91麻豆精品国产91久久久久久久久| 亚洲精选久久| 麻豆免费在线| 日韩欧美一区二区久久婷婷| 日韩不卡免费视频| 日韩欧美精品一区二区综合视频| 欧美一区在线视频| 国产在线国偷精品免费看| 亚洲伦理久久| aaa免费看大片| 中文字幕av不卡| 99欧美视频| 中文字幕有码在线观看| 欧美日韩日日摸| 国产一区二区三区免费播放| 亚洲日日夜夜| 免费男女羞羞的视频网站主页在线观看 | 色呦呦呦在线观看| 日韩午夜电影在线观看| 国产福利视频一区二区三区|