當(dāng)?shù)貢r(shí)間周四(9月25日) ,人工智能(AI)研究公司OpenAI發(fā)布了一項(xiàng)新的基準(zhǔn)測(cè)試,用于比較其AI模型與各行業(yè)專業(yè)人士的工作表現(xiàn)。
這項(xiàng)測(cè)試名為GDPval,是一次初步嘗試 ,旨在評(píng)估OpenAI的系統(tǒng)距離在經(jīng)濟(jì)價(jià)值工作上超越人類有多近 。而經(jīng)濟(jì)價(jià)值工作是OpenAI開發(fā)通用人工智能(AGI)的關(guān)鍵環(huán)節(jié)。
OpenAI周四表示,其GPT-5模型以及競(jìng)爭(zhēng)對(duì)手Anthropic公司的Claude Opus 4.1“已經(jīng)接近行業(yè)專家的工作質(zhì)量”。
這并不意味著OpenAI的模型會(huì)立刻取代人類工作 。盡管一些CEO預(yù)測(cè)AI在幾年內(nèi)就會(huì)取代人類,但OpenAI承認(rèn)GDPval目前只涵蓋人們實(shí)際工作中有限的一部分任務(wù)。不過(guò) ,這是該公司用來(lái)衡量AI向這一里程碑邁進(jìn)的最新方式之一。
GDPval基于美國(guó)GDP貢獻(xiàn)最大的九個(gè)行業(yè),包括醫(yī)療、金融 、制造業(yè)和政府等領(lǐng)域 。測(cè)試覆蓋了44種職業(yè),從軟件工程師到護(hù)士再到記者。
在首個(gè)版本GDPval-v0中,OpenAI邀請(qǐng)資深專業(yè)人士對(duì)比AI生成的報(bào)告與其他專業(yè)人士的成果 ,并挑選出更優(yōu)者。
例如,某項(xiàng)任務(wù)要求投行人員為“最后一公里配送行業(yè) ”制作競(jìng)爭(zhēng)格局分析,并與AI生成的報(bào)告進(jìn)行對(duì)比。OpenAI隨后將AI模型在全部44個(gè)職業(yè)中對(duì)抗人類報(bào)告的“勝率”進(jìn)行平均計(jì)算 。
結(jié)果顯示 ,GPT-5-high(高算力版本GPT-5)在40.6%的情況下被評(píng)為優(yōu)于或與行業(yè)專家持平。
而Anthropic的Claude Opus 4.1模型則在49%的任務(wù)中被評(píng)為不輸于行業(yè)專家,這一表現(xiàn)超過(guò)了OpenAI的模型。
OpenAI對(duì)此解釋稱,之所以Claude得分更高 ,部分原因是其傾向于生成更美觀的圖表,而非純粹性能更優(yōu) 。
需要說(shuō)明的是,大多數(shù)職業(yè)的工作遠(yuǎn)不止提交研究報(bào)告 ,而這卻是GDPval-v0所測(cè)試的全部?jī)?nèi)容。OpenAI承認(rèn)這一點(diǎn),并計(jì)劃在未來(lái)開發(fā)更全面的測(cè)試,涵蓋更多行業(yè)和交互式工作流程。
盡管如此 ,OpenAI仍認(rèn)為GDPval的進(jìn)展具有重要意義 。
OpenAI首席經(jīng)濟(jì)學(xué)家Aaron Chatterji在接受采訪時(shí)表示,GDPval的測(cè)試結(jié)果表明,這些崗位上的人們可以利用AI模型節(jié)省時(shí)間,從而專注于更有意義的工作。
“因?yàn)槟P驮谀承┦虑樯弦呀?jīng)變得很擅長(zhǎng) ,隨著能力的提升,人們可以越來(lái)越多地把部分工作交給模型,去做潛在更有價(jià)值的事情 ,”Chatterji說(shuō)。
OpenAI評(píng)估負(fù)責(zé)人Tejal Patwardhan表示,她對(duì)GDPval的進(jìn)步速度感到鼓舞 。
Patwardhan指出,約15個(gè)月前發(fā)布的GPT-4o模型得分僅為13.7%(勝出或持平人類) ,而GPT-5的成績(jī)幾乎提高了三倍。她預(yù)計(jì)這一趨勢(shì)還會(huì)繼續(xù)。
114配資網(wǎng):炒股票那個(gè)軟件最好用-首家日資獨(dú)資券商來(lái)了:瑞穗證券獲批設(shè)立
國(guó)內(nèi)股票交易軟件排名:炒股票最好的app軟件-11個(gè)一字板漲停!超級(jí)大牛股最新發(fā)聲!無(wú)資產(chǎn)注入計(jì)劃 資金尚未完全到位
炒股加桿桿的平臺(tái):手機(jī)股票交易軟件哪個(gè)最好用-工信部辦公廳印發(fā)2025年度多晶硅行業(yè)專項(xiàng)節(jié)能監(jiān)察任務(wù)清單
廣西股票配資:股票哪個(gè)軟件比較好-家具股突然大跌!特朗普最新關(guān)稅威脅 宣布對(duì)家具進(jìn)口展開調(diào)查
手機(jī)炒股票用什么軟件最好:股票開戶app哪家好-美初創(chuàng)公司提出核聚變煉金設(shè)想 引發(fā)學(xué)界關(guān)注
股票交易軟件排行:配資炒股什么-王興興最新發(fā)聲!現(xiàn)在是“AI干活”大規(guī)模爆發(fā)性增長(zhǎng)的前夜
熱豐網(wǎng)-安全的股票配資平臺(tái),有保障的股票配資公司提示:文章來(lái)自網(wǎng)絡(luò),不代表本站觀點(diǎn)。
記者|趙陽(yáng)戈年初,證監(jiān)會(huì)就修改《證券發(fā)行與承銷管理辦法》部分條款向社會(huì)公開征求意見(jiàn),市場(chǎng)也將注意力投向了...
【隔夜行情】?周五(2025年3月21日),A股三大指數(shù)集體下跌,截至收盤,截止收盤,滬指跌1.29%,報(bào)收33...
記者王珍中國(guó)國(guó)際經(jīng)濟(jì)交流中心副理事長(zhǎng)、國(guó)務(wù)院發(fā)展研究中心原副主任王一鳴周一在“中國(guó)發(fā)展高層論壇2025...
3月24日,易方達(dá)國(guó)證自由現(xiàn)金流ETF公開發(fā)售。該產(chǎn)品跟蹤國(guó)證自由現(xiàn)金流指數(shù),這個(gè)指數(shù)是什么?有哪些優(yōu)勢(shì)?投資價(jià)值如何?...
記者辛圓3月25日,博鰲亞洲論壇旗艦報(bào)告《亞洲經(jīng)濟(jì)前景及一體化進(jìn)程2025年度報(bào)告》(以下簡(jiǎn)稱《報(bào)告》...
2025年3月25日,倍輕松(688793.SH)公告稱,公司股東寧波倍松投資有限公司(簡(jiǎn)稱“寧波倍松”)擬通過(guò)大宗交易...
2025年3月24日下午三點(diǎn)A股收盤后,港股科技板塊持續(xù)走強(qiáng)至四點(diǎn)十分收盤。消息面上,一方面美元相對(duì)于人民幣連續(xù)3個(gè)交易...
國(guó)海富蘭克林基金國(guó)富深化價(jià)值基金經(jīng)理劉曉日前發(fā)表了對(duì)?2025?年市場(chǎng)的展望。劉曉指出,國(guó)內(nèi)經(jīng)濟(jì)正處于復(fù)蘇通道,市場(chǎng)大幅...
文/吳治邦3月24日早盤,在2024年年底壓哨實(shí)施完畢重整計(jì)劃的*ST花王股價(jià)繼續(xù)跌停。自2025年1月...
近日,開源證券大連分公司遭大連證監(jiān)局處罰,暫停其辦理需要合格投資者認(rèn)定相關(guān)業(yè)務(wù)六個(gè)月。該懲處力度在近年來(lái)券商分支機(jī)構(gòu)中并...
記者辛圓給補(bǔ)貼、建平臺(tái),為了吸引更多高層次人才,各地紛紛放出“大招”。據(jù)央廣網(wǎng)周一發(fā)布消息,湖...
3月24日,海洋王照明科技股份有限公司(以下簡(jiǎn)稱“海洋王”,002724.SZ)早盤一字跌停,此后股價(jià)拉漲,尾盤封漲停板...
滬深兩市成交額連續(xù)第44個(gè)交易日突破1萬(wàn)億,較昨日此時(shí)縮量超900億。...
3月24日,AI眼鏡概念股開盤拉升,瀛通通訊直線漲停,明月鏡片漲超10%,比依股份、博士眼鏡、恒玄科技、國(guó)光電器等跟漲。...
當(dāng)?shù)貢r(shí)間3月24日,特斯拉美股漲幅擴(kuò)大至5%,現(xiàn)報(bào)262.055美元/股。...