2023年世界十大科技進(jìn)展新聞 |
|
OpenAI正式發(fā)布GPT-4 |
|
2023年3月15日,OpenAI發(fā)布了多模態(tài)預(yù)訓(xùn)練大模型GPT-4,這是其大型語(yǔ)言模型的最新版本,也是OpenAI在擴(kuò)大深度學(xué)習(xí)方面的最新里程碑。盡管在許多現(xiàn)實(shí)世界的場(chǎng)景中其能力不如人類,但它可以在各種專業(yè)和學(xué)術(shù)基準(zhǔn)上表現(xiàn)出近似人類水平的性能。
在簡(jiǎn)單閑聊時(shí),也許不太好發(fā)現(xiàn)GPT-3.5和GPT-4之間的區(qū)別。但是,當(dāng)任務(wù)的復(fù)雜性達(dá)到足夠的閾值時(shí),它們的區(qū)別就顯現(xiàn)出來(lái)了。具體來(lái)說(shuō),GPT-4比GPT-3.5更可靠、更有創(chuàng)造力,能夠處理更細(xì)微的指令。
相比上一代的GPT-3,GPT-4可以更準(zhǔn)確地解決難題,具有更廣泛的常識(shí)和解決問(wèn)題的能力,如更具創(chuàng)造性和協(xié)作性,能夠處理超過(guò)2.5萬(wàn)個(gè)單詞的文本,允許長(zhǎng)文內(nèi)容創(chuàng)建、擴(kuò)展對(duì)話以及文檔搜索和分析等用例。此外,GPT-4在各類專業(yè)測(cè)試上也表現(xiàn)優(yōu)良。在SAT等絕大多數(shù)專業(yè)測(cè)試以及相關(guān)學(xué)術(shù)基準(zhǔn)評(píng)測(cè)中,GPT-4的分?jǐn)?shù)都高于此前版本。
OpenAI花了6個(gè)月時(shí)間使GPT-4更安全、更具一致性。在內(nèi)部評(píng)估中,與GPT-3.5相比,GPT-4對(duì)不允許內(nèi)容做出回應(yīng)的可能性降低82%,給出事實(shí)性回應(yīng)的可能性高40%。GPT-4引入了更多人類反饋數(shù)據(jù)進(jìn)行訓(xùn)練,不斷吸取現(xiàn)實(shí)世界使用的經(jīng)驗(yàn)教訓(xùn)進(jìn)行改進(jìn)。
對(duì)于市場(chǎng)普遍擔(dān)心的安全倫理問(wèn)題,GPT-4也做了一定升級(jí)。OpenAI表示,新模型將產(chǎn)生更少的錯(cuò)誤答案,更少地偏離軌道,更少地談?wù)摻稍掝},甚至在許多標(biāo)準(zhǔn)化測(cè)試中比人類表現(xiàn)得更好。
不過(guò),GPT-4仍然存在與早期GPT模型類似的限制。它仍然不是完全可靠的,如會(huì)對(duì)事實(shí)產(chǎn)生“幻覺(jué)”,并出現(xiàn)推理錯(cuò)誤。OpenAI提醒,在使用語(yǔ)言模型的輸出時(shí),特別是在高風(fēng)險(xiǎn)的情況下,應(yīng)該非常小心謹(jǐn)慎。但相較于以前的模型,GPT-4大大減少了網(wǎng)絡(luò)錯(cuò)覺(jué)。
GPT-4的發(fā)布是人工智能應(yīng)用的一個(gè)里程碑事件,人工智能可實(shí)現(xiàn)的功能越來(lái)越豐富,未來(lái)或?qū)⒊蔀槿祟惖眯膽?yīng)手的工具。■
《科學(xué)新聞》 (科學(xué)新聞2024年2月刊 封面)