GPT-5來(lái)了,三大變化,人人免費(fèi)可用
關(guān)鍵詞: GPT-5 華為鴻蒙智能體 編碼 創(chuàng)意寫(xiě)作 健康領(lǐng)域
隨著GPT-5正式發(fā)布,國(guó)產(chǎn)大模型再次被國(guó)人寄予厚望。
國(guó)際電子商情8日訊 當(dāng)?shù)貢r(shí)間周四(8月7日),OpenAI官方正式推出了備受外界期待的、性能更強(qiáng)的新一代人工智能模型GPT-5。
OpenAI在新聞稿中寫(xiě)道,GPT-5的智能性能遠(yuǎn)超公司之前的所有模型,在編碼、數(shù)學(xué)、寫(xiě)作、健康、視覺(jué)感知等領(lǐng)域均擁有卓越的性能。公司首席執(zhí)行官Sam Altman表示,GPT-5非常聰明,如果說(shuō)GPT-4還是大學(xué)生,GPT-5就是真正的專家,是世界上最好的寫(xiě)作、編碼和醫(yī)療模型,也是公司迄今為止最快的模型。
三大核心變化
據(jù)悉,GPT-5核心變化體現(xiàn)在三個(gè)方面:架構(gòu)統(tǒng)一、性能大幅提升、對(duì)所有用戶開(kāi)放。
GPT-5采用統(tǒng)一系統(tǒng)設(shè)計(jì),包含快速響應(yīng)模型、深度推理模型和智能路由器。系統(tǒng)根據(jù)對(duì)話復(fù)雜度自動(dòng)選擇處理方式,用戶無(wú)需手動(dòng)切換模型。在“大一統(tǒng)”的理念下,OpenAI現(xiàn)有的GPT和o系列模型,都將變成一個(gè)對(duì)應(yīng)的GPT-5模型。
性能方面,GPT-5不僅在基準(zhǔn)測(cè)試中超越了之前的模型,回答問(wèn)題的速度更快,更重要的是,它的準(zhǔn)確性得到了較大提升,幻覺(jué)錯(cuò)誤比GPT-4o減少45%。在獨(dú)立思考時(shí),其回答出錯(cuò)的概率更是比OpenAI o3低了80%。
此外,GPT-5向所有用戶開(kāi)放,面向普通用戶提供免費(fèi)、Plus和Pro三種模式。其中,Plus會(huì)員可獲得更多使用量,Pro會(huì)員則可訪問(wèn)GPT-5 Pro版本——該版本具有擴(kuò)展推理能力,可提供更全面、更準(zhǔn)確的答案。
從本周四當(dāng)日起,GPT-5向所有ChatGPT的免費(fèi)用戶和訂閱Plus、Pro、Team的付費(fèi)用戶開(kāi)放,作為默認(rèn)模型使用,并于一周內(nèi)在Enterprise和Edu付費(fèi)方案上線。
三大領(lǐng)域優(yōu)勢(shì)
據(jù)悉,GPT-5擁有編程、創(chuàng)意寫(xiě)作、健康領(lǐng)域三大優(yōu)勢(shì)。
編碼方面,GPT-5在復(fù)雜的前端生成和大型代碼庫(kù)的調(diào)試方面表現(xiàn)出色,通常只需一次提示就能創(chuàng)建網(wǎng)站、應(yīng)用程序和游戲,并兼具美感。官網(wǎng)上放了五個(gè)案例,分別是一個(gè)類似“Flappy Bird”的網(wǎng)頁(yè)游戲、像素畫(huà)圖板、打字計(jì)時(shí)器、架子鼓模擬器,以及一個(gè)音頻可視化工具。
在從GitHub獲取現(xiàn)實(shí)世界編碼任務(wù)的基準(zhǔn)測(cè)試SWE-bench Verified中,GPT-5思考后首次嘗試的準(zhǔn)確率達(dá)74.9%,高于OpenAI推理模型o3的69.1%和GPT-4o的30.8%。
在創(chuàng)意寫(xiě)作方面,GPT-5能夠處理結(jié)構(gòu)復(fù)雜的寫(xiě)作任務(wù),如無(wú)韻律的抑揚(yáng)格五音步詩(shī)或自然流動(dòng)的自由詩(shī)。OpenAI表示,“GPT-5是我們迄今為止最強(qiáng)大的寫(xiě)作協(xié)作工具,能夠幫助您將粗略的想法轉(zhuǎn)化為引人入勝、富有文學(xué)深度和節(jié)奏感的文字作品。”
除了編程和創(chuàng)意寫(xiě)作,OpenAI還強(qiáng)調(diào)了GPT-5在健康方面的進(jìn)步。
新聞稿寫(xiě)道,“GPT-5是我們迄今為止針對(duì)健康相關(guān)問(wèn)題的最佳模型,它使用戶能夠了解并提高自己的健康程度。”在名為HealthBench Hard Hallucinations的測(cè)試中,具備思考能力的GPT-5出現(xiàn)幻覺(jué)的錯(cuò)誤信息率僅為1.6%。這遠(yuǎn)低于GPT-4o和o3模型,后兩者的錯(cuò)誤信息率分別為15.8%和12.9%。
不過(guò)OpenAI強(qiáng)調(diào),ChatGPT不能替代醫(yī)療專業(yè)人員。
華為也有新動(dòng)作
隨著GPT-5正式發(fā)布,國(guó)產(chǎn)大模型再次被國(guó)人寄予厚望。
2025年是智能體產(chǎn)業(yè)化元年,國(guó)內(nèi)各類智能體層出不窮。在所有智能體中,華為鴻蒙智能體最受市場(chǎng)關(guān)注。
在今年6月,華為常務(wù)董事、終端BG董事長(zhǎng)余承東發(fā)布了一條視頻,展示了鴻蒙AI超級(jí)智能體:用戶只需下達(dá)語(yǔ)音指令,智能體即完成訂機(jī)票、買(mǎi)手機(jī)、緩存視頻等一系列復(fù)雜操作,無(wú)需人為干預(yù),真正實(shí)現(xiàn)了“動(dòng)口不動(dòng)手”的沉浸式交互。
余承東透露,該智能體將在8月Pura 80系列上首發(fā)上線。
據(jù)悉,鴻蒙AI超級(jí)智能體能夠跨APP調(diào)用,主要得益于鴻蒙智能體框架的全面升級(jí),其賦予應(yīng)用自主決策能力,讓智能體和應(yīng)用、智能體和智能體之間相互協(xié)同,在終端設(shè)備完成復(fù)雜的任務(wù)。
除華為外,其他科技巨頭在智能體方面不斷有新成果發(fā)布。日前,360集團(tuán)正式宣布納米AI完成品牌煥新,升級(jí)為“多智能體蜂群”,首次實(shí)現(xiàn)多智能體拉群組隊(duì)、像蜂群一樣分工協(xié)作。百度正在搜索電腦端首頁(yè)測(cè)試開(kāi)放智能體應(yīng)用入口,目前該功能已在灰度測(cè)試,預(yù)計(jì)很快將全量開(kāi)放。阿里巴巴通義實(shí)驗(yàn)室在7月初正式開(kāi)源其最新網(wǎng)絡(luò)智能體WebSailor。
