上海市數(shù)據(jù)科學(xué)重點(diǎn)實(shí)驗(yàn)室主任肖仰華:大模型不能只會開放閑聊

 人參與 | 時間:2025-11-23 16:12:56
【家電資訊-家電新聞 - 行業(yè)新聞,上海市數(shù)作者:編輯】

  自ChatGPT上線來,據(jù)科國際國內(nèi)各大廠商紛紛跟進(jìn),學(xué)重肖仰閑聊鄭州二七區(qū)約炮(約上門服務(wù))約炮崴信159+8298+6630提供外圍女小姐上門服務(wù)快速安排面到付款投入了巨大研發(fā)資源來研發(fā)類似大模型。點(diǎn)實(shí)人工智能的驗(yàn)室發(fā)展,尤其到了通用人工智能階段,主任可謂熱點(diǎn)紛呈。模型

  作為人工智能產(chǎn)業(yè)發(fā)展過程中的開放里程碑事件,ChatGPT代表通用人工智能技術(shù)的上海市數(shù)成熟,宣告人類社會技術(shù)進(jìn)步有可能進(jìn)入快速增長期,據(jù)科甚至一個指數(shù)發(fā)展期。學(xué)重肖仰閑聊在類ChatGPT大模型領(lǐng)域,點(diǎn)實(shí)中國尚處于起步階段,驗(yàn)室需做進(jìn)一步戰(zhàn)略規(guī)劃并統(tǒng)籌發(fā)展。主任就相關(guān)問題,模型《瞭望東方周刊》近日專訪了上海市數(shù)據(jù)科學(xué)重點(diǎn)實(shí)驗(yàn)室主任、復(fù)旦大學(xué)教授肖仰華,探討我國大模型產(chǎn)業(yè)的發(fā)展路徑。

  知識底座

  《瞭望東方周刊》:通用大模型一定程度上刷新了我們對人工智能領(lǐng)域的認(rèn)知,如何理解它帶來的變革?或者說大模型有哪些能力?

  肖仰華:大模型是人類文明所積累的海量知識容器,其所具備的通識能力,就是開放世界的理解能力。現(xiàn)在跟ChatGPT聊天,聊任何行業(yè)、學(xué)科的問題,它都能給出一個看起來不錯的答案,雖然其仍可能犯一些事實(shí)錯誤、一些邏輯錯誤,但基本不會太偏離問題主旨——比如問出生日期卻答出生地點(diǎn)。它還具備一定的“自知之明”能力,對于超出范圍或者倫理敏感的鄭州二七區(qū)約炮(約上門服務(wù))約炮崴信159+8298+6630提供外圍女小姐上門服務(wù)快速安排面到付款問題,會拒絕回答。大模型這種對人類開放世界的理解力,已達(dá)到甚至超越普通人的水平。傳統(tǒng)人工智能產(chǎn)品的“智障”問題已基本解決,這種開放世界的理解能力,對垂直領(lǐng)域(垂域)的認(rèn)知非常關(guān)鍵,因?yàn)榇褂驊?yīng)用是建立在通用大模型的通用認(rèn)知能力基礎(chǔ)之上的。

  大模型有組合創(chuàng)新能力。我們在指令學(xué)習(xí)階段讓它學(xué)了A任務(wù)、B任務(wù),它以后有可能泛化出求解A+B任務(wù)的能力。這種組合泛化,以前做不到,今天能做到,通用大模型讓“舉一反三”成為可能。

  大模型有忠實(shí)的指令理解和執(zhí)行能力,尤其是超大模型。只要給它指令、要求、約束、規(guī)范、規(guī)則,它就一定能夠按照要求一步步完成任務(wù)。這本質(zhì)上是一種情境化生成能力。我甚至認(rèn)為,大模型智能本質(zhì)就是情境化生成能力,因?yàn)榇竽P驮谔崾驹絹碓截S富時,生成的效果越來越好。

  大模型有復(fù)雜任務(wù)的分解能力和規(guī)劃能力。現(xiàn)實(shí)中很多場景都是復(fù)雜任務(wù),需要一步一步求解,先做什么,再做什么,按照順序進(jìn)行合理編排,這就是規(guī)劃能力。

  大模型還有強(qiáng)大的符號推理能力。以前人們只是把大模型當(dāng)做知識容器來看待,只期望其提供需要的知識。但今天不得不承認(rèn)大模型也一定程度上具備類似知識庫(知識圖譜)所具備的推理能力,比如常識推理、數(shù)值推理等能力,當(dāng)然這方面能力還需要進(jìn)一步提升。

  《瞭望東方周刊》:為什么說單有通用大模型不足以解決行業(yè)領(lǐng)域很多問題,需要發(fā)展垂域大模型?

  肖仰華:因?yàn)榫哂猩鲜瞿芰Γㄓ么竽P秃帽仁且粋€寬廣的知識底座,但仍然缺乏專業(yè)知識的深度,缺乏專業(yè)領(lǐng)域復(fù)雜應(yīng)用的長程推理能力。ChatGPT這類大模型本質(zhì)上只是實(shí)現(xiàn)了在開放環(huán)境下的人機(jī)對話,或者叫開放閑聊,但開放閑聊并不能幫我們解決實(shí)實(shí)在在的工作場景中的復(fù)雜決策任務(wù),比如要做設(shè)備故障排查、疾病診斷,都是嚴(yán)肅復(fù)雜的決策場景。在這些場景中需要豐富的專業(yè)知識、復(fù)雜的決策邏輯、宏觀態(tài)勢的研判能力、綜合任務(wù)的拆解與規(guī)劃能力、復(fù)雜約束的取舍能力、未見事物的預(yù)見能力、不確定場景的推理推斷能力等。

  大模型的開放閑聊過程中可能存在兩個問題:一是“幻覺”問題。與ChatGPT聊天,有時它說得頭頭是道,但仔細(xì)分析,會發(fā)現(xiàn)它正在胡編亂造一些不存在的事實(shí)。同時因?yàn)槠湔Z言風(fēng)格一本正經(jīng),讓普通人很容易相信它,即便是領(lǐng)域?qū)<乙獜乃邪逵醒鄣奈谋局凶R別虛構(gòu)和錯誤也是一件不易的事。

  二是缺乏領(lǐng)域“忠實(shí)度”的問題。解決任何專業(yè)領(lǐng)域的問題都要求大模型不要自己根據(jù)通識去自由發(fā)揮,而要嚴(yán)格遵循這個領(lǐng)域的規(guī)范、用符合這個領(lǐng)域的知識體系來回答問題。但是我們?nèi)L試了一些通用大模型,發(fā)現(xiàn)如果不做一些調(diào)教優(yōu)化,它總是會超出你給定的領(lǐng)域文檔自由發(fā)揮,進(jìn)而犯錯。

  所以,一個基本的判斷是:單單利用現(xiàn)在的通用大模型不足以解決行業(yè)很多問題。實(shí)際應(yīng)用需要的是事實(shí)正確、忠實(shí)于領(lǐng)域知識與文本的垂域大模型。從這個判斷出發(fā),當(dāng)下我們要發(fā)展面向垂域的大模型,要發(fā)展通用大模型的外圍插件,要采取大模型和知識圖譜、傳統(tǒng)知識庫相結(jié)合的策略。

  趕上差距

  《瞭望東方周刊》:面對ChatGPT所引發(fā)的通用人工智能產(chǎn)業(yè)變革,國內(nèi)企業(yè)應(yīng)該如何抓住大模型產(chǎn)業(yè)機(jī)會?

  肖仰華:大模型絕不是宣傳文案的噱頭。我們正在見證由通用人工智能所帶來的前所未有的技術(shù)革命。通用人工智能是人類歷史上第一次關(guān)于智能本身的革命。歷次技術(shù)突破都是人類智能的產(chǎn)物,而唯獨(dú)通用人工智能是“智能”本身的革命。

  大模型的誕生宣告了整個人工智能進(jìn)入全新的重工業(yè)時代。回顧人類歷史上的歷次技術(shù)革命,多始于相對低級的手工作坊模式,經(jīng)過漫長的發(fā)展周期,最終形成了成熟的重工業(yè)發(fā)展模式。重工業(yè)化的人工智能有三個鮮明的特征:大模型、大算力和大數(shù)據(jù)。

  5月23日,工作人員在貴州大學(xué)省部共建公共大數(shù)據(jù)國家重點(diǎn)實(shí)驗(yàn)室算力中心(劉續(xù)/攝)

  國外大模型產(chǎn)業(yè)已經(jīng)形成了一個生態(tài),而且發(fā)展非常迅速。反觀國內(nèi),從表象上看熱鬧非凡、模型林立,但是剝開外殼從內(nèi)里看,仍然有不少問題,不免讓人擔(dān)憂。

  一方面,幾乎所有國內(nèi)人工智能產(chǎn)業(yè)的重要企業(yè)與研發(fā)機(jī)構(gòu)紛紛推出了自己的類ChatGPT大模型。這說明,大家都意識到大模型的戰(zhàn)略意義,積極主動投入資源,這值得肯定。

  另一方面,國內(nèi)大模型產(chǎn)業(yè)發(fā)展已經(jīng)出現(xiàn)一些問題:一是技術(shù)路線同質(zhì)化嚴(yán)重,很多大模型都是用ChatGPT喂養(yǎng)自己的大模型,或是在國外開源通用大模型基礎(chǔ)上進(jìn)行指令微調(diào);二是數(shù)據(jù)生態(tài)不完善,中文數(shù)據(jù)生態(tài)尤其重要,但現(xiàn)在較為欠缺;三是算力掣肘;四是模型創(chuàng)新有限,現(xiàn)在很多國內(nèi)大模型都基于國外的開源社區(qū)模型。

  總之,ChatGPT所引發(fā)的通用人工智能產(chǎn)業(yè)變革才剛剛開始,中國相關(guān)部門和企業(yè)要以深入的思考和扎實(shí)的實(shí)踐抓住機(jī)遇,同時高度重視發(fā)展過程中出現(xiàn)的問題。

  《瞭望東方周刊》:具體來說,中國發(fā)展大模型產(chǎn)業(yè)目前面臨哪些短板?

  肖仰華:大模型產(chǎn)業(yè)的發(fā)展取決于多個因素:其一是模型,模型好比內(nèi)功,模型越大,潛力越強(qiáng)。其二是算力,這是大模型的核心競爭力,大模型競爭歸根結(jié)底是算力的競爭。其三是數(shù)據(jù),只有高質(zhì)量的數(shù)據(jù),才能喂養(yǎng)出高水平的大模型。不過,這幾個問題都不是中國大模型產(chǎn)業(yè)的真正短板所在。

  與國際同行相比,當(dāng)前我國大模型產(chǎn)業(yè)發(fā)展在數(shù)據(jù)上有優(yōu)勢,在算力方面有基礎(chǔ),模型本身也不存在什么技術(shù)秘密,真正的短板在于我們對大模型“煉制”工藝的掌握,包括數(shù)據(jù)配方、數(shù)據(jù)清洗和參數(shù)設(shè)置等等,這些從根本上決定了大模型的效果,是大模型產(chǎn)業(yè)發(fā)展的重要因素。這方面短期之內(nèi)難以跟上或者超越,需要我們付出巨大代價進(jìn)行摸索。

  實(shí)際上,上述的每一個具體模塊,國內(nèi)都知道怎么做,但是將它們整合在一起,總體效果和國外是存在差距的,不是0分和100分的差距,而是70分與100分的差距。我們要趕上最后這幾十分,要不斷試錯、評測和改進(jìn)。

  從大模型問題引申來看,應(yīng)用和集成創(chuàng)新,一直是我們的強(qiáng)項(xiàng)。但是跟美國相比,我們?nèi)鄙僭紕?chuàng)新,原始創(chuàng)新甚至到了極度稀缺的程度。原始創(chuàng)新是怎么來的?可能來自科學(xué)家的奇思妙想,可能來自偏執(zhí)甚至瘋狂的想法。比如Open AI的CEO山姆·奧特曼(Sam Altman),他在2015年成立Open AI,2018年投入巨資研發(fā)大模型。而在2018年這個時間點(diǎn),全世界沒有多少科學(xué)家認(rèn)為通用大模型這條路可以走通。

  將來我們要實(shí)現(xiàn)引領(lǐng),就一定要不斷優(yōu)化科研文化和科研生態(tài),鼓勵思辨、鼓勵質(zhì)疑,激發(fā)原始創(chuàng)新。

  7月8日,2023世界人工智能大會在上海世博展覽館舉行。蜜度信息,“文稿通”基于大模型的詩歌生成

  戰(zhàn)略定力

  《瞭望東方周刊》:在大模型熱潮之下,中國自己的大模型發(fā)展道路究竟該怎么走?

  肖仰華:國家有關(guān)部門要引導(dǎo)業(yè)界統(tǒng)一規(guī)劃、合作協(xié)同、有序發(fā)展、健康發(fā)展。對此,我建議,可以從八個方面的應(yīng)對措施推動我國大模型產(chǎn)業(yè)的發(fā)展:一是積極推動數(shù)據(jù)聯(lián)盟(數(shù)據(jù)交易)的建設(shè),促進(jìn)優(yōu)質(zhì)數(shù)據(jù)的共享與傳播;二是大力推動算力聯(lián)盟建設(shè),促進(jìn)優(yōu)質(zhì)算力共享與協(xié)作;三是推動模型開源社區(qū)建設(shè),完善國產(chǎn)大模型的開源生態(tài);四是創(chuàng)新培養(yǎng)方式,培育大模型產(chǎn)業(yè)人才;五是建立大模型的診斷與應(yīng)用評測體系,保障大模型產(chǎn)業(yè)健康發(fā)展;六是研究綠色可持續(xù)的大模型技術(shù),降低大模型落地成本;七是積極探索大模型的應(yīng)用模式,豐富大模型的應(yīng)用場景;八是持續(xù)研究大模型訓(xùn)練與應(yīng)用關(guān)鍵技術(shù),完善大模型技術(shù)體系。

  尤其要注意,在這波大模型的發(fā)展熱潮之下,不能為了追隨ChatGPT,忽略了其他熱點(diǎn),錯失了下一個機(jī)遇。我們一定要有戰(zhàn)略定力,對不斷出現(xiàn)的熱點(diǎn)要有戰(zhàn)略重視,但不能打亂既有部署。比如,很多傳統(tǒng)小模型,該研究還得繼續(xù)研究,數(shù)字化與智能化進(jìn)程中的其他技術(shù)也得往前推進(jìn)。

  在方向上,或者說,只有底座大模型與垂域應(yīng)用相結(jié)合,才能最終創(chuàng)造價值。比如,醫(yī)療領(lǐng)域希望做能代替或部分解放醫(yī)生的問診機(jī)器人,投資領(lǐng)域希望有投資顧問機(jī)器人,司法領(lǐng)域希望有法律咨詢機(jī)器人,這都屬于垂域場景。在提升通用大模型能力的同時,也期待相關(guān)企業(yè)能在大模型垂域應(yīng)用上有所作為,把大模型的通識能力更好地與垂域的專業(yè)知識、專家經(jīng)驗(yàn)、行業(yè)解決問題的思維方式相結(jié)合,去解決現(xiàn)實(shí)中的復(fù)雜問題。我們既要重視通用大模型,更要重視垂域應(yīng)用,重模型輕應(yīng)用或者重應(yīng)用輕模型,都是不可取的。

  中國市場巨大、數(shù)據(jù)豐富、應(yīng)用場景豐富,完全可以用完善的應(yīng)用生態(tài)來帶動底座大模型的進(jìn)步,走一條“農(nóng)村包圍城市”的路線。也就說,先把我們擅長的外圍應(yīng)用和技術(shù)生態(tài)做好,不斷去補(bǔ)齊通用大模型在數(shù)據(jù)、算力、模型和工藝等方面的短板,并在這一過程中摸索有中國特色的大模型發(fā)展道路,形成獨(dú)特優(yōu)勢,另辟大模型競爭賽道,進(jìn)而形成核心競爭力,形成百花齊放、百家爭鳴的繁榮生態(tài)。

  總之,國產(chǎn)大模型絕不能停留在類ChatGPT的開放閑聊,要盡快提升其解決千行百業(yè)實(shí)際問題的能力,切實(shí)把大模型發(fā)展成為推動我國各行業(yè)數(shù)字化轉(zhuǎn)型與高質(zhì)量發(fā)展的先進(jìn)生產(chǎn)力。

分享



免責(zé)聲明:家電資訊網(wǎng)站對《上海市數(shù)據(jù)科學(xué)重點(diǎn)實(shí)驗(yàn)室主任肖仰華:大模型不能只會開放閑聊》一文中所陳述、觀點(diǎn)判斷保持中立,不對所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔(dān)全部責(zé)任。

本網(wǎng)站有部分內(nèi)容均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé),本網(wǎng)站無法鑒別所上傳圖片或文字的知識版權(quán),本站所轉(zhuǎn)載圖片、文字不涉及任何商業(yè)性質(zhì),如果侵犯,請及時通知我們,本網(wǎng)站將在第一時間及時刪除,不承擔(dān)任何侵權(quán)責(zé)任。聯(lián)系QQ:411954607

本網(wǎng)認(rèn)為,一切網(wǎng)民在進(jìn)入家電資訊網(wǎng)站主頁及各層頁面時已經(jīng)仔細(xì)看過本條款并完全同意。敬請諒解。




頂: 48踩: 18742