在近日舉行的解放日?qǐng)?bào)第79屆文化講壇上,香港科技大學(xué)首席副校長(zhǎng)郭毅可做了主題演講。他在現(xiàn)場(chǎng)提出了一個(gè)有趣的問(wèn)題——“如果大模型是答案,什么是問(wèn)題”。他分析了當(dāng)前大模型發(fā)展面臨的技術(shù)挑戰(zhàn)、未來(lái)大模型發(fā)展的必然趨勢(shì),分享了香港打造人工智能生態(tài)系統(tǒng)的經(jīng)驗(yàn),并對(duì)上海的人工智能發(fā)展提出了建議。以下是演講主要內(nèi)容。
英國(guó)皇家工程院院士、香港科技大學(xué)首席副校長(zhǎng)郭毅可在演講中。 海沙爾攝
郭毅可
英國(guó)皇家工程院院士、歐洲科學(xué)院院士、IEEE(美國(guó)電氣電子工程師學(xué)會(huì))會(huì)士,香港科技大學(xué)首席副校長(zhǎng)。作為國(guó)際知名的計(jì)算機(jī)科學(xué)家,他的主要研究領(lǐng)域?yàn)闄C(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘,在機(jī)器學(xué)習(xí)算法及醫(yī)學(xué)大數(shù)據(jù)分析系統(tǒng)、人工智能藝術(shù)等領(lǐng)域作出了重要貢獻(xiàn)。
大家好!我還是講普通話,講上海閑話交關(guān)人聽(tīng)不懂(上海話)。非常有幸,能夠在家鄉(xiāng)上海的舞臺(tái)上演講。我小時(shí)候家里訂的報(bào)紙就是《解放日?qǐng)?bào)》,所以今天《解放日?qǐng)?bào)》向我發(fā)出邀請(qǐng),我肯定會(huì)來(lái)(臺(tái)下發(fā)出笑聲)。
人工智能已經(jīng)深入人心。我也沒(méi)有想到,我原來(lái)以為這個(gè)世界上有男人和女人就夠了,現(xiàn)在還要加上機(jī)器人。我今天演講的主題是:如果大模型是答案,那么什么是問(wèn)題。我來(lái)講一講,人工智能的飛躍現(xiàn)在剛剛開(kāi)始,它未來(lái)會(huì)怎么發(fā)展。
『人工智能可以做什么』
首先,人工智能得以發(fā)展,是因?yàn)橛辛艘豁?xiàng)偉大的技術(shù),叫作神經(jīng)元網(wǎng)絡(luò)。人工智能主要是通過(guò)神經(jīng)元網(wǎng)絡(luò)來(lái)模擬人腦。
1942年,奧地利心理學(xué)家赫布發(fā)表了一篇重要的文章,其中講了大腦神經(jīng)元的連接原理。當(dāng)大腦受到刺激以后,大腦中的一些神經(jīng)元就會(huì)發(fā)生連接,如果不斷刺激它的話,這些連接會(huì)越來(lái)越強(qiáng)。神經(jīng)元的連接實(shí)際上是刺激的結(jié)果,如果把學(xué)習(xí)看作一種刺激,那么神經(jīng)元之間的連接就是學(xué)習(xí)的表現(xiàn)。神經(jīng)元網(wǎng)絡(luò)就是一種模仿大腦神經(jīng)元之間連接的計(jì)算模型。我們不斷地給它輸入數(shù)據(jù),為的是構(gòu)造不同神經(jīng)元網(wǎng)絡(luò)的連接。神經(jīng)元網(wǎng)絡(luò)的連接由代表連接的強(qiáng)度的參數(shù)來(lái)表達(dá),在學(xué)習(xí)的過(guò)程中,我們不斷去改變連接的強(qiáng)度,從而使模型的輸出能夠滿足我們的要求??偠灾?,這是一種用神經(jīng)元網(wǎng)絡(luò)來(lái)模仿大腦學(xué)習(xí)過(guò)程的機(jī)制。
那么,人工智能可以做什么事情呢?簡(jiǎn)單來(lái)說(shuō)可以做兩類事情。
第一類是判別。判別就是區(qū)分不同,區(qū)分不同是預(yù)測(cè)的基礎(chǔ)。要知道數(shù)據(jù)是屬于哪一類,先進(jìn)行數(shù)據(jù)標(biāo)注,用標(biāo)注好的數(shù)據(jù)來(lái)訓(xùn)練模型。 有了模型,輸入一個(gè)不知類別的數(shù)據(jù)后,模型可以根據(jù)特征判定它屬于哪一類,這叫判別。比如,圖象識(shí)別就是一種典型的判別。人臉識(shí)別,模型看了很多人的臉以后,這個(gè)人是男的還是女的、年輕的還是年老的,根據(jù)特征就可以進(jìn)行判別。
另一類是生成。生成的順序和判別正好相反。不需要數(shù)據(jù)標(biāo)注,我們把所有的數(shù)據(jù)都輸入計(jì)算機(jī),它自己來(lái)總結(jié)數(shù)據(jù)的特征,再把這個(gè)數(shù)據(jù)進(jìn)行聚類,有了類別以后,我們就可以要求計(jì)算機(jī)生成某一種類別的東西。比如,我要計(jì)算機(jī)生成一棵樹(shù),因?yàn)槟P椭罉?shù)的特征,它就可以生成一棵它沒(méi)有見(jiàn)過(guò)的樹(shù),這就是生成式的人工智能。生成式的人工智能是如今人工智能的主流。以前我們?yōu)槭裁醋霾坏侥兀恳驗(yàn)橐郧拔覀儧](méi)有這么大的計(jì)算機(jī),那么多的數(shù)據(jù),也沒(méi)有這么好的算法。今天我們有了這么大的計(jì)算機(jī),有了這么多的數(shù)據(jù),我們可以把全世界所有的文字輸入計(jì)算機(jī),它就會(huì)總結(jié)出語(yǔ)言的特征,并根據(jù)語(yǔ)言的特征生成文字。
有了這個(gè)生成式的大模型,人工智能被改變了。原來(lái)的人工智能都是解決具體問(wèn)題的。比如要下圍棋,就做一個(gè)下圍棋的模型。比如要研究蛋白質(zhì)折疊的問(wèn)題,就做一個(gè)相關(guān)的模型。而現(xiàn)在,我們做的是一個(gè)基礎(chǔ)模型。把所有在互聯(lián)網(wǎng)上可以獲得的文字?jǐn)?shù)據(jù)、圖象數(shù)據(jù)、聲音數(shù)據(jù)都輸入計(jì)算機(jī),讓它自己學(xué)習(xí)這些數(shù)據(jù),學(xué)完以后,就可以生成各種圖片和語(yǔ)言,這就是一個(gè)基礎(chǔ)模型。在這個(gè)模型的基礎(chǔ)上,可以形成各種各樣的垂直應(yīng)用。比如,要生成一幅國(guó)畫,要生成中文,要生成一部醫(yī)學(xué)文獻(xiàn),要生成一個(gè)戲劇劇本,都可以通過(guò)輸入特別的樣本,對(duì)基礎(chǔ)模型進(jìn)行微調(diào),來(lái)形成相關(guān)的應(yīng)用。
所以,大模型的發(fā)展在ChatGPT誕生以后呈現(xiàn)出指數(shù)級(jí)的上升。國(guó)內(nèi)也產(chǎn)生了很多的大模型,幾乎每天誕生一個(gè),出現(xiàn)了爆發(fā)式增長(zhǎng)。
『為什么語(yǔ)言模型如此重要』
有人說(shuō),ChatGPT不就是一個(gè)人工智能的語(yǔ)言對(duì)話系統(tǒng)嘛,為什么它如此重要?談到它的重要性,要從兩篇文章講起。
第一篇文章是《計(jì)算機(jī)械與智能》,其作者是大名鼎鼎的英國(guó)計(jì)算機(jī)科學(xué)家、被譽(yù)為“人工智能之父”的圖靈。還有一篇是“控制論之父”、美國(guó)數(shù)學(xué)家維納發(fā)表的文章《人有人的用處——控制論與社會(huì)》。這兩篇文章都是1950年發(fā)表的,可以說(shuō),它們開(kāi)啟了人工智能的研究之路。
圖靈說(shuō):機(jī)器有沒(méi)有智能?怎么界定機(jī)器的智能呢?一個(gè)比較好的界定方法就是,當(dāng)一個(gè)機(jī)器跟人對(duì)話的時(shí)候,你不能分辨對(duì)話者是機(jī)器還是人,這就表明機(jī)器有了智能。這個(gè)測(cè)試方法被稱為“圖靈測(cè)試”。所以,語(yǔ)言是界定人工智能是否具有智能的一個(gè)重要標(biāo)準(zhǔn)。
維納在文章中提出了兩個(gè)問(wèn)題。首先,他認(rèn)為機(jī)器一定會(huì)具有智能,當(dāng)機(jī)器具有智能以后,人和機(jī)器在社會(huì)中共存的一個(gè)重要形式就是人機(jī)互相交流、互相對(duì)話。其次,這樣的機(jī)器是怎么產(chǎn)生的?維納第一次提出,當(dāng)復(fù)雜度達(dá)到一定程度時(shí),機(jī)器會(huì)“涌現(xiàn)”出這樣的智能。
為什么圖靈會(huì)用語(yǔ)言來(lái)界定機(jī)器是否具有智能呢?奧地利哲學(xué)家維特根斯坦有一句名言:“我語(yǔ)言的邊界,就是我世界的邊界。”語(yǔ)言不僅是交流的工具,更重要的是,語(yǔ)言是思想的體現(xiàn)。語(yǔ)言是我們對(duì)世界的“表達(dá)模型”,語(yǔ)言是對(duì)客觀世界的主觀編碼。從這個(gè)意義上來(lái)講,語(yǔ)言的重要性非同尋常,計(jì)算機(jī)能夠講人類的語(yǔ)言,就意味著它有了和我們相似的智能。
此外,語(yǔ)言還決定了思維方式。如果語(yǔ)言不同的話,我們的思維方式也會(huì)不一樣。有一部著名的科幻電影叫作《降臨》,是根據(jù)美國(guó)華裔科幻作家姜峰楠的小說(shuō)改編的。電影講了一個(gè)道理,那就是語(yǔ)言對(duì)思維具有非常重要的作用。一群外星人乘坐飛船來(lái)到地球,跟我們交流,但我們不懂他們的語(yǔ)言。后來(lái)有一位語(yǔ)言學(xué)家通過(guò)學(xué)習(xí)對(duì)方的文字,終于理解了他們。原來(lái),他們的語(yǔ)言是非線性的,因此他們的思維也是非線性的,可以超越時(shí)空的限制。所以說(shuō),語(yǔ)言非常重要,如果機(jī)器學(xué)會(huì)了人類的語(yǔ)言,也就學(xué)會(huì)了人類的思維。
還有更重要的一點(diǎn),人類的語(yǔ)言不僅僅是思維的編碼,人類的語(yǔ)言還有感情,還有能量。比如,我現(xiàn)在跟大家講話,其中就充滿了能量,我想表達(dá)我的理念,也希望你們能夠接受我的理念,因此就有一種能量的傳播。人類語(yǔ)言的精髓在于,語(yǔ)言的內(nèi)涵是信息,語(yǔ)言的外延是能量。
以上就是人工智能的語(yǔ)言模型如此重要的原因。
『大模型未來(lái)的發(fā)展趨勢(shì)』
大模型到底是什么?語(yǔ)言大模型是互聯(lián)網(wǎng)的信息壓縮和提煉。它是所有互聯(lián)網(wǎng)信息的一個(gè)壓縮、一個(gè)編碼,通過(guò)這個(gè)編碼,可以生成語(yǔ)言、文本、圖片等。
隨著大模型的進(jìn)一步發(fā)展,它現(xiàn)在可以做什么呢?我們把各種各樣不同的信息——語(yǔ)言、圖像、文本進(jìn)行輸入,通過(guò)編碼對(duì)齊,可以得到多模態(tài)的結(jié)果。比如,我們給ChatGPT看一張圖,然后問(wèn)它可以用圖片上的這些原料做什么。它通過(guò)判別,發(fā)現(xiàn)圖片中有雞蛋、牛奶、面粉等,然后它會(huì)告訴你,用這些原料可以做煎餅、吐司、蛋糕、面包、餅干等等。這是一個(gè)典型的例子,現(xiàn)在的大模型越來(lái)越傾向于多模態(tài),由多種數(shù)據(jù)協(xié)同推理。
未來(lái),大模型的發(fā)展趨勢(shì)是什么?在我看來(lái),大模型發(fā)展的必然趨勢(shì)是擬人化,越來(lái)越像人。從輸入來(lái)說(shuō),它不僅會(huì)聽(tīng),還能看;從模型來(lái)講,現(xiàn)在它會(huì)理解,慢慢地它還會(huì)思辨。思辨和理解是不一樣的,思辨需要有價(jià)值觀,它會(huì)跟你辯論,它知道什么是對(duì)的、什么是錯(cuò)的,而且會(huì)向你證明。不像現(xiàn)在的ChatGPT,你問(wèn)問(wèn)題,機(jī)器回答你而已,未來(lái)發(fā)展更重要的一步是,它可以問(wèn)你問(wèn)題,甚至反駁你的問(wèn)題,也就是說(shuō)它有自己的價(jià)值觀,自由意志;從輸出方面來(lái)說(shuō),它不僅會(huì)表達(dá),未來(lái)還會(huì)有行動(dòng)。這就是具身智能,它可以行動(dòng),比如看見(jiàn)東西要掉下去了,機(jī)器知道怎樣把它接住。未來(lái),計(jì)算機(jī)科學(xué)會(huì)變成機(jī)器行為學(xué),這是我們需要研究的一個(gè)重要方向。總而言之,人工智能會(huì)越來(lái)越融入我們的生活。
那么,現(xiàn)在的人工智能已經(jīng)發(fā)展到了什么樣的水平?2013年的時(shí)候有一部非常有名的電影叫作《她》,講述了人與人工智能相愛(ài)的科幻故事。電影中的人工智能不僅能對(duì)話,而且還有感情,使得男主角愛(ài)上了她?,F(xiàn)實(shí)和電影的距離正在拉近。2024年5月14日,OpenAI公司發(fā)布了GPT-4o,現(xiàn)在的GPT已經(jīng)有了情緒對(duì)話的能力,它甚至可以打斷你,雖然它還沒(méi)有跟人辯論的能力,但它已經(jīng)能夠打斷你了。它可以在短至232毫秒、平均320毫秒的時(shí)間內(nèi)對(duì)音頻輸入做出反應(yīng),這幾乎已經(jīng)跟人一樣了。
『我們現(xiàn)在應(yīng)該做什么』
我們?cè)谙愀圻M(jìn)行生成式人工智能的研究,但我們的做法跟國(guó)內(nèi)不太一樣。在香港,我們不是做很多模型,我們只做一個(gè)基礎(chǔ)模型,主要是為香港的人工智能企業(yè)和香港社會(huì)服務(wù),各種研究機(jī)構(gòu)、企業(yè)、創(chuàng)新公司都可以到這個(gè)平臺(tái)上進(jìn)行開(kāi)發(fā)、應(yīng)用。這個(gè)基礎(chǔ)模型叫“香港仔(HKGAI)”。它有語(yǔ)言系統(tǒng),可以對(duì)話;也可以寫作,學(xué)生、政府官員都可以用它來(lái)進(jìn)行寫作;還可以做一些多模態(tài)的工作,比如用一個(gè)人的圖片生成動(dòng)畫。
最后,我來(lái)講講人工智能的技術(shù)挑戰(zhàn)。技術(shù)挑戰(zhàn)包括三個(gè)方面,一個(gè)是算法,一個(gè)是數(shù)據(jù),一個(gè)是算力。
從數(shù)據(jù)來(lái)講,最大的問(wèn)題是我們幾乎已經(jīng)窮盡了數(shù)據(jù),我們把世界上幾乎所有的數(shù)據(jù)都拿來(lái)訓(xùn)練大模型了,數(shù)據(jù)總是有限的,但我們需要更多的數(shù)據(jù)、更多的信息來(lái)訓(xùn)練大模型。
從算力來(lái)講,有一個(gè)叫作擴(kuò)展律的概念,就是說(shuō)能力越大,效能越好,但是算力總是有限的,而且我們目前還受到芯片的制約。
從算法來(lái)講,主要有三個(gè)問(wèn)題。首先,我們需要研究怎樣避免重復(fù)的學(xué)習(xí),怎樣保證大模型對(duì)新的數(shù)據(jù)不進(jìn)行重復(fù)訓(xùn)練。其次,數(shù)據(jù)不是沒(méi)有了,而是被壓縮了,既然模型是數(shù)據(jù)的完美壓縮,那么高階的學(xué)習(xí)將是在模型上的學(xué)習(xí)。最后,機(jī)器智能和人類智能的培養(yǎng)實(shí)際上具有兩極性,也就是機(jī)器智能和人類智能的培養(yǎng)、訓(xùn)練方法是相反的。人是怎么培養(yǎng)的呢?我們小時(shí)候培養(yǎng)的是童心、好奇心,然后培養(yǎng)價(jià)值觀,了解什么是好的、什么是壞的、什么事情是有價(jià)值的、什么事情是不能做的。再后來(lái)學(xué)習(xí)書本知識(shí),最后是積累社會(huì)經(jīng)驗(yàn)。而人工智能是反過(guò)來(lái)的,一開(kāi)始,不管三七二十一把所有的數(shù)據(jù)都給它,訓(xùn)練一個(gè)通用大模型,然后進(jìn)一步垂直化,微調(diào)一個(gè)個(gè)系統(tǒng),完了之后發(fā)現(xiàn)所有的東西都沒(méi)有價(jià)值觀,沒(méi)有思考的能力,所以再開(kāi)始學(xué)習(xí)價(jià)值觀,而最難的是把所有的東西抽象成一個(gè)個(gè)常識(shí)和概念。所以,未來(lái)算法最具有挑戰(zhàn)性的是,怎樣讓機(jī)器學(xué)會(huì)價(jià)值觀,怎樣讓機(jī)器學(xué)會(huì)常識(shí),并且,怎樣讓機(jī)器記得住、用得上這些常識(shí)。
最后,我想對(duì)上海人工智能的發(fā)展提幾點(diǎn)建議。我認(rèn)為,大模型是一個(gè)基礎(chǔ)設(shè)施,就像地鐵,它是一個(gè)公共開(kāi)發(fā)的平臺(tái),只做一個(gè)基礎(chǔ)大模型就好,做很多的話會(huì)重復(fù)。因此,要建設(shè)一個(gè)上?;A(chǔ)大模型,形成產(chǎn)業(yè)生態(tài),可以在這個(gè)公共平臺(tái)上開(kāi)發(fā)各種不同的垂直應(yīng)用和社會(huì)服務(wù),在教育、政務(wù)、醫(yī)學(xué)、金融、文創(chuàng)等領(lǐng)域做出世界水平的應(yīng)用實(shí)例。更重要的是,以上海豐富的學(xué)術(shù)資源為基礎(chǔ),進(jìn)一步加強(qiáng)基礎(chǔ)研究,研究新的算法。最后,千萬(wàn)不要忘了,人工智能的治理非常重要,上海作為國(guó)際化大都市,應(yīng)當(dāng)建立一個(gè)開(kāi)放性的人工智能治理研究機(jī)構(gòu),以上海的人工智能應(yīng)用為背景,做出人工智能治理的國(guó)際典范。
今天,我們?cè)絹?lái)越把機(jī)器做成人的樣子,未來(lái),我們的社會(huì)將會(huì)由三種人構(gòu)成,那就是男人+女人+機(jī)器人,而我們的社會(huì)還沒(méi)有為此做好準(zhǔn)備。我想,做好人工智能治理的研究工作,把人工智能融入我們的社會(huì)、融入我們的生活,這將是我們?yōu)槿祟愃龅暮艽蟮呢暙I(xiàn)。謝謝?。ㄈ珗?chǎng)掌聲)
欄目主編:龔丹韻
文字編輯:徐蓓
本文作者:郭毅可