人妻中文字幕野外,精品国产性色无码av网站

如果大模型是答案，那么什么是問(wèn)題

2024-06-24 08:29 3844次

在近日舉行的解放日?qǐng)?bào)第79屆文化講壇上，香港科技大學(xué)首席副校長(zhǎng)郭毅可做了主題演講。他在現(xiàn)場(chǎng)提出了一個(gè)有趣的問(wèn)題——“如果大模型是答案，什么是問(wèn)題”。他分析了當(dāng)前大模型發(fā)展面臨的技術(shù)挑戰(zhàn)、未來(lái)大模型發(fā)展的必然趨勢(shì)，分享了香港打造人工智能生態(tài)系統(tǒng)的經(jīng)驗(yàn)，并對(duì)上海的人工智能發(fā)展提出了建議。以下是演講主要內(nèi)容。

英國(guó)皇家工程院院士、香港科技大學(xué)首席副校長(zhǎng)郭毅可在演講中。海沙爾攝

郭毅可

英國(guó)皇家工程院院士、歐洲科學(xué)院院士、IEEE（美國(guó)電氣電子工程師學(xué)會(huì)）會(huì)士，香港科技大學(xué)首席副校長(zhǎng)。作為國(guó)際知名的計(jì)算機(jī)科學(xué)家，他的主要研究領(lǐng)域?yàn)闄C(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘，在機(jī)器學(xué)習(xí)算法及醫(yī)學(xué)大數(shù)據(jù)分析系統(tǒng)、人工智能藝術(shù)等領(lǐng)域作出了重要貢獻(xiàn)。

大家好！我還是講普通話，講上海閑話交關(guān)人聽(tīng)不懂（上海話）。非常有幸，能夠在家鄉(xiāng)上海的舞臺(tái)上演講。我小時(shí)候家里訂的報(bào)紙就是《解放日?qǐng)?bào)》，所以今天《解放日?qǐng)?bào)》向我發(fā)出邀請(qǐng)，我肯定會(huì)來(lái)（臺(tái)下發(fā)出笑聲）。

人工智能已經(jīng)深入人心。我也沒(méi)有想到，我原來(lái)以為這個(gè)世界上有男人和女人就夠了，現(xiàn)在還要加上機(jī)器人。我今天演講的主題是：如果大模型是答案，那么什么是問(wèn)題。我來(lái)講一講，人工智能的飛躍現(xiàn)在剛剛開(kāi)始，它未來(lái)會(huì)怎么發(fā)展。

『人工智能可以做什么』

首先，人工智能得以發(fā)展，是因?yàn)橛辛艘豁?xiàng)偉大的技術(shù)，叫作神經(jīng)元網(wǎng)絡(luò)。人工智能主要是通過(guò)神經(jīng)元網(wǎng)絡(luò)來(lái)模擬人腦。

1942年，奧地利心理學(xué)家赫布發(fā)表了一篇重要的文章，其中講了大腦神經(jīng)元的連接原理。當(dāng)大腦受到刺激以后，大腦中的一些神經(jīng)元就會(huì)發(fā)生連接，如果不斷刺激它的話，這些連接會(huì)越來(lái)越強(qiáng)。神經(jīng)元的連接實(shí)際上是刺激的結(jié)果，如果把學(xué)習(xí)看作一種刺激，那么神經(jīng)元之間的連接就是學(xué)習(xí)的表現(xiàn)。神經(jīng)元網(wǎng)絡(luò)就是一種模仿大腦神經(jīng)元之間連接的計(jì)算模型。我們不斷地給它輸入數(shù)據(jù)，為的是構(gòu)造不同神經(jīng)元網(wǎng)絡(luò)的連接。神經(jīng)元網(wǎng)絡(luò)的連接由代表連接的強(qiáng)度的參數(shù)來(lái)表達(dá)，在學(xué)習(xí)的過(guò)程中，我們不斷去改變連接的強(qiáng)度，從而使模型的輸出能夠滿足我們的要求?？偠灾?，這是一種用神經(jīng)元網(wǎng)絡(luò)來(lái)模仿大腦學(xué)習(xí)過(guò)程的機(jī)制。

那么，人工智能可以做什么事情呢？簡(jiǎn)單來(lái)說(shuō)可以做兩類(lèi)事情。

第一類(lèi)是判別。判別就是區(qū)分不同，區(qū)分不同是預(yù)測(cè)的基礎(chǔ)。要知道數(shù)據(jù)是屬于哪一類(lèi)，先進(jìn)行數(shù)據(jù)標(biāo)注，用標(biāo)注好的數(shù)據(jù)來(lái)訓(xùn)練模型。有了模型，輸入一個(gè)不知類(lèi)別的數(shù)據(jù)后，模型可以根據(jù)特征判定它屬于哪一類(lèi)，這叫判別。比如，圖象識(shí)別就是一種典型的判別。人臉識(shí)別，模型看了很多人的臉以后，這個(gè)人是男的還是女的、年輕的還是年老的，根據(jù)特征就可以進(jìn)行判別。

另一類(lèi)是生成。生成的順序和判別正好相反。不需要數(shù)據(jù)標(biāo)注，我們把所有的數(shù)據(jù)都輸入計(jì)算機(jī)，它自己來(lái)總結(jié)數(shù)據(jù)的特征，再把這個(gè)數(shù)據(jù)進(jìn)行聚類(lèi)，有了類(lèi)別以后，我們就可以要求計(jì)算機(jī)生成某一種類(lèi)別的東西。比如，我要計(jì)算機(jī)生成一棵樹(shù)，因?yàn)槟Ｐ椭罉?shù)的特征，它就可以生成一棵它沒(méi)有見(jiàn)過(guò)的樹(shù)，這就是生成式的人工智能。生成式的人工智能是如今人工智能的主流。以前我們?yōu)槭裁醋霾坏侥?？因?yàn)橐郧拔覀儧](méi)有這么大的計(jì)算機(jī)，那么多的數(shù)據(jù)，也沒(méi)有這么好的算法。今天我們有了這么大的計(jì)算機(jī)，有了這么多的數(shù)據(jù)，我們可以把全世界所有的文字輸入計(jì)算機(jī)，它就會(huì)總結(jié)出語(yǔ)言的特征，并根據(jù)語(yǔ)言的特征生成文字。

有了這個(gè)生成式的大模型，人工智能被改變了。原來(lái)的人工智能都是解決具體問(wèn)題的。比如要下圍棋，就做一個(gè)下圍棋的模型。比如要研究蛋白質(zhì)折疊的問(wèn)題，就做一個(gè)相關(guān)的模型。而現(xiàn)在，我們做的是一個(gè)基礎(chǔ)模型。把所有在互聯(lián)網(wǎng)上可以獲得的文字?jǐn)?shù)據(jù)、圖象數(shù)據(jù)、聲音數(shù)據(jù)都輸入計(jì)算機(jī)，讓它自己學(xué)習(xí)這些數(shù)據(jù)，學(xué)完以后，就可以生成各種圖片和語(yǔ)言，這就是一個(gè)基礎(chǔ)模型。在這個(gè)模型的基礎(chǔ)上，可以形成各種各樣的垂直應(yīng)用。比如，要生成一幅國(guó)畫(huà)，要生成中文，要生成一部醫(yī)學(xué)文獻(xiàn)，要生成一個(gè)戲劇劇本，都可以通過(guò)輸入特別的樣本，對(duì)基礎(chǔ)模型進(jìn)行微調(diào)，來(lái)形成相關(guān)的應(yīng)用。

所以，大模型的發(fā)展在ChatGPT誕生以后呈現(xiàn)出指數(shù)級(jí)的上升。國(guó)內(nèi)也產(chǎn)生了很多的大模型，幾乎每天誕生一個(gè)，出現(xiàn)了爆發(fā)式增長(zhǎng)。

『為什么語(yǔ)言模型如此重要』

有人說(shuō)，ChatGPT不就是一個(gè)人工智能的語(yǔ)言對(duì)話系統(tǒng)嘛，為什么它如此重要？談到它的重要性，要從兩篇文章講起。

第一篇文章是《計(jì)算機(jī)械與智能》，其作者是大名鼎鼎的英國(guó)計(jì)算機(jī)科學(xué)家、被譽(yù)為“人工智能之父”的圖靈。還有一篇是“控制論之父”、美國(guó)數(shù)學(xué)家維納發(fā)表的文章《人有人的用處——控制論與社會(huì)》。這兩篇文章都是1950年發(fā)表的，可以說(shuō)，它們開(kāi)啟了人工智能的研究之路。

圖靈說(shuō)：機(jī)器有沒(méi)有智能？怎么界定機(jī)器的智能呢？一個(gè)比較好的界定方法就是，當(dāng)一個(gè)機(jī)器跟人對(duì)話的時(shí)候，你不能分辨對(duì)話者是機(jī)器還是人，這就表明機(jī)器有了智能。這個(gè)測(cè)試方法被稱為“圖靈測(cè)試”。所以，語(yǔ)言是界定人工智能是否具有智能的一個(gè)重要標(biāo)準(zhǔn)。

維納在文章中提出了兩個(gè)問(wèn)題。首先，他認(rèn)為機(jī)器一定會(huì)具有智能，當(dāng)機(jī)器具有智能以后，人和機(jī)器在社會(huì)中共存的一個(gè)重要形式就是人機(jī)互相交流、互相對(duì)話。其次，這樣的機(jī)器是怎么產(chǎn)生的？維納第一次提出，當(dāng)復(fù)雜度達(dá)到一定程度時(shí)，機(jī)器會(huì)“涌現(xiàn)”出這樣的智能。

為什么圖靈會(huì)用語(yǔ)言來(lái)界定機(jī)器是否具有智能呢？奧地利哲學(xué)家維特根斯坦有一句名言：“我語(yǔ)言的邊界，就是我世界的邊界。”語(yǔ)言不僅是交流的工具，更重要的是，語(yǔ)言是思想的體現(xiàn)。語(yǔ)言是我們對(duì)世界的“表達(dá)模型”，語(yǔ)言是對(duì)客觀世界的主觀編碼。從這個(gè)意義上來(lái)講，語(yǔ)言的重要性非同尋常，計(jì)算機(jī)能夠講人類(lèi)的語(yǔ)言，就意味著它有了和我們相似的智能。

此外，語(yǔ)言還決定了思維方式。如果語(yǔ)言不同的話，我們的思維方式也會(huì)不一樣。有一部著名的科幻電影叫作《降臨》，是根據(jù)美國(guó)華裔科幻作家姜峰楠的小說(shuō)改編的。電影講了一個(gè)道理，那就是語(yǔ)言對(duì)思維具有非常重要的作用。一群外星人乘坐飛船來(lái)到地球，跟我們交流，但我們不懂他們的語(yǔ)言。后來(lái)有一位語(yǔ)言學(xué)家通過(guò)學(xué)習(xí)對(duì)方的文字，終于理解了他們。原來(lái)，他們的語(yǔ)言是非線性的，因此他們的思維也是非線性的，可以超越時(shí)空的限制。所以說(shuō)，語(yǔ)言非常重要，如果機(jī)器學(xué)會(huì)了人類(lèi)的語(yǔ)言，也就學(xué)會(huì)了人類(lèi)的思維。

還有更重要的一點(diǎn)，人類(lèi)的語(yǔ)言不僅僅是思維的編碼，人類(lèi)的語(yǔ)言還有感情，還有能量。比如，我現(xiàn)在跟大家講話，其中就充滿了能量，我想表達(dá)我的理念，也希望你們能夠接受我的理念，因此就有一種能量的傳播。人類(lèi)語(yǔ)言的精髓在于，語(yǔ)言的內(nèi)涵是信息，語(yǔ)言的外延是能量。

以上就是人工智能的語(yǔ)言模型如此重要的原因。

『大模型未來(lái)的發(fā)展趨勢(shì)』

大模型到底是什么？語(yǔ)言大模型是互聯(lián)網(wǎng)的信息壓縮和提煉。它是所有互聯(lián)網(wǎng)信息的一個(gè)壓縮、一個(gè)編碼，通過(guò)這個(gè)編碼，可以生成語(yǔ)言、文本、圖片等。

隨著大模型的進(jìn)一步發(fā)展，它現(xiàn)在可以做什么呢？我們把各種各樣不同的信息——語(yǔ)言、圖像、文本進(jìn)行輸入，通過(guò)編碼對(duì)齊，可以得到多模態(tài)的結(jié)果。比如，我們給ChatGPT看一張圖，然后問(wèn)它可以用圖片上的這些原料做什么。它通過(guò)判別，發(fā)現(xiàn)圖片中有雞蛋、牛奶、面粉等，然后它會(huì)告訴你，用這些原料可以做煎餅、吐司、蛋糕、面包、餅干等等。這是一個(gè)典型的例子，現(xiàn)在的大模型越來(lái)越傾向于多模態(tài)，由多種數(shù)據(jù)協(xié)同推理。

未來(lái)，大模型的發(fā)展趨勢(shì)是什么？在我看來(lái)，大模型發(fā)展的必然趨勢(shì)是擬人化，越來(lái)越像人。從輸入來(lái)說(shuō)，它不僅會(huì)聽(tīng)，還能看；從模型來(lái)講，現(xiàn)在它會(huì)理解，慢慢地它還會(huì)思辨。思辨和理解是不一樣的，思辨需要有價(jià)值觀，它會(huì)跟你辯論，它知道什么是對(duì)的、什么是錯(cuò)的，而且會(huì)向你證明。不像現(xiàn)在的ChatGPT，你問(wèn)問(wèn)題，機(jī)器回答你而已，未來(lái)發(fā)展更重要的一步是，它可以問(wèn)你問(wèn)題，甚至反駁你的問(wèn)題，也就是說(shuō)它有自己的價(jià)值觀，自由意志；從輸出方面來(lái)說(shuō)，它不僅會(huì)表達(dá)，未來(lái)還會(huì)有行動(dòng)。這就是具身智能，它可以行動(dòng)，比如看見(jiàn)東西要掉下去了，機(jī)器知道怎樣把它接住。未來(lái)，計(jì)算機(jī)科學(xué)會(huì)變成機(jī)器行為學(xué)，這是我們需要研究的一個(gè)重要方向?？偠灾?，人工智能會(huì)越來(lái)越融入我們的生活。

那么，現(xiàn)在的人工智能已經(jīng)發(fā)展到了什么樣的水平？2013年的時(shí)候有一部非常有名的電影叫作《她》，講述了人與人工智能相愛(ài)的科幻故事。電影中的人工智能不僅能對(duì)話，而且還有感情，使得男主角愛(ài)上了她?，F(xiàn)實(shí)和電影的距離正在拉近。2024年5月14日，OpenAI公司發(fā)布了GPT-4o，現(xiàn)在的GPT已經(jīng)有了情緒對(duì)話的能力，它甚至可以打斷你，雖然它還沒(méi)有跟人辯論的能力，但它已經(jīng)能夠打斷你了。它可以在短至232毫秒、平均320毫秒的時(shí)間內(nèi)對(duì)音頻輸入做出反應(yīng)，這幾乎已經(jīng)跟人一樣了。

『我們現(xiàn)在應(yīng)該做什么』

我們?cè)谙愀圻M(jìn)行生成式人工智能的研究，但我們的做法跟國(guó)內(nèi)不太一樣。在香港，我們不是做很多模型，我們只做一個(gè)基礎(chǔ)模型，主要是為香港的人工智能企業(yè)和香港社會(huì)服務(wù)，各種研究機(jī)構(gòu)、企業(yè)、創(chuàng)新公司都可以到這個(gè)平臺(tái)上進(jìn)行開(kāi)發(fā)、應(yīng)用。這個(gè)基礎(chǔ)模型叫“香港仔（HKGAI）”。它有語(yǔ)言系統(tǒng)，可以對(duì)話；也可以寫(xiě)作，學(xué)生、政府官員都可以用它來(lái)進(jìn)行寫(xiě)作；還可以做一些多模態(tài)的工作，比如用一個(gè)人的圖片生成動(dòng)畫(huà)。

最后，我來(lái)講講人工智能的技術(shù)挑戰(zhàn)。技術(shù)挑戰(zhàn)包括三個(gè)方面，一個(gè)是算法，一個(gè)是數(shù)據(jù)，一個(gè)是算力。

從數(shù)據(jù)來(lái)講，最大的問(wèn)題是我們幾乎已經(jīng)窮盡了數(shù)據(jù)，我們把世界上幾乎所有的數(shù)據(jù)都拿來(lái)訓(xùn)練大模型了，數(shù)據(jù)總是有限的，但我們需要更多的數(shù)據(jù)、更多的信息來(lái)訓(xùn)練大模型。

從算力來(lái)講，有一個(gè)叫作擴(kuò)展律的概念，就是說(shuō)能力越大，效能越好，但是算力總是有限的，而且我們目前還受到芯片的制約。

從算法來(lái)講，主要有三個(gè)問(wèn)題。首先，我們需要研究怎樣避免重復(fù)的學(xué)習(xí)，怎樣保證大模型對(duì)新的數(shù)據(jù)不進(jìn)行重復(fù)訓(xùn)練。其次，數(shù)據(jù)不是沒(méi)有了，而是被壓縮了，既然模型是數(shù)據(jù)的完美壓縮，那么高階的學(xué)習(xí)將是在模型上的學(xué)習(xí)。最后，機(jī)器智能和人類(lèi)智能的培養(yǎng)實(shí)際上具有兩極性，也就是機(jī)器智能和人類(lèi)智能的培養(yǎng)、訓(xùn)練方法是相反的。人是怎么培養(yǎng)的呢？我們小時(shí)候培養(yǎng)的是童心、好奇心，然后培養(yǎng)價(jià)值觀，了解什么是好的、什么是壞的、什么事情是有價(jià)值的、什么事情是不能做的。再后來(lái)學(xué)習(xí)書(shū)本知識(shí)，最后是積累社會(huì)經(jīng)驗(yàn)。而人工智能是反過(guò)來(lái)的，一開(kāi)始，不管三七二十一把所有的數(shù)據(jù)都給它，訓(xùn)練一個(gè)通用大模型，然后進(jìn)一步垂直化，微調(diào)一個(gè)個(gè)系統(tǒng)，完了之后發(fā)現(xiàn)所有的東西都沒(méi)有價(jià)值觀，沒(méi)有思考的能力，所以再開(kāi)始學(xué)習(xí)價(jià)值觀，而最難的是把所有的東西抽象成一個(gè)個(gè)常識(shí)和概念。所以，未來(lái)算法最具有挑戰(zhàn)性的是，怎樣讓機(jī)器學(xué)會(huì)價(jià)值觀，怎樣讓機(jī)器學(xué)會(huì)常識(shí)，并且，怎樣讓機(jī)器記得住、用得上這些常識(shí)。

最后，我想對(duì)上海人工智能的發(fā)展提幾點(diǎn)建議。我認(rèn)為，大模型是一個(gè)基礎(chǔ)設(shè)施，就像地鐵，它是一個(gè)公共開(kāi)發(fā)的平臺(tái)，只做一個(gè)基礎(chǔ)大模型就好，做很多的話會(huì)重復(fù)。因此，要建設(shè)一個(gè)上?；A(chǔ)大模型，形成產(chǎn)業(yè)生態(tài)，可以在這個(gè)公共平臺(tái)上開(kāi)發(fā)各種不同的垂直應(yīng)用和社會(huì)服務(wù)，在教育、政務(wù)、醫(yī)學(xué)、金融、文創(chuàng)等領(lǐng)域做出世界水平的應(yīng)用實(shí)例。更重要的是，以上海豐富的學(xué)術(shù)資源為基礎(chǔ)，進(jìn)一步加強(qiáng)基礎(chǔ)研究，研究新的算法。最后，千萬(wàn)不要忘了，人工智能的治理非常重要，上海作為國(guó)際化大都市，應(yīng)當(dāng)建立一個(gè)開(kāi)放性的人工智能治理研究機(jī)構(gòu)，以上海的人工智能應(yīng)用為背景，做出人工智能治理的國(guó)際典范。

今天，我們?cè)絹?lái)越把機(jī)器做成人的樣子，未來(lái)，我們的社會(huì)將會(huì)由三種人構(gòu)成，那就是男人+女人+機(jī)器人，而我們的社會(huì)還沒(méi)有為此做好準(zhǔn)備。我想，做好人工智能治理的研究工作，把人工智能融入我們的社會(huì)、融入我們的生活，這將是我們?yōu)槿祟?lèi)所做的很大的貢獻(xiàn)。謝謝?。ㄈ珗?chǎng)掌聲）

欄目主編：龔丹韻

文字編輯：徐蓓

本文作者：郭毅可