在近日舉行的解放日報第79屆文化講壇上,香港科技大學(xué)首席副校長郭毅可做了主題演講。他在現(xiàn)場提出了一個有趣的問題——“如果大模型是答案,什么是問題”。他分析了當前大模型發(fā)展面臨的技術(shù)挑戰(zhàn)、未來大模型發(fā)展的必然趨勢,分享了香港打造人工智能生態(tài)系統(tǒng)的經(jīng)驗,并對上海的人工智能發(fā)展提出了建議。以下是演講主要內(nèi)容。
英國皇家工程院院士、香港科技大學(xué)首席副校長郭毅可在演講中。 海沙爾攝
郭毅可
英國皇家工程院院士、歐洲科學(xué)院院士、IEEE(美國電氣電子工程師學(xué)會)會士,香港科技大學(xué)首席副校長。作為國際知名的計算機科學(xué)家,他的主要研究領(lǐng)域為機器學(xué)習(xí)與數(shù)據(jù)挖掘,在機器學(xué)習(xí)算法及醫(yī)學(xué)大數(shù)據(jù)分析系統(tǒng)、人工智能藝術(shù)等領(lǐng)域作出了重要貢獻。
大家好!我還是講普通話,講上海閑話交關(guān)人聽不懂(上海話)。非常有幸,能夠在家鄉(xiāng)上海的舞臺上演講。我小時候家里訂的報紙就是《解放日報》,所以今天《解放日報》向我發(fā)出邀請,我肯定會來(臺下發(fā)出笑聲)。
人工智能已經(jīng)深入人心。我也沒有想到,我原來以為這個世界上有男人和女人就夠了,現(xiàn)在還要加上機器人。我今天演講的主題是:如果大模型是答案,那么什么是問題。我來講一講,人工智能的飛躍現(xiàn)在剛剛開始,它未來會怎么發(fā)展。
『人工智能可以做什么』
首先,人工智能得以發(fā)展,是因為有了一項偉大的技術(shù),叫作神經(jīng)元網(wǎng)絡(luò)。人工智能主要是通過神經(jīng)元網(wǎng)絡(luò)來模擬人腦。
1942年,奧地利心理學(xué)家赫布發(fā)表了一篇重要的文章,其中講了大腦神經(jīng)元的連接原理。當大腦受到刺激以后,大腦中的一些神經(jīng)元就會發(fā)生連接,如果不斷刺激它的話,這些連接會越來越強。神經(jīng)元的連接實際上是刺激的結(jié)果,如果把學(xué)習(xí)看作一種刺激,那么神經(jīng)元之間的連接就是學(xué)習(xí)的表現(xiàn)。神經(jīng)元網(wǎng)絡(luò)就是一種模仿大腦神經(jīng)元之間連接的計算模型。我們不斷地給它輸入數(shù)據(jù),為的是構(gòu)造不同神經(jīng)元網(wǎng)絡(luò)的連接。神經(jīng)元網(wǎng)絡(luò)的連接由代表連接的強度的參數(shù)來表達,在學(xué)習(xí)的過程中,我們不斷去改變連接的強度,從而使模型的輸出能夠滿足我們的要求。總而言之,這是一種用神經(jīng)元網(wǎng)絡(luò)來模仿大腦學(xué)習(xí)過程的機制。
那么,人工智能可以做什么事情呢?簡單來說可以做兩類事情。
第一類是判別。判別就是區(qū)分不同,區(qū)分不同是預(yù)測的基礎(chǔ)。要知道數(shù)據(jù)是屬于哪一類,先進行數(shù)據(jù)標注,用標注好的數(shù)據(jù)來訓(xùn)練模型。 有了模型,輸入一個不知類別的數(shù)據(jù)后,模型可以根據(jù)特征判定它屬于哪一類,這叫判別。比如,圖象識別就是一種典型的判別。人臉識別,模型看了很多人的臉以后,這個人是男的還是女的、年輕的還是年老的,根據(jù)特征就可以進行判別。
另一類是生成。生成的順序和判別正好相反。不需要數(shù)據(jù)標注,我們把所有的數(shù)據(jù)都輸入計算機,它自己來總結(jié)數(shù)據(jù)的特征,再把這個數(shù)據(jù)進行聚類,有了類別以后,我們就可以要求計算機生成某一種類別的東西。比如,我要計算機生成一棵樹,因為模型知道樹的特征,它就可以生成一棵它沒有見過的樹,這就是生成式的人工智能。生成式的人工智能是如今人工智能的主流。以前我們?yōu)槭裁醋霾坏侥兀恳驗橐郧拔覀儧]有這么大的計算機,那么多的數(shù)據(jù),也沒有這么好的算法。今天我們有了這么大的計算機,有了這么多的數(shù)據(jù),我們可以把全世界所有的文字輸入計算機,它就會總結(jié)出語言的特征,并根據(jù)語言的特征生成文字。
有了這個生成式的大模型,人工智能被改變了。原來的人工智能都是解決具體問題的。比如要下圍棋,就做一個下圍棋的模型。比如要研究蛋白質(zhì)折疊的問題,就做一個相關(guān)的模型。而現(xiàn)在,我們做的是一個基礎(chǔ)模型。把所有在互聯(lián)網(wǎng)上可以獲得的文字數(shù)據(jù)、圖象數(shù)據(jù)、聲音數(shù)據(jù)都輸入計算機,讓它自己學(xué)習(xí)這些數(shù)據(jù),學(xué)完以后,就可以生成各種圖片和語言,這就是一個基礎(chǔ)模型。在這個模型的基礎(chǔ)上,可以形成各種各樣的垂直應(yīng)用。比如,要生成一幅國畫,要生成中文,要生成一部醫(yī)學(xué)文獻,要生成一個戲劇劇本,都可以通過輸入特別的樣本,對基礎(chǔ)模型進行微調(diào),來形成相關(guān)的應(yīng)用。
所以,大模型的發(fā)展在ChatGPT誕生以后呈現(xiàn)出指數(shù)級的上升。國內(nèi)也產(chǎn)生了很多的大模型,幾乎每天誕生一個,出現(xiàn)了爆發(fā)式增長。
『為什么語言模型如此重要』
有人說,ChatGPT不就是一個人工智能的語言對話系統(tǒng)嘛,為什么它如此重要?談到它的重要性,要從兩篇文章講起。
第一篇文章是《計算機械與智能》,其作者是大名鼎鼎的英國計算機科學(xué)家、被譽為“人工智能之父”的圖靈。還有一篇是“控制論之父”、美國數(shù)學(xué)家維納發(fā)表的文章《人有人的用處——控制論與社會》。這兩篇文章都是1950年發(fā)表的,可以說,它們開啟了人工智能的研究之路。
圖靈說:機器有沒有智能?怎么界定機器的智能呢?一個比較好的界定方法就是,當一個機器跟人對話的時候,你不能分辨對話者是機器還是人,這就表明機器有了智能。這個測試方法被稱為“圖靈測試”。所以,語言是界定人工智能是否具有智能的一個重要標準。
維納在文章中提出了兩個問題。首先,他認為機器一定會具有智能,當機器具有智能以后,人和機器在社會中共存的一個重要形式就是人機互相交流、互相對話。其次,這樣的機器是怎么產(chǎn)生的?維納第一次提出,當復(fù)雜度達到一定程度時,機器會“涌現(xiàn)”出這樣的智能。
為什么圖靈會用語言來界定機器是否具有智能呢?奧地利哲學(xué)家維特根斯坦有一句名言:“我語言的邊界,就是我世界的邊界。”語言不僅是交流的工具,更重要的是,語言是思想的體現(xiàn)。語言是我們對世界的“表達模型”,語言是對客觀世界的主觀編碼。從這個意義上來講,語言的重要性非同尋常,計算機能夠講人類的語言,就意味著它有了和我們相似的智能。
此外,語言還決定了思維方式。如果語言不同的話,我們的思維方式也會不一樣。有一部著名的科幻電影叫作《降臨》,是根據(jù)美國華裔科幻作家姜峰楠的小說改編的。電影講了一個道理,那就是語言對思維具有非常重要的作用。一群外星人乘坐飛船來到地球,跟我們交流,但我們不懂他們的語言。后來有一位語言學(xué)家通過學(xué)習(xí)對方的文字,終于理解了他們。原來,他們的語言是非線性的,因此他們的思維也是非線性的,可以超越時空的限制。所以說,語言非常重要,如果機器學(xué)會了人類的語言,也就學(xué)會了人類的思維。
還有更重要的一點,人類的語言不僅僅是思維的編碼,人類的語言還有感情,還有能量。比如,我現(xiàn)在跟大家講話,其中就充滿了能量,我想表達我的理念,也希望你們能夠接受我的理念,因此就有一種能量的傳播。人類語言的精髓在于,語言的內(nèi)涵是信息,語言的外延是能量。
以上就是人工智能的語言模型如此重要的原因。
『大模型未來的發(fā)展趨勢』
大模型到底是什么?語言大模型是互聯(lián)網(wǎng)的信息壓縮和提煉。它是所有互聯(lián)網(wǎng)信息的一個壓縮、一個編碼,通過這個編碼,可以生成語言、文本、圖片等。
隨著大模型的進一步發(fā)展,它現(xiàn)在可以做什么呢?我們把各種各樣不同的信息——語言、圖像、文本進行輸入,通過編碼對齊,可以得到多模態(tài)的結(jié)果。比如,我們給ChatGPT看一張圖,然后問它可以用圖片上的這些原料做什么。它通過判別,發(fā)現(xiàn)圖片中有雞蛋、牛奶、面粉等,然后它會告訴你,用這些原料可以做煎餅、吐司、蛋糕、面包、餅干等等。這是一個典型的例子,現(xiàn)在的大模型越來越傾向于多模態(tài),由多種數(shù)據(jù)協(xié)同推理。
未來,大模型的發(fā)展趨勢是什么?在我看來,大模型發(fā)展的必然趨勢是擬人化,越來越像人。從輸入來說,它不僅會聽,還能看;從模型來講,現(xiàn)在它會理解,慢慢地它還會思辨。思辨和理解是不一樣的,思辨需要有價值觀,它會跟你辯論,它知道什么是對的、什么是錯的,而且會向你證明。不像現(xiàn)在的ChatGPT,你問問題,機器回答你而已,未來發(fā)展更重要的一步是,它可以問你問題,甚至反駁你的問題,也就是說它有自己的價值觀,自由意志;從輸出方面來說,它不僅會表達,未來還會有行動。這就是具身智能,它可以行動,比如看見東西要掉下去了,機器知道怎樣把它接住。未來,計算機科學(xué)會變成機器行為學(xué),這是我們需要研究的一個重要方向??偠灾?,人工智能會越來越融入我們的生活。
那么,現(xiàn)在的人工智能已經(jīng)發(fā)展到了什么樣的水平?2013年的時候有一部非常有名的電影叫作《她》,講述了人與人工智能相愛的科幻故事。電影中的人工智能不僅能對話,而且還有感情,使得男主角愛上了她?,F(xiàn)實和電影的距離正在拉近。2024年5月14日,OpenAI公司發(fā)布了GPT-4o,現(xiàn)在的GPT已經(jīng)有了情緒對話的能力,它甚至可以打斷你,雖然它還沒有跟人辯論的能力,但它已經(jīng)能夠打斷你了。它可以在短至232毫秒、平均320毫秒的時間內(nèi)對音頻輸入做出反應(yīng),這幾乎已經(jīng)跟人一樣了。
『我們現(xiàn)在應(yīng)該做什么』
我們在香港進行生成式人工智能的研究,但我們的做法跟國內(nèi)不太一樣。在香港,我們不是做很多模型,我們只做一個基礎(chǔ)模型,主要是為香港的人工智能企業(yè)和香港社會服務(wù),各種研究機構(gòu)、企業(yè)、創(chuàng)新公司都可以到這個平臺上進行開發(fā)、應(yīng)用。這個基礎(chǔ)模型叫“香港仔(HKGAI)”。它有語言系統(tǒng),可以對話;也可以寫作,學(xué)生、政府官員都可以用它來進行寫作;還可以做一些多模態(tài)的工作,比如用一個人的圖片生成動畫。
最后,我來講講人工智能的技術(shù)挑戰(zhàn)。技術(shù)挑戰(zhàn)包括三個方面,一個是算法,一個是數(shù)據(jù),一個是算力。
從數(shù)據(jù)來講,最大的問題是我們幾乎已經(jīng)窮盡了數(shù)據(jù),我們把世界上幾乎所有的數(shù)據(jù)都拿來訓(xùn)練大模型了,數(shù)據(jù)總是有限的,但我們需要更多的數(shù)據(jù)、更多的信息來訓(xùn)練大模型。
從算力來講,有一個叫作擴展律的概念,就是說能力越大,效能越好,但是算力總是有限的,而且我們目前還受到芯片的制約。
從算法來講,主要有三個問題。首先,我們需要研究怎樣避免重復(fù)的學(xué)習(xí),怎樣保證大模型對新的數(shù)據(jù)不進行重復(fù)訓(xùn)練。其次,數(shù)據(jù)不是沒有了,而是被壓縮了,既然模型是數(shù)據(jù)的完美壓縮,那么高階的學(xué)習(xí)將是在模型上的學(xué)習(xí)。最后,機器智能和人類智能的培養(yǎng)實際上具有兩極性,也就是機器智能和人類智能的培養(yǎng)、訓(xùn)練方法是相反的。人是怎么培養(yǎng)的呢?我們小時候培養(yǎng)的是童心、好奇心,然后培養(yǎng)價值觀,了解什么是好的、什么是壞的、什么事情是有價值的、什么事情是不能做的。再后來學(xué)習(xí)書本知識,最后是積累社會經(jīng)驗。而人工智能是反過來的,一開始,不管三七二十一把所有的數(shù)據(jù)都給它,訓(xùn)練一個通用大模型,然后進一步垂直化,微調(diào)一個個系統(tǒng),完了之后發(fā)現(xiàn)所有的東西都沒有價值觀,沒有思考的能力,所以再開始學(xué)習(xí)價值觀,而最難的是把所有的東西抽象成一個個常識和概念。所以,未來算法最具有挑戰(zhàn)性的是,怎樣讓機器學(xué)會價值觀,怎樣讓機器學(xué)會常識,并且,怎樣讓機器記得住、用得上這些常識。
最后,我想對上海人工智能的發(fā)展提幾點建議。我認為,大模型是一個基礎(chǔ)設(shè)施,就像地鐵,它是一個公共開發(fā)的平臺,只做一個基礎(chǔ)大模型就好,做很多的話會重復(fù)。因此,要建設(shè)一個上?;A(chǔ)大模型,形成產(chǎn)業(yè)生態(tài),可以在這個公共平臺上開發(fā)各種不同的垂直應(yīng)用和社會服務(wù),在教育、政務(wù)、醫(yī)學(xué)、金融、文創(chuàng)等領(lǐng)域做出世界水平的應(yīng)用實例。更重要的是,以上海豐富的學(xué)術(shù)資源為基礎(chǔ),進一步加強基礎(chǔ)研究,研究新的算法。最后,千萬不要忘了,人工智能的治理非常重要,上海作為國際化大都市,應(yīng)當建立一個開放性的人工智能治理研究機構(gòu),以上海的人工智能應(yīng)用為背景,做出人工智能治理的國際典范。
今天,我們越來越把機器做成人的樣子,未來,我們的社會將會由三種人構(gòu)成,那就是男人+女人+機器人,而我們的社會還沒有為此做好準備。我想,做好人工智能治理的研究工作,把人工智能融入我們的社會、融入我們的生活,這將是我們?yōu)槿祟愃龅暮艽蟮呢暙I。謝謝?。ㄈ珗稣坡暎?/p>
欄目主編:龔丹韻
文字編輯:徐蓓
本文作者:郭毅可