|
|
來(lái)自俄羅斯的聲音:尋求中俄兩國(guó)科學(xué)領(lǐng)域的協(xié)同發(fā)展 |
|
《中國(guó)科學(xué)報(bào)》記者計(jì)紅梅
9月24日至26日,2024 CCF全國(guó)高性能計(jì)算學(xué)術(shù)年會(huì)(CCF HPC China 2024)在湖北省武漢市舉行。俄羅斯科學(xué)院院士、馬爾丘克數(shù)值數(shù)學(xué)研究所所長(zhǎng)葉夫根尼·季爾季什尼科夫(Evgeny Tyrtyshnikov)參加了本次年會(huì)。
據(jù)悉,葉夫根尼·季爾季什尼科夫曾于去年獲得了俄羅斯最大商業(yè)銀行——俄羅斯儲(chǔ)蓄銀行(Sber)頒發(fā)的科學(xué)獎(jiǎng)。會(huì)議前夕,《中國(guó)科學(xué)報(bào)》記者采訪了季爾季什尼科夫以及Sber科學(xué)獎(jiǎng)組委會(huì)成員——Sber副總裁、研究與創(chuàng)新部門負(fù)責(zé)人艾伯特·埃菲莫夫(Albert Efimov)。在專訪中,季爾季什尼科夫表示,他此次參會(huì)一方面是來(lái)學(xué)習(xí)和了解一些前沿信息,另一方面也希望分享俄羅斯在高性能計(jì)算(High Performance Computing,HPC)和人工智能(AI)方面的成果,加強(qiáng)與中國(guó)同行的交流與合作。埃菲莫夫則表示,希望能夠在高性能計(jì)算和人工智能領(lǐng)域?qū)ふ业街袊?guó)和俄羅斯科學(xué)家都感興趣并愿意為之努力的方向,深化彼此間的合作。
數(shù)學(xué)可以為HPC做什么,為人工智能帶來(lái)什么?
季爾季什尼科夫的主要研究領(lǐng)域是線性代數(shù)、矩陣方法及其應(yīng)用,這些領(lǐng)域影了大量涉及復(fù)雜計(jì)算的應(yīng)用問(wèn)題。這些似乎是“簡(jiǎn)單的科學(xué)”,大學(xué)生們通常由此開(kāi)始數(shù)學(xué)學(xué)習(xí),這些領(lǐng)域中的問(wèn)題似乎都已經(jīng)解決了,但實(shí)際上并不是這樣。季爾季什尼科夫舉例說(shuō):“想象一下,你需要解一個(gè)線性方程組,其中未知數(shù)和方程的數(shù)量為10的83次方,等同于宇宙中的總原子數(shù)量。如何才能做到這一點(diǎn)呢?事實(shí)證明,在大學(xué)里線性代數(shù)學(xué)得再好也沒(méi)有用,借助經(jīng)典方法,這種‘天文數(shù)字’的問(wèn)題看似毫無(wú)解決的希望。”
季爾季什尼科夫表示,其研究的主要目標(biāo)是幫助現(xiàn)代超級(jí)計(jì)算機(jī)用其特殊的數(shù)量較小的參數(shù)表示來(lái)取代“天文數(shù)字般大”的數(shù)據(jù)數(shù)組,并提供基于這些表示的高效計(jì)算算法。這是對(duì)某種通用計(jì)算范例的實(shí)現(xiàn)的研究,它補(bǔ)充了經(jīng)典線性代數(shù)計(jì)算的成熟模型。
隨著科學(xué)技術(shù)的發(fā)展,越來(lái)越多的領(lǐng)域需要進(jìn)行大規(guī)模、高復(fù)雜度的計(jì)算,如天氣預(yù)測(cè)、生物信息分析、物理和水動(dòng)力模擬等。HPC作為解決這些計(jì)算問(wèn)題的關(guān)鍵技術(shù),越來(lái)越受到人們的關(guān)注。這其中,旨在最大限度地利用計(jì)算資源、提高計(jì)算效率的高效算法和軟件,以及能夠執(zhí)行多個(gè)任務(wù)或操作的并行計(jì)算方法,成為發(fā)展HPC的重中之重。而這也正是季爾季什尼科夫?yàn)閿?shù)學(xué)和HPC找到的“結(jié)合點(diǎn)”。
葉夫根尼·季爾季什尼科夫
俄羅斯科學(xué)院院士,物理學(xué)與數(shù)學(xué)博士
俄羅斯科學(xué)院馬爾丘克數(shù)值數(shù)學(xué)研究所所長(zhǎng)
他介紹說(shuō),早在1980年,俄羅斯科學(xué)家馬爾丘克院士就提出“將算法映射到計(jì)算機(jī)系統(tǒng)的體系結(jié)構(gòu)上”這一重要思路。在他之后,研究HPC高效算法和并行計(jì)算技術(shù)的俄羅斯科學(xué)家越來(lái)越多,并為此在國(guó)內(nèi)外舉辦了很多研討會(huì),積極探索解決辦法。2023年,季爾季什尼科夫獲得Sber科學(xué)獎(jiǎng)。談及獲獎(jiǎng)理由,季爾季什尼科夫坦言,這主要是由于他對(duì)矩陣和張量方法發(fā)展所做出的貢獻(xiàn),特別是因?yàn)樗l(fā)明了“張量火車”(Tensor Trains,TT)?!?這些方法可以解決那些甚至超出了現(xiàn)代超級(jí)計(jì)算機(jī)處理能力的問(wèn)題。其關(guān)鍵思想是使用特殊模型來(lái)表示基于低秩矩陣的多維數(shù)組(張量)?!比缃?,這一方法已經(jīng)得到包括中國(guó)機(jī)構(gòu)在內(nèi)的全球數(shù)十個(gè)甚至數(shù)百個(gè)研究團(tuán)隊(duì)使用。
他介紹說(shuō),其中一個(gè)成就是訓(xùn)練此類模型的有效方法,允許通過(guò)極少量的數(shù)組元素獲得模型參數(shù)。緊湊數(shù)據(jù)表示模型必須具有一個(gè)重要的屬性,即除了數(shù)據(jù)壓縮之外,還需要高效、可靠的算法來(lái)計(jì)算該模型的格式。此外,他成功組建了一支由年輕研究人員組成的強(qiáng)大團(tuán)隊(duì)。正是在計(jì)算數(shù)學(xué)研究所,該團(tuán)隊(duì)在2009 年開(kāi)發(fā)出一個(gè)非常成功的多維矩陣低參數(shù)表示模型 – 一個(gè)張量火車。我們使用英文縮寫 TT(Tensor Train,張量火車)來(lái)表示這個(gè)模型。
“在張量火車的情況下,我們有一個(gè)驚人的算法,其性質(zhì)類似于使用著名的奇異值分解(SVD)算法獲得近似值。其計(jì)算復(fù)雜度依賴于‘車’的大小,線性依賴于數(shù)組的維數(shù),同時(shí)保證了對(duì)近似精度的良好估計(jì)。一個(gè)特殊的成就是基于數(shù)組元素近似構(gòu)造張量火車的交叉算法,數(shù)組元素的數(shù)量與其元素總數(shù)相比可以忽略不計(jì)?!奔緺柤臼材峥品蛘f(shuō)。
目前,有關(guān)此類方法的數(shù)學(xué)理論獲得了積極的發(fā)展,同時(shí)其實(shí)際應(yīng)用在過(guò)去15年來(lái)也表現(xiàn)出了驚人的效率。在此基礎(chǔ)上,他們成功構(gòu)建了一種用于全局優(yōu)化的新型啟發(fā)式算法,該算法與遺傳算法相比具有相當(dāng)?shù)母?jìng)爭(zhēng)力,在某些情況下甚至更有效,例如在新藥研發(fā)過(guò)程中解決“對(duì)接”(docking)問(wèn)題。
季爾季什尼科夫認(rèn)為,神經(jīng)網(wǎng)絡(luò)與函數(shù)論和近似論中非常深?yuàn)W的數(shù)學(xué)問(wèn)題有關(guān)。安德烈·柯?tīng)柲缏宸蚯蟮昧讼柌氐?3問(wèn)題之解的著名研究可以被認(rèn)為是現(xiàn)代神經(jīng)網(wǎng)絡(luò)的先驅(qū)。這項(xiàng)研究證明了任何多變量的連續(xù)函數(shù)都是通過(guò)一個(gè)變量的函數(shù)和加法的組合來(lái)實(shí)現(xiàn)的。隨后,人們證明了一個(gè)變量的函數(shù)可以通過(guò)將自變量乘以一個(gè)因子和一個(gè)移位,從一個(gè)單一函數(shù)中獲得。目前,已經(jīng)出現(xiàn)了基于柯?tīng)柲缏宸虼隧?xiàng)研究思想建立起來(lái)的神經(jīng)網(wǎng)絡(luò)。它們的潛力仍有待更詳細(xì)的研究。同時(shí),他認(rèn)為人工智能方法的廣泛工程應(yīng)用與數(shù)學(xué)之間存在明顯的差距,數(shù)學(xué)將真正幫助工程師進(jìn)行開(kāi)發(fā)。沒(méi)有數(shù)學(xué)理論可以令人信服地解釋為什么一種或另一種架構(gòu)(例如在大型語(yǔ)言模型中)比另一種架構(gòu)更好或更差。
那么,人工智能方法給數(shù)學(xué)帶來(lái)了什么直接影響呢?季爾季什尼科夫解釋說(shuō):“人工智能方法被用于解決數(shù)學(xué)物理問(wèn)題,例如,優(yōu)化整個(gè)過(guò)程的各個(gè)要素。在我看來(lái),這些方法將有助于解決將算法映射到計(jì)算系統(tǒng)架構(gòu)的問(wèn)題?,F(xiàn)在更準(zhǔn)確地談?wù)撨@些方法的地位還為時(shí)過(guò)早。”
產(chǎn)研合作助力前沿科技發(fā)展
近年來(lái),HPC和AI的結(jié)合正迅速改變著科學(xué)研究和創(chuàng)新領(lǐng)域。人工智能,尤其是以ChatGPT為代表的生成式人工智能(Generative AI)的發(fā)展,更是對(duì)HPC提出了更高的要求,也成為其重要的應(yīng)用領(lǐng)域之一。Sber副總裁艾伯特·埃菲莫夫是該公司研究與創(chuàng)新部門負(fù)責(zé)人,并創(chuàng)辦了其機(jī)器人實(shí)驗(yàn)室。他對(duì)高性能計(jì)算與人工智能及機(jī)器人發(fā)展之間的互動(dòng)與促進(jìn)有著深入的洞察。
在專訪中,埃菲莫夫首先介紹了Sber科學(xué)獎(jiǎng)。該獎(jiǎng)項(xiàng)共包括四大類別,即“物理類”,涵蓋了物理學(xué)、化學(xué)、天文學(xué)、地球科學(xué)、技術(shù)科學(xué);“生命科學(xué)類”,涵蓋了生物學(xué)、醫(yī)學(xué)和農(nóng)業(yè)科學(xué);“數(shù)字宇宙類”,涵蓋了數(shù)學(xué)、計(jì)算機(jī)科學(xué)、信息學(xué);以及“人工智能科學(xué)類”,專門頒發(fā)給35歲以下的年輕科研人員,旨在表彰他們?cè)谌斯ぶ悄茴I(lǐng)域的杰出成就。
艾伯特·埃菲莫夫
Sber副總裁、研究與創(chuàng)新部門負(fù)責(zé)人
?
在談及Sber決定設(shè)立科學(xué)獎(jiǎng)的初衷時(shí),埃菲莫夫表示,Sber目前已經(jīng)成為俄羅斯最大的科技公司,其競(jìng)爭(zhēng)優(yōu)勢(shì)是基于研發(fā)對(duì)科技領(lǐng)域進(jìn)行投資。Sber非常清楚如何進(jìn)行應(yīng)用研究并創(chuàng)造有用的技術(shù)和產(chǎn)品,但對(duì)一家商業(yè)公司來(lái)說(shuō),始終存在一個(gè)難題,即如何支持基礎(chǔ)科學(xué)研究?“我們?cè)O(shè)立Sber科學(xué)獎(jiǎng)的初衷就是為了支持基礎(chǔ)科學(xué)研究?!?埃菲莫夫說(shuō)。
Sber科學(xué)獎(jiǎng)有兩大主要特點(diǎn)。首先,它授予在科學(xué)研究中開(kāi)辟新視野的科學(xué)家。其次,這一獎(jiǎng)項(xiàng)在科學(xué)界有絕對(duì)的權(quán)威性?!斑@兩大特點(diǎn)使得Sber科學(xué)獎(jiǎng)成為年輕科學(xué)家和整個(gè)俄羅斯科學(xué)界在創(chuàng)造全新突破性解決方案,并在此基礎(chǔ)上創(chuàng)造新技術(shù)方面的一個(gè)標(biāo)桿?!卑7颇蛘f(shuō)。
那么,未來(lái)這一獎(jiǎng)項(xiàng)有沒(méi)有可能進(jìn)入國(guó)際舞臺(tái)?對(duì)此,埃菲莫夫表示當(dāng)然可以,但他也認(rèn)為這并不容易。例如,需要確定俄羅斯和中國(guó)科學(xué)家都感興趣和認(rèn)為有用的領(lǐng)域。在他看來(lái),其中一個(gè)領(lǐng)域就是人工智能的研究。
作為俄羅斯目前最大的科技公司,Sber產(chǎn)出了諸多科技成果,涉及人工智能、高性能計(jì)算等多個(gè)方面。在人工智能領(lǐng)域,Sber開(kāi)展了幾十個(gè)不同的項(xiàng)目,應(yīng)用了很多前沿科技,包括生成式人工智能等。埃菲莫夫舉了三個(gè)例子:第一是Sber的生成式人工智能模型系統(tǒng)。Sber將之稱為“GigaChat”。這個(gè)系統(tǒng)可以允許用戶處理文本、圖像和其他類型的數(shù)據(jù)。第二個(gè)例子是Sber的 神經(jīng)網(wǎng)絡(luò)“Kandinsky”(康定斯基)。該模型允許客戶通過(guò)文本描述生成圖像和視頻,同時(shí)該模型還支持中文。第三個(gè)例子是一個(gè)氣候模型。由于全球變暖已經(jīng)成為目前世界面臨的主要威脅,因此基于AI技術(shù)創(chuàng)建了一個(gè)氣候模型,能夠預(yù)測(cè)氣候風(fēng)險(xiǎn)。
Kandinsky生成的圖片
?
之所以有如此多的產(chǎn)出,埃菲莫夫介紹說(shuō),是因?yàn)镾ber有兩大研發(fā)機(jī)制。其一是內(nèi)部機(jī)制,由Sber自有的實(shí)驗(yàn)室組成,涉及從人工智能、機(jī)器人到量子計(jì)算、區(qū)塊鏈等多個(gè)研究領(lǐng)域。其二是外部機(jī)制。Sber與俄羅斯國(guó)內(nèi)7所最大且最負(fù)盛名的大學(xué)的人工智能中心均有合作,與幾乎所有Sber重視的領(lǐng)域名列前茅的科學(xué)家都建立了聯(lián)系?!?這為我們?cè)诨A(chǔ)應(yīng)用科學(xué)領(lǐng)域加強(qiáng)俄羅斯和中國(guó)的合作提供了獨(dú)特的機(jī)會(huì)?!?/p>
在埃菲莫夫看來(lái),當(dāng)下,機(jī)器人技術(shù)和AI以兩種方式聯(lián)系在一起。首先,AI可用的數(shù)據(jù)幾乎已經(jīng)耗盡。未來(lái)大模型數(shù)據(jù)只能通過(guò)與物理世界的交互才能獲得。因此,機(jī)器人技術(shù)為AI在物理世界中交互和學(xué)習(xí)提供了機(jī)會(huì)。其次,AI使機(jī)器人能夠做出更聰明的決策,從而使機(jī)器人成為人類可靠和安全的助手?!霸趶?fù)雜而動(dòng)態(tài)的環(huán)境中,只有人工智能才能幫助機(jī)器人為人類執(zhí)行有用的功能?!彼f(shuō)。
積極尋求與中國(guó)同行的合作
季爾季什尼科夫至今還記得,1998年,他首次應(yīng)邀訪問(wèn)香港,并結(jié)識(shí)了許多同行和朋友,也曾訪問(wèn)過(guò)多所大學(xué)?!瓣P(guān)于張量火車的首批論文之一正是在香港浸會(huì)大學(xué)以預(yù)印本的形式公布的,我在那里的計(jì)算數(shù)學(xué)研究所工作了幾年。”
他對(duì)《中國(guó)科學(xué)報(bào)》記者表示,“我很高興地看到,我們最初在各種研討會(huì)和學(xué)術(shù)會(huì)議上談?wù)摰南敕ìF(xiàn)在已經(jīng)傳播得如此廣泛?!苯衲?1月,季爾季什尼科夫所在的研究所還將在深圳北理莫斯科大學(xué)舉辦一個(gè)研討會(huì),主題是數(shù)學(xué)和數(shù)據(jù)科學(xué)中的張量方法,期間還將舉辦一個(gè)國(guó)際會(huì)議,邀請(qǐng)多位該領(lǐng)域的杰出專家參加。
談及未來(lái)與中國(guó)同行的合作,他認(rèn)為,未來(lái)他們?cè)诮逃涂茖W(xué)方面有許多可以深入合作的領(lǐng)域。其中就包括人工智能方法在計(jì)算數(shù)學(xué)問(wèn)題中的應(yīng)用,尤其是線性和多線性代數(shù),以及它們?cè)诔?jí)計(jì)算機(jī)上的算法應(yīng)用。
“尋找一種能夠?yàn)槿斯ぶ悄艿墓こ虘?yīng)用帶來(lái)真正好處的數(shù)學(xué)理論是科學(xué)發(fā)展的一個(gè)重要課題。雖然我還很難肯定地說(shuō)這樣的理論一定會(huì)出現(xiàn),但我相信展開(kāi)相關(guān)的探索一定會(huì)對(duì)數(shù)學(xué)的發(fā)展做出重大貢獻(xiàn)!”季爾季什尼科夫說(shuō)。
埃菲莫夫也告訴記者,他們與中國(guó)多家學(xué)術(shù)機(jī)構(gòu)展開(kāi)了合作。同時(shí),俄羅斯科學(xué)家還經(jīng)常來(lái)中國(guó)參加不同的學(xué)術(shù)會(huì)議,與中國(guó)大學(xué)及其他合作伙伴交流經(jīng)驗(yàn)、相互學(xué)習(xí)。“與此同時(shí),我們還與中國(guó)同行們多次舉辦會(huì)議,討論俄羅斯和中國(guó)同行都很關(guān)注的重點(diǎn)發(fā)展領(lǐng)域?!卑7颇蛘f(shuō)。
(本文圖片均由受訪者提供)
版權(quán)聲明:凡本網(wǎng)注明“來(lái)源:中國(guó)科學(xué)報(bào)、科學(xué)網(wǎng)、科學(xué)新聞雜志”的所有作品,網(wǎng)站轉(zhuǎn)載,請(qǐng)?jiān)谡纳戏阶⒚鱽?lái)源和作者,且不得對(duì)內(nèi)容作實(shí)質(zhì)性改動(dòng);微信公眾號(hào)、頭條號(hào)等新媒體平臺(tái),轉(zhuǎn)載請(qǐng)聯(lián)系授權(quán)。郵箱:shouquan@stimes.cn。