|
|
來自俄羅斯的聲音:尋求中俄兩國科學(xué)領(lǐng)域的協(xié)同發(fā)展 |
|
《中國科學(xué)報(bào)》記者計(jì)紅梅
9月24日至26日,2024 CCF全國高性能計(jì)算學(xué)術(shù)年會(CCF HPC China 2024)在湖北省武漢市舉行。俄羅斯科學(xué)院院士、馬爾丘克數(shù)值數(shù)學(xué)研究所所長葉夫根尼·季爾季什尼科夫(Evgeny Tyrtyshnikov)參加了本次年會。
據(jù)悉,葉夫根尼·季爾季什尼科夫曾于去年獲得了俄羅斯最大商業(yè)銀行——俄羅斯儲蓄銀行(Sber)頒發(fā)的科學(xué)獎。會議前夕,《中國科學(xué)報(bào)》記者采訪了季爾季什尼科夫以及Sber科學(xué)獎組委會成員——Sber副總裁、研究與創(chuàng)新部門負(fù)責(zé)人艾伯特·埃菲莫夫(Albert Efimov)。在專訪中,季爾季什尼科夫表示,他此次參會一方面是來學(xué)習(xí)和了解一些前沿信息,另一方面也希望分享俄羅斯在高性能計(jì)算(High Performance Computing,HPC)和人工智能(AI)方面的成果,加強(qiáng)與中國同行的交流與合作。埃菲莫夫則表示,希望能夠在高性能計(jì)算和人工智能領(lǐng)域?qū)ふ业街袊投砹_斯科學(xué)家都感興趣并愿意為之努力的方向,深化彼此間的合作。
數(shù)學(xué)可以為HPC做什么,為人工智能帶來什么?
季爾季什尼科夫的主要研究領(lǐng)域是線性代數(shù)、矩陣方法及其應(yīng)用,這些領(lǐng)域影了大量涉及復(fù)雜計(jì)算的應(yīng)用問題。這些似乎是“簡單的科學(xué)”,大學(xué)生們通常由此開始數(shù)學(xué)學(xué)習(xí),這些領(lǐng)域中的問題似乎都已經(jīng)解決了,但實(shí)際上并不是這樣。季爾季什尼科夫舉例說:“想象一下,你需要解一個線性方程組,其中未知數(shù)和方程的數(shù)量為10的83次方,等同于宇宙中的總原子數(shù)量。如何才能做到這一點(diǎn)呢?事實(shí)證明,在大學(xué)里線性代數(shù)學(xué)得再好也沒有用,借助經(jīng)典方法,這種‘天文數(shù)字’的問題看似毫無解決的希望?!?/p>
季爾季什尼科夫表示,其研究的主要目標(biāo)是幫助現(xiàn)代超級計(jì)算機(jī)用其特殊的數(shù)量較小的參數(shù)表示來取代“天文數(shù)字般大”的數(shù)據(jù)數(shù)組,并提供基于這些表示的高效計(jì)算算法。這是對某種通用計(jì)算范例的實(shí)現(xiàn)的研究,它補(bǔ)充了經(jīng)典線性代數(shù)計(jì)算的成熟模型。
隨著科學(xué)技術(shù)的發(fā)展,越來越多的領(lǐng)域需要進(jìn)行大規(guī)模、高復(fù)雜度的計(jì)算,如天氣預(yù)測、生物信息分析、物理和水動力模擬等。HPC作為解決這些計(jì)算問題的關(guān)鍵技術(shù),越來越受到人們的關(guān)注。這其中,旨在最大限度地利用計(jì)算資源、提高計(jì)算效率的高效算法和軟件,以及能夠執(zhí)行多個任務(wù)或操作的并行計(jì)算方法,成為發(fā)展HPC的重中之重。而這也正是季爾季什尼科夫?yàn)閿?shù)學(xué)和HPC找到的“結(jié)合點(diǎn)”。
葉夫根尼·季爾季什尼科夫
俄羅斯科學(xué)院院士,物理學(xué)與數(shù)學(xué)博士
俄羅斯科學(xué)院馬爾丘克數(shù)值數(shù)學(xué)研究所所長
他介紹說,早在1980年,俄羅斯科學(xué)家馬爾丘克院士就提出“將算法映射到計(jì)算機(jī)系統(tǒng)的體系結(jié)構(gòu)上”這一重要思路。在他之后,研究HPC高效算法和并行計(jì)算技術(shù)的俄羅斯科學(xué)家越來越多,并為此在國內(nèi)外舉辦了很多研討會,積極探索解決辦法。2023年,季爾季什尼科夫獲得Sber科學(xué)獎。談及獲獎理由,季爾季什尼科夫坦言,這主要是由于他對矩陣和張量方法發(fā)展所做出的貢獻(xiàn),特別是因?yàn)樗l(fā)明了“張量火車”(Tensor Trains,TT)?!?這些方法可以解決那些甚至超出了現(xiàn)代超級計(jì)算機(jī)處理能力的問題。其關(guān)鍵思想是使用特殊模型來表示基于低秩矩陣的多維數(shù)組(張量)?!比缃?,這一方法已經(jīng)得到包括中國機(jī)構(gòu)在內(nèi)的全球數(shù)十個甚至數(shù)百個研究團(tuán)隊(duì)使用。
他介紹說,其中一個成就是訓(xùn)練此類模型的有效方法,允許通過極少量的數(shù)組元素獲得模型參數(shù)。緊湊數(shù)據(jù)表示模型必須具有一個重要的屬性,即除了數(shù)據(jù)壓縮之外,還需要高效、可靠的算法來計(jì)算該模型的格式。此外,他成功組建了一支由年輕研究人員組成的強(qiáng)大團(tuán)隊(duì)。正是在計(jì)算數(shù)學(xué)研究所,該團(tuán)隊(duì)在2009 年開發(fā)出一個非常成功的多維矩陣低參數(shù)表示模型 – 一個張量火車。我們使用英文縮寫 TT(Tensor Train,張量火車)來表示這個模型。
“在張量火車的情況下,我們有一個驚人的算法,其性質(zhì)類似于使用著名的奇異值分解(SVD)算法獲得近似值。其計(jì)算復(fù)雜度依賴于‘車’的大小,線性依賴于數(shù)組的維數(shù),同時保證了對近似精度的良好估計(jì)。一個特殊的成就是基于數(shù)組元素近似構(gòu)造張量火車的交叉算法,數(shù)組元素的數(shù)量與其元素總數(shù)相比可以忽略不計(jì)?!奔緺柤臼材峥品蛘f。
目前,有關(guān)此類方法的數(shù)學(xué)理論獲得了積極的發(fā)展,同時其實(shí)際應(yīng)用在過去15年來也表現(xiàn)出了驚人的效率。在此基礎(chǔ)上,他們成功構(gòu)建了一種用于全局優(yōu)化的新型啟發(fā)式算法,該算法與遺傳算法相比具有相當(dāng)?shù)母偁幜?,在某些情況下甚至更有效,例如在新藥研發(fā)過程中解決“對接”(docking)問題。
季爾季什尼科夫認(rèn)為,神經(jīng)網(wǎng)絡(luò)與函數(shù)論和近似論中非常深奧的數(shù)學(xué)問題有關(guān)。安德烈·柯爾莫哥洛夫求得了希爾伯特第13問題之解的著名研究可以被認(rèn)為是現(xiàn)代神經(jīng)網(wǎng)絡(luò)的先驅(qū)。這項(xiàng)研究證明了任何多變量的連續(xù)函數(shù)都是通過一個變量的函數(shù)和加法的組合來實(shí)現(xiàn)的。隨后,人們證明了一個變量的函數(shù)可以通過將自變量乘以一個因子和一個移位,從一個單一函數(shù)中獲得。目前,已經(jīng)出現(xiàn)了基于柯爾莫哥洛夫此項(xiàng)研究思想建立起來的神經(jīng)網(wǎng)絡(luò)。它們的潛力仍有待更詳細(xì)的研究。同時,他認(rèn)為人工智能方法的廣泛工程應(yīng)用與數(shù)學(xué)之間存在明顯的差距,數(shù)學(xué)將真正幫助工程師進(jìn)行開發(fā)。沒有數(shù)學(xué)理論可以令人信服地解釋為什么一種或另一種架構(gòu)(例如在大型語言模型中)比另一種架構(gòu)更好或更差。
那么,人工智能方法給數(shù)學(xué)帶來了什么直接影響呢?季爾季什尼科夫解釋說:“人工智能方法被用于解決數(shù)學(xué)物理問題,例如,優(yōu)化整個過程的各個要素。在我看來,這些方法將有助于解決將算法映射到計(jì)算系統(tǒng)架構(gòu)的問題?,F(xiàn)在更準(zhǔn)確地談?wù)撨@些方法的地位還為時過早?!?/p>
產(chǎn)研合作助力前沿科技發(fā)展
近年來,HPC和AI的結(jié)合正迅速改變著科學(xué)研究和創(chuàng)新領(lǐng)域。人工智能,尤其是以ChatGPT為代表的生成式人工智能(Generative AI)的發(fā)展,更是對HPC提出了更高的要求,也成為其重要的應(yīng)用領(lǐng)域之一。Sber副總裁艾伯特·埃菲莫夫是該公司研究與創(chuàng)新部門負(fù)責(zé)人,并創(chuàng)辦了其機(jī)器人實(shí)驗(yàn)室。他對高性能計(jì)算與人工智能及機(jī)器人發(fā)展之間的互動與促進(jìn)有著深入的洞察。
在專訪中,埃菲莫夫首先介紹了Sber科學(xué)獎。該獎項(xiàng)共包括四大類別,即“物理類”,涵蓋了物理學(xué)、化學(xué)、天文學(xué)、地球科學(xué)、技術(shù)科學(xué);“生命科學(xué)類”,涵蓋了生物學(xué)、醫(yī)學(xué)和農(nóng)業(yè)科學(xué);“數(shù)字宇宙類”,涵蓋了數(shù)學(xué)、計(jì)算機(jī)科學(xué)、信息學(xué);以及“人工智能科學(xué)類”,專門頒發(fā)給35歲以下的年輕科研人員,旨在表彰他們在人工智能領(lǐng)域的杰出成就。
艾伯特·埃菲莫夫
Sber副總裁、研究與創(chuàng)新部門負(fù)責(zé)人
?
在談及Sber決定設(shè)立科學(xué)獎的初衷時,埃菲莫夫表示,Sber目前已經(jīng)成為俄羅斯最大的科技公司,其競爭優(yōu)勢是基于研發(fā)對科技領(lǐng)域進(jìn)行投資。Sber非常清楚如何進(jìn)行應(yīng)用研究并創(chuàng)造有用的技術(shù)和產(chǎn)品,但對一家商業(yè)公司來說,始終存在一個難題,即如何支持基礎(chǔ)科學(xué)研究?“我們設(shè)立Sber科學(xué)獎的初衷就是為了支持基礎(chǔ)科學(xué)研究?!?埃菲莫夫說。
Sber科學(xué)獎有兩大主要特點(diǎn)。首先,它授予在科學(xué)研究中開辟新視野的科學(xué)家。其次,這一獎項(xiàng)在科學(xué)界有絕對的權(quán)威性?!斑@兩大特點(diǎn)使得Sber科學(xué)獎成為年輕科學(xué)家和整個俄羅斯科學(xué)界在創(chuàng)造全新突破性解決方案,并在此基礎(chǔ)上創(chuàng)造新技術(shù)方面的一個標(biāo)桿?!卑7颇蛘f。
那么,未來這一獎項(xiàng)有沒有可能進(jìn)入國際舞臺?對此,埃菲莫夫表示當(dāng)然可以,但他也認(rèn)為這并不容易。例如,需要確定俄羅斯和中國科學(xué)家都感興趣和認(rèn)為有用的領(lǐng)域。在他看來,其中一個領(lǐng)域就是人工智能的研究。
作為俄羅斯目前最大的科技公司,Sber產(chǎn)出了諸多科技成果,涉及人工智能、高性能計(jì)算等多個方面。在人工智能領(lǐng)域,Sber開展了幾十個不同的項(xiàng)目,應(yīng)用了很多前沿科技,包括生成式人工智能等。埃菲莫夫舉了三個例子:第一是Sber的生成式人工智能模型系統(tǒng)。Sber將之稱為“GigaChat”。這個系統(tǒng)可以允許用戶處理文本、圖像和其他類型的數(shù)據(jù)。第二個例子是Sber的 神經(jīng)網(wǎng)絡(luò)“Kandinsky”(康定斯基)。該模型允許客戶通過文本描述生成圖像和視頻,同時該模型還支持中文。第三個例子是一個氣候模型。由于全球變暖已經(jīng)成為目前世界面臨的主要威脅,因此基于AI技術(shù)創(chuàng)建了一個氣候模型,能夠預(yù)測氣候風(fēng)險(xiǎn)。
Kandinsky生成的圖片
?
之所以有如此多的產(chǎn)出,埃菲莫夫介紹說,是因?yàn)镾ber有兩大研發(fā)機(jī)制。其一是內(nèi)部機(jī)制,由Sber自有的實(shí)驗(yàn)室組成,涉及從人工智能、機(jī)器人到量子計(jì)算、區(qū)塊鏈等多個研究領(lǐng)域。其二是外部機(jī)制。Sber與俄羅斯國內(nèi)7所最大且最負(fù)盛名的大學(xué)的人工智能中心均有合作,與幾乎所有Sber重視的領(lǐng)域名列前茅的科學(xué)家都建立了聯(lián)系?!?這為我們在基礎(chǔ)應(yīng)用科學(xué)領(lǐng)域加強(qiáng)俄羅斯和中國的合作提供了獨(dú)特的機(jī)會?!?/p>
在埃菲莫夫看來,當(dāng)下,機(jī)器人技術(shù)和AI以兩種方式聯(lián)系在一起。首先,AI可用的數(shù)據(jù)幾乎已經(jīng)耗盡。未來大模型數(shù)據(jù)只能通過與物理世界的交互才能獲得。因此,機(jī)器人技術(shù)為AI在物理世界中交互和學(xué)習(xí)提供了機(jī)會。其次,AI使機(jī)器人能夠做出更聰明的決策,從而使機(jī)器人成為人類可靠和安全的助手?!霸趶?fù)雜而動態(tài)的環(huán)境中,只有人工智能才能幫助機(jī)器人為人類執(zhí)行有用的功能?!彼f。
積極尋求與中國同行的合作
季爾季什尼科夫至今還記得,1998年,他首次應(yīng)邀訪問香港,并結(jié)識了許多同行和朋友,也曾訪問過多所大學(xué)。“關(guān)于張量火車的首批論文之一正是在香港浸會大學(xué)以預(yù)印本的形式公布的,我在那里的計(jì)算數(shù)學(xué)研究所工作了幾年?!?/p>
他對《中國科學(xué)報(bào)》記者表示,“我很高興地看到,我們最初在各種研討會和學(xué)術(shù)會議上談?wù)摰南敕ìF(xiàn)在已經(jīng)傳播得如此廣泛。”今年11月,季爾季什尼科夫所在的研究所還將在深圳北理莫斯科大學(xué)舉辦一個研討會,主題是數(shù)學(xué)和數(shù)據(jù)科學(xué)中的張量方法,期間還將舉辦一個國際會議,邀請多位該領(lǐng)域的杰出專家參加。
談及未來與中國同行的合作,他認(rèn)為,未來他們在教育和科學(xué)方面有許多可以深入合作的領(lǐng)域。其中就包括人工智能方法在計(jì)算數(shù)學(xué)問題中的應(yīng)用,尤其是線性和多線性代數(shù),以及它們在超級計(jì)算機(jī)上的算法應(yīng)用。
“尋找一種能夠?yàn)槿斯ぶ悄艿墓こ虘?yīng)用帶來真正好處的數(shù)學(xué)理論是科學(xué)發(fā)展的一個重要課題。雖然我還很難肯定地說這樣的理論一定會出現(xiàn),但我相信展開相關(guān)的探索一定會對數(shù)學(xué)的發(fā)展做出重大貢獻(xiàn)!”季爾季什尼科夫說。
埃菲莫夫也告訴記者,他們與中國多家學(xué)術(shù)機(jī)構(gòu)展開了合作。同時,俄羅斯科學(xué)家還經(jīng)常來中國參加不同的學(xué)術(shù)會議,與中國大學(xué)及其他合作伙伴交流經(jīng)驗(yàn)、相互學(xué)習(xí)?!芭c此同時,我們還與中國同行們多次舉辦會議,討論俄羅斯和中國同行都很關(guān)注的重點(diǎn)發(fā)展領(lǐng)域。”埃菲莫夫說。
(本文圖片均由受訪者提供)
版權(quán)聲明:凡本網(wǎng)注明“來源:中國科學(xué)報(bào)、科學(xué)網(wǎng)、科學(xué)新聞雜志”的所有作品,網(wǎng)站轉(zhuǎn)載,請?jiān)谡纳戏阶⒚鱽碓春妥髡?,且不得對?nèi)容作實(shí)質(zhì)性改動;微信公眾號、頭條號等新媒體平臺,轉(zhuǎn)載請聯(lián)系授權(quán)。郵箱:shouquan@stimes.cn。