海洋就像一個(gè)未被發(fā)掘的寶藏,靜靜地等待我們來開啟;海洋也像一本記載著豐富知識的書,等待著我們?nèi)ラ喿x;海洋更像是一本密碼集,等待著我們?nèi)テ谱g她的密碼,揭開她神秘的面紗。
而要想破譯密碼,離不開海洋科學(xué)的大數(shù)據(jù)作為堅(jiān)強(qiáng)“后盾”。
“隨著信息技術(shù)的發(fā)展,數(shù)據(jù)已經(jīng)成為科學(xué)研究中像實(shí)驗(yàn)室試管、燒杯一樣的常用工具,F(xiàn)代海洋科學(xué)具有研究目標(biāo)宏大、多學(xué)科交叉的大科學(xué)特點(diǎn),越來越依賴于系統(tǒng)的、高可信度的基礎(chǔ)科學(xué)數(shù)據(jù)及其衍生的數(shù)據(jù)產(chǎn)品。”海洋所海洋大數(shù)據(jù)中心主任李富超研究員說。
由于海洋的特殊性,獲取數(shù)據(jù)資源的方式也是多樣的,有觀測數(shù)據(jù)、模式數(shù)據(jù),還有實(shí)驗(yàn)數(shù)據(jù)。而這些資源,數(shù)據(jù)量大、格式標(biāo)準(zhǔn)不一樣、應(yīng)用場景也多樣,給海洋數(shù)據(jù)的管理、應(yīng)用帶來了很大的挑戰(zhàn)。并且,海洋數(shù)據(jù)還存在著封閉化、碎片化等嚴(yán)重的問題,跨學(xué)科的數(shù)據(jù)融合、數(shù)據(jù)綜合集成應(yīng)用仍有待突破,人工智能等前沿技術(shù)在海洋科學(xué)數(shù)據(jù)中應(yīng)用不足。
鑒于此,建設(shè)一個(gè)開放共享的綜合性海洋大數(shù)據(jù)中心,是現(xiàn)代海洋科學(xué)發(fā)展的迫切需求。
厚積薄發(fā) 水到渠成
早在2000年,海洋所就開始進(jìn)行系統(tǒng)性的海洋科學(xué)數(shù)據(jù)庫建設(shè)工作。依托科技部基礎(chǔ)數(shù)據(jù)共享平臺(tái)建設(shè)項(xiàng)目,海洋所迎頭而上,聯(lián)合中國海洋大學(xué)等5家高校和科研院所建成“青島海洋科學(xué)數(shù)據(jù)平臺(tái)”,開展海洋科學(xué)數(shù)據(jù)整合和共享工作。
自“十五”開始,在中科院信息化專項(xiàng)支持下,海洋所又系統(tǒng)開展了海洋科學(xué)數(shù)據(jù)資源庫、管理平臺(tái)、數(shù)據(jù)資源服務(wù)體系建設(shè)工作。
不經(jīng)歷風(fēng)雨,怎能見彩虹。正是基于上述彌足珍貴的實(shí)踐經(jīng)驗(yàn), 2018年,當(dāng)中科院開始籌建海洋大科學(xué)研究中心時(shí),海洋所整合相關(guān)資源,新成立了海洋大數(shù)據(jù)中心,成為大科學(xué)中心三個(gè)核心開放支撐平臺(tái)之一。
據(jù)李富超介紹,該中心負(fù)責(zé)統(tǒng)籌運(yùn)行研究所的高性能計(jì)算環(huán)境,集聚多源數(shù)據(jù)建設(shè)海洋大數(shù)據(jù)資源庫,發(fā)展人工智能等海洋數(shù)據(jù)關(guān)鍵技術(shù),研發(fā)有國際影響力的數(shù)據(jù)產(chǎn)品,支撐海洋科學(xué)研究,保障海洋環(huán)境安全,服務(wù)社會(huì)經(jīng)濟(jì)發(fā)展。
海量數(shù)據(jù) 超算助力
海洋大數(shù)據(jù)中心成立了,那么數(shù)據(jù)從何而來?
這要追溯到1950年,海洋所成立伊始就將海洋調(diào)查作為重要基礎(chǔ)性工作之一,1953年開展了北黃海煙臺(tái)、威海漁場調(diào)查,這是新中國第一次海洋調(diào)查。1958年又作為骨干力量參加了第一次全國海洋綜合調(diào)查。以此為起點(diǎn),海洋所承擔(dān)了大量從近海到深海大洋的調(diào)查任務(wù),構(gòu)建了從近海到大洋的海洋觀測網(wǎng)絡(luò),逐步積累了海量海洋科學(xué)數(shù)據(jù)資源。目前,該中心的數(shù)據(jù)資源量已近300TB。
有了數(shù)據(jù)采集途徑,也獲得了海量數(shù)據(jù),這還遠(yuǎn)遠(yuǎn)不夠,如何將這些數(shù)據(jù)轉(zhuǎn)化成產(chǎn)品,才能真正發(fā)揮數(shù)據(jù)的效能。這個(gè)過程,離不開高性能計(jì)算平臺(tái)保障。海洋大數(shù)據(jù)中心的超算平臺(tái)是中科院高性能計(jì)算環(huán)境青島分中心,其在數(shù)據(jù)管理和應(yīng)用方面發(fā)揮了巨大作用。
數(shù)據(jù)的質(zhì)量控制是數(shù)據(jù)中心的重要工作內(nèi)容之一,只有經(jīng)過嚴(yán)格質(zhì)控的數(shù)據(jù)才是有效可用的數(shù)據(jù)。為此,海洋大數(shù)據(jù)中心在成立當(dāng)年就加入國際數(shù)據(jù)質(zhì)量控制海洋數(shù)據(jù)集(IQuOD)計(jì)劃,并建成唯一中國服務(wù)節(jié)點(diǎn),高起點(diǎn)、高標(biāo)準(zhǔn)進(jìn)行數(shù)據(jù)質(zhì)控,為全球海洋科研工作者提供高質(zhì)量海洋科學(xué)數(shù)據(jù)服務(wù)。
面對人工智能技術(shù)在各領(lǐng)域遍地開花的局面,海洋大數(shù)據(jù)中心從美國引進(jìn)高層次人才,從中科院內(nèi)雙拼高端人才,組建了海洋人工智能和大數(shù)據(jù)分析、產(chǎn)品研發(fā)隊(duì)伍。圍繞圖像分類與目標(biāo)檢測,研發(fā)出適合于海洋遙感影像的深度學(xué)習(xí)模型,在內(nèi)波提取、海岸帶水淹區(qū)域制圖等典型應(yīng)用進(jìn)行性能驗(yàn)證,相關(guān)成果在National Science Review上發(fā)表。
在國家重點(diǎn)研發(fā)計(jì)劃全球變化及應(yīng)對專項(xiàng)支持下,海洋大數(shù)據(jù)中心與科研人員合作研發(fā)了一系列高水平海洋科學(xué)數(shù)據(jù)產(chǎn)品。其中與中科院大氣所合作研制并發(fā)布全球海洋溫度格點(diǎn)數(shù)據(jù),被美國國家大氣中心氣候數(shù)據(jù)庫收錄,并成為國內(nèi)首個(gè)被IPCC報(bào)告使用的海洋氣候監(jiān)測時(shí)間序列。
此外,在中科院A類先導(dǎo)專項(xiàng)“地球大數(shù)據(jù)”支持下,該中心還與科研人員合作開發(fā)了CASEarth-Ocean數(shù)據(jù)可視化服務(wù)系統(tǒng),在我國近海滸苔綠潮、溢油、風(fēng)暴潮災(zāi)害預(yù)警服務(wù)等方面提供有效支撐。
培養(yǎng)海洋大數(shù)據(jù)的解碼者
海洋大數(shù)據(jù)中心的運(yùn)作需要專業(yè)的人做專業(yè)的事。
目前,數(shù)據(jù)中心人員背景包括海洋地質(zhì)、海洋生態(tài)、海洋遙感、物理海洋等海洋科學(xué)和計(jì)算機(jī)科學(xué)領(lǐng)域。“下一步,我們將著重引進(jìn)、培養(yǎng)人工智能和大數(shù)據(jù)與海洋科學(xué)融合的復(fù)合型人才,并將信息領(lǐng)域一些新技術(shù)如人工智能,充分應(yīng)用于海洋大數(shù)據(jù)中心建設(shè)。”李富超表示。
同時(shí),數(shù)據(jù)中心還設(shè)置了海洋數(shù)據(jù)資源建設(shè)與共享服務(wù)組、海洋人工智能與大數(shù)據(jù)技術(shù)組、海洋數(shù)據(jù)產(chǎn)品研發(fā)與應(yīng)用組、海洋大數(shù)據(jù)中心保障組,將同科研人員深度融合建設(shè)研究型數(shù)據(jù)中心,引領(lǐng)人工智能海洋學(xué)研究方向。
不過,坦白地說,目前全球科學(xué)家對整個(gè)海洋的認(rèn)識還不足5%。也就是說,現(xiàn)有的海洋的大數(shù)據(jù),或許僅僅只是“冰山一角”。
未來,該中心將鞏固和拓展數(shù)據(jù)資源持續(xù)獲取途徑,形成完備的海洋數(shù)據(jù)資源體系,并持續(xù)完善數(shù)據(jù)匯交、共享體系,這也是大數(shù)據(jù)中心的一個(gè)“發(fā)力點(diǎn)”。
李富超表示,最近海洋大數(shù)據(jù)中心剛獲批中科院海洋科學(xué)數(shù)據(jù)中心,未來他們將繼續(xù)堅(jiān)持目標(biāo)導(dǎo)向,打造海洋科學(xué)大數(shù)據(jù)資源管理、質(zhì)控、分析、應(yīng)用、共享的“生態(tài)圈”,助力海洋科學(xué)研究新范式形成,推動(dòng)海洋信息產(chǎn)業(yè)發(fā)展。