北京2022年7月27日 /美通社/ -- 大腦包含上百億神經(jīng)元,是人體身上最重要和最復(fù)雜的器官,復(fù)雜性遠(yuǎn)遠(yuǎn)超出了我們當(dāng)前的認(rèn)識(shí)能力。腦科學(xué)研究不僅是全球科技的前沿領(lǐng)域,也是理解人類本身的終極目標(biāo)。為了加快了腦科學(xué)研究的步伐,"腦科學(xué)與類腦研究" 于2016年正式啟動(dòng),吸引了眾多頂尖科學(xué)家投身其中。以探索大腦秘密、攻克大腦疾病為導(dǎo)向的腦科學(xué)研究,以及以建立和發(fā)展人工智能技術(shù)為導(dǎo)向的類腦研究開啟了新的征程。作為國內(nèi)高校最早成立的腦科學(xué)與類腦前沿交叉研究機(jī)構(gòu)之一,復(fù)旦大學(xué)類腦人工智能科學(xué)與技術(shù)研究院(簡稱類腦研究院),面向腦與類腦重大科技前沿,依托學(xué)科優(yōu)勢(shì),借助領(lǐng)先的計(jì)算、數(shù)據(jù)平臺(tái),致力于在類腦人工智能算法、重大腦疾病智能診療等領(lǐng)域創(chuàng)新,引領(lǐng)腦科學(xué)、人工智能與產(chǎn)業(yè)應(yīng)用的融合,實(shí)現(xiàn)未來智能產(chǎn)業(yè)技術(shù)創(chuàng)新。
為了建成世界一流的腦與類腦前沿研究和科技創(chuàng)新機(jī)構(gòu),加速腦科學(xué)與類腦研究進(jìn)程,復(fù)旦大學(xué)類腦研究院需要采用多維度、高精度的設(shè)備進(jìn)行科研數(shù)據(jù)的采集、傳輸、使用。類腦研究設(shè)備涉及腦成像平臺(tái)、磁共振成像設(shè)備系統(tǒng)、多臺(tái)近紅外光、腦電、腦磁圖等實(shí)時(shí)腦功能監(jiān)測(cè)系統(tǒng),以及直流電刺激、經(jīng)顱磁刺激、超聲腦刺激等腦調(diào)控系統(tǒng)。認(rèn)知神經(jīng)科學(xué)平臺(tái)擁有光學(xué)腦成像設(shè)備及認(rèn)知行為解析設(shè)備,這些設(shè)備進(jìn)行科學(xué)研究時(shí)產(chǎn)生了大量影像數(shù)據(jù)。在組建人腦大數(shù)據(jù)庫的科研項(xiàng)目中,復(fù)旦大學(xué)類腦研究院利用各種無創(chuàng)手段,以基因測(cè)序?yàn)橹?,?duì)抑郁癥、精神分裂癥、健康人等不同類型的人群,并發(fā)采集其環(huán)境、行為、遺傳、腦影像、神經(jīng)等千萬級(jí)小文件數(shù)據(jù)信息,推動(dòng)重大腦疾病如抑郁癥、精神分裂癥、自閉癥和物質(zhì)濫用的病根構(gòu)建并預(yù)測(cè)人腦的創(chuàng)造性、幸福感和毅力等各種宏觀指標(biāo),這對(duì)整個(gè)大平臺(tái)的數(shù)據(jù)基礎(chǔ)設(shè)施有著比較大的挑戰(zhàn)和要求。
首先是對(duì)數(shù)據(jù)容量的要求:研究院部署較早的傳統(tǒng)存儲(chǔ)擴(kuò)展能力受限制,且配置6TB及以上大容量硬盤采用RAID 6、RAID 10,空間利用率小于50%,在容量利用方面存在巨大提升空間。
其次是要有穩(wěn)定的性能支撐:基因測(cè)序的生產(chǎn)過程是一個(gè)超高并發(fā)的文件轉(zhuǎn)換過程,整個(gè)生產(chǎn)過程有非常密集的文件讀取和寫入。一個(gè)完整的基因測(cè)序樣本會(huì)產(chǎn)生千萬量級(jí)的文件,通過測(cè)序儀、分析儀等儀器獲得包含原始基因序列堿基對(duì)的文件,大小大約幾十GB。整個(gè)生物樣本的導(dǎo)入過程對(duì)文件存儲(chǔ)的性能有著極高的要求,滿足不同科研任務(wù)對(duì)不同文件高帶寬的存儲(chǔ)需求,既要文件系統(tǒng)必須提供超大文件數(shù)量的支持,同時(shí)必須在有限的時(shí)間內(nèi)完成海量小文件的導(dǎo)入。
最后需要對(duì)設(shè)備和用戶的進(jìn)行高效和精準(zhǔn)管理:一是用戶層次多,類腦研究院擁有從本科生至博士生,以及各類研究員的使用者;在研究的過程中類腦研究院的教授、研究員及學(xué)生需要設(shè)置不同的級(jí)別,以防止重要數(shù)據(jù)的誤操作;二是多臺(tái)設(shè)備的使用,使得故障點(diǎn)隱患增加,管理及配置難以統(tǒng)一化,運(yùn)維壓力較大。
浪潮存儲(chǔ),助力類腦研究基礎(chǔ)平臺(tái)建設(shè)
針對(duì)全腦網(wǎng)絡(luò)可視化研究場(chǎng)景及相關(guān)需求,復(fù)旦大學(xué)類腦研究院采用了浪潮提供的專業(yè)化的存儲(chǔ)解決方案。
復(fù)旦大學(xué)類腦研究院采用浪潮分布式存儲(chǔ)AS13000,可按需提供文件、對(duì)象、塊、大數(shù)據(jù)等多種服務(wù),采用8+2糾刪碼策略提供了3PB容量空間,空間利用率達(dá)到80%;方案統(tǒng)一化管理,降低多套設(shè)備部署和維護(hù)的復(fù)雜度,允許集群內(nèi)同時(shí)故障2個(gè)節(jié)點(diǎn),業(yè)務(wù)不中斷,數(shù)據(jù)不丟失,保障了業(yè)務(wù)連續(xù)性。
浪潮存儲(chǔ)通過對(duì)象聚合技術(shù),提升單次落盤的對(duì)象大小,降低落盤操作次數(shù),單節(jié)點(diǎn)恒定聚合帶寬達(dá)2GB/s以上,確?;驕y(cè)序的連續(xù)性。
針對(duì)高校多個(gè)學(xué)科與多個(gè)課題組共享、使用、管理數(shù)據(jù)會(huì)產(chǎn)生多份數(shù)據(jù),浪潮存儲(chǔ)為復(fù)旦大學(xué)定制了軟拷貝功能,在元數(shù)據(jù)索引上做變更,用戶視角是多份不同的文件,但底層則是共同的存儲(chǔ)空間,實(shí)現(xiàn)多份數(shù)據(jù)極速拷貝和使用,還大幅降低了存儲(chǔ)容量開銷和管理成本,讓數(shù)據(jù)共享、使用變得更加高效。浪潮存儲(chǔ)平臺(tái)還通過部署增強(qiáng)ACL,支持讀、寫、執(zhí)行、可視、刪除,滿足對(duì)不同用戶的精細(xì)權(quán)限控制:保證研究員、學(xué)生和管理者等不同用戶對(duì)數(shù)據(jù)的訪問和存儲(chǔ)有不同的權(quán)限,有效防止誤操作。
復(fù)旦大學(xué)類腦研究院下設(shè)的生物醫(yī)學(xué)大數(shù)據(jù)中心---張江國際腦庫(ZIB),不斷加強(qiáng)高性能計(jì)算與存儲(chǔ)能力建設(shè),目前擁有6個(gè)隊(duì)列、15000例被試、30 PB存儲(chǔ)、1005 份問卷,形成了國內(nèi)領(lǐng)先的生物大數(shù)據(jù)、云計(jì)算平臺(tái)。預(yù)計(jì)到2023年,張江國際腦庫將圍繞精神分裂癥、抑郁癥、自閉癥、腦卒中、神經(jīng)退行性疾病以及正常人群的六個(gè)隊(duì)列建設(shè),完成環(huán)境、行為、遺傳、腦影像、神經(jīng)5-O尺度等全維度數(shù)據(jù)采集,建成全球最大規(guī)模的全維度腦數(shù)據(jù)庫和算法中心,服務(wù)腦科學(xué)基礎(chǔ)研究、腦疾病臨床診療與類腦智能新興產(chǎn)業(yè)的發(fā)展。
同時(shí)該機(jī)構(gòu)還將與全球主流生物數(shù)據(jù)庫建立合作共享機(jī)制,推動(dòng)構(gòu)建全球頂級(jí)規(guī)模的全維度腦數(shù)據(jù)庫和算法中心。無論是腦科學(xué)還是類腦研究,對(duì)提升未來中國科技整體智慧水平、提高經(jīng)濟(jì)發(fā)展質(zhì)量、促進(jìn)人類的生產(chǎn)生活方式的轉(zhuǎn)變均意義重大。