一直以来,从脑疾病的研究到大脑功能的解密,科学家从未停止过对大脑探索的步伐。在华中科大苏州脑空间信息研究院,科学家们正在做一件对于脑科学研究具有里程碑意义的事情:绘制一张可能是世界上最复杂的“地图”——灵长类全脑的三维图谱。
以小鼠三维脑图谱为例,科学家们通常先对小鼠进行脑成像:将鼠脑标本固定,用金刚刀从上至下、从左至右,将鼠脑标本顺次切成1微米厚度的薄片,一边切片一边拍照,照片实时存储到计算机系统之中。当鼠脑成像结束,脑科学家再根据这些二维照片合成三维脑图谱。
一个小鼠全脑有超万个神经元,绘制小鼠脑图谱需要张图片,未压缩的数据量高达8TB。人脑的体积大约是小鼠脑的倍,拥有亿个神经元,人脑的三维图谱数据量将会再提升几个量级。
现如今,单纯的脑成像已经不成问题,但成像之后巨大的数据量如何存储和分析成为当下脑科学等多个科研领域最为棘手的挑战。
1
是什么阻碍了“脑洞大开”
华中科大苏州脑空间信息研究院所遇到的情况是科研机构在新数据时代下的一个缩影。
一方面,得益于国家经济实力的不断提升,科学研究投入持续加大。根据《年全国科技经费投入统计公报》显示,年全国研究与试验发展经费首次突破2万亿元,达到.6亿元,同比增长12.5%。
另一方面,数字化正在改变科研模式,过去相对薄弱的数字基础设施开始面临升级,亟需符合未来研发需求的新型基础设施。正如发改委今年首次明确了新基建的范围,将支撑科学研究等具有公益性质的重大科技、科教基础设施划分为创新基础设施,属于新基建未来重点投入方向。
“当前科研领域在存储等基础设施方面主要有容量、性能和稳定性三个典型挑战。”华中科技大学计算机学院院长冯丹教授在浪潮云数智中国行武汉峰会上如是说。
华中科技大学计算机学院院长冯丹教授
与其他行业相比,数据在科研领域的生产要素属性更加快速显现。科研数据往往具有数据密集型范式的特点,具有数据量巨大的特征。以目前世界上灵敏度最高的射电望远镜中国天眼项目为例,每天产生约TB的零级未压缩数据,预计未来十年数据量将超过PB,对长期运行产生的海量数据进行存储与计算分析正在深刻改变其科研模式,如何存储与保护这些海量数据就成为巨大挑战。
此外,随着海量数据的产生,科研机构通常希望能够让数据采集、处理和存储的速度提升,以更好、更快支撑起科学研究。冯丹教授表示:“科研项目对于性能一直很