浩瀚的宇宙自古以来就是人类不断探索的对象。天文学作为最古老的以观测为基础的自然科学,随着科学技术的进步,已经进入大数据时代。
天文学是最早由数据驱动的学科之一,云计算和大数据技术是限制该学科发展的重要因素。除了海量的天文数据之外,在线服务、软件工具、数据处理系统以及分析挖掘环境也是促进天文研究和科学传播的重要要素。
海量数据与先进信息技术的“融合”,有望不仅在天文学领域结出硕果,还将在更广阔的宇宙中发挥引领作用和示范作用。例如,分布式大规模数据存储、大规模计算、新一代应用架构、机器学习、人工智能等技术,使得中科院国家天文台逐步将数据资源带入,例如新完成的FAST,到了云端。我能够迁移了。 (贵州省中国天眼)观测数据。
FAST是中国人研制的世界上最大的单口径射电望远镜,将为中国天文学研究人员提供先进的仪器设备和海量的大数据。据统计,一旦FAST进入正式科学观测,每天将产生高达50TB的数据。
在FAST观测初期,日本国立天文台采用了漂移扫描观测模式。该模式具有19 波束接收器,带宽为400 MHz,并在1G 频率上采集。其原始数据生成率为38 GB。压缩后,它会缩小到原始大小的1/5 到1/6,即大约每秒6 GB。
除了FAST之外,中国还拥有悟空卫星,而国际上据说日本也有很多大型天文望远镜观测项目,其中包括横跨南非和澳大利亚的1平方公里天线阵。原始数据生成速率将超过每秒10PB,超过当前全球互联网带宽,将为天文学提供海量数据。
人类从哪里来?宇宙的奥秘是什么?这些其实都是关于生命起源的最基本的问题。研究这些基本问题的天文学是一门开放的学科,数据是开放的并与世界共享。国际合作是天文学的“基因”,天文大数据将极大推动计算科学的发展。一旦云计算技术发展到一定程度,全球更多的人将能够参与到这些人类基本挑战的研究中,产生全球共享效应。
以郭树晶望远镜为例,它是我国天文领域第一个大型国家科技攻关项目,也是世界上光谱巡天效率最高的望远镜。自2009年成立以来,已获取超过700万个天体的光谱,使其成为世界上最大的天文光谱库。目前,郭书晶望远镜的产品数据已上传至云端,并通过公共数据发布网站向全球公开。一旦迁移到云端完成,郭守敬望远镜观测数据的查看和使用将得到极大改善。
在大数据时代,如何获取和利用如此海量的信息是摆在全世界天文学家面前的问题。虚拟天文台之父美国约翰·霍普金斯大学的Alex Zareh教授提出了“虚拟天文台”的想法。
虚拟天文台利用信息技术,无缝、透明地连接世界各地的天文数据,形成数据密集型网络化天文研究和科普教育平台。多年来,我也努力研究和建设中国虚拟天文台。
由中国虚拟天文台和微软研究院共同完成的“WWT北京社区”是WWT的官方中国门户,为全球华人用户提供各种信息和资源。
大数据时代,虚拟天文台拉近了公众与宇宙的距离,中国虚拟天文台与星鸣天文台联合推出的“公众超新星探测计划”邀请公众参与新的天文创新,为公众提供了一次机会、一次探索的机会。欣赏宇宙之美、发现的可能性。或许未来会有更多的国内爱好者和拥有天文设备的组织加入到该项目中,探索更多类型的天体。这将继续丰富公众虚拟天文台的内容和功能。在大数据技术进步的帮助下,全民追星的时代可能很快就会到来。 (作者:崔辰举,中国科学院国家天文台研究员)
内容来源:《光明日报》 2018年8月2日
图片来源:视觉中国
本期编辑:钟晓宁王元凡