■记者赵广利实习生沉秋月
毕凯峰是清华大学钱学森力学班2016级本科生。 2020年毕业后加入华为,担任工程师。 三年后,他以第一作者身份在《自然》杂志上发表论文。
该论文通讯作者、华为云人工智能首席科学家田琪向中国科学报证实,数据显示,这是近年来中国科技公司作为唯一作者在《》上发表的第一篇论文。
7月6日发表的论文介绍了华为云盘古气象大型模型研发团队的研究成果,并报道了业界“首个中长期天气预报准确率超越传统的AI模型”数值预测方法。”
《中国科学报》进一步获悉,毕凯峰加入华为云后,“半年内升职两级”,现任总工程师。 论文主要作者、华为云高级研究员谢灵曦透露:“这篇文章90%以上的工作量是毕凯峰完成的。”
盘古气象预训练模型将于2023年3月公开。“我们公开了论文中使用的1小时、3小时、6小时、24小时模型,这些模型运行速度非常快,甚至“如果CPU上迭代单个步骤的时间少于1分钟。这意味着研究人员可以在计算机上几分钟内完成未来7天的高分辨率全球天气预报。”谢灵曦说。
适应地球坐标系的三维神经网络
盘古气象大模型的研究将于2021年启动,这一年是毕凯峰选择人工智能天气预报方向的时候。 2020年底,毕凯峰开始涉足AI科学计算领域。 在对许多科学计算课题进行研究后,他在2021年下半年选择了AI天气预报方向。
人们每天看到的日常天气预报、极端灾害预警、气候变化预报等都是“数值天气预报”,更多地依赖于高性能计算和复杂的物理模型,因此瓶颈问题更加突出。 田奇告诉《中国科学报》,传统的数值方法以28公里×28公里的水平精度预测未来10天的全球天气,需要在拥有3000台服务器的超级计算机集群上计算4到5个小时。 但如果想要获得更高精度、更小规模的预测,计算能力需求和计算时间都会呈几何级数增长。
但人工智能天气预报也存在问题。 例如,在传统数值方法应用最为广泛的中长期预报中,现有的人工智能预报方法精度有限,并受到“缺乏可解释性”、“极端天气预测不准确”等问题的制约。
田奇团队认为生活网资讯,造成这种情况的主要原因有两个:一是原有的AI天气预报模型基于2D神经网络,难以处理不均匀的3D天气数据; 其次,AI方法缺乏数学和物理机制约束,因此迭代误差会在迭代过程中不断累积。
为此,研究团队提出了一种适应地球坐标系的三维神经网络(3D-EST)来处理复杂的不均匀3D气象数据,并采用分层时域聚合策略来减少预测迭代次数,从而减少迭代错误。
3D-EST方法理论上可以解决很多问题,但很快,“缺乏实际气象数据”成为新问题——没有理论、没有模型训练、没有预报结果对比和模型持续优化。
从欧洲气象中心下载超过 200TB 的数据
毕竟是年轻人,毕凯峰精力充沛。
他花了半年多的时间,从欧洲气象中心下载了超过200TB的再分析数据,并利用10年前的数据逐步构建了AI天气预报的训练框架。 在获得了一些参数调整的经验后,2022年中期,他开始用40年的数据进行实验。
“我们使用了40年的全球天气数据和200张GPU卡进行预训练,经过大约2个月的时间,我们训练出了一个参数达到亿级的大型盘古气象模型。” 田琪向《中国科学报》解释。
结果出乎意料地令人欣喜。 大型盘古气象模型1小时至7天的预报精度高于传统数值方法(与欧洲气象中心的IFS系统相比)。 同时,在V100显卡上,大型盘古气象模型可以完成24小时全球天气预报,包括位势、湿度、风速、温度、海平面气压等数值。 与传统数值方法相比,预测速度提高10000倍。
2022年11月,欧洲气象中心将通过电子邮件联系研究团队,并就试验进行沟通。 模型开放后,欧洲气象中心积极对其进行测试,并给出了一系列得到积极反馈的测试报告。 报告肯定了盘古大陆气象大模型在确定性预报和部分天气过程预报方面表现良好,同时还指出其提供了“推理功耗显着低于传统方法”的技术模型。
今年5月,台风“玛瓦尔”的走向受到广泛关注。 据中央气象台介绍,华为云盘古气象大比例尺模型在“妈娃”路径预报中表现良好,提前5天预测其转向路径。
欧洲气象中心的一系列报告和中央气象台的反馈无疑给盘古气象大模型的天气预报能力“背书”。
投稿后,杂志的编辑们非常认可这篇论文,并找到了三位审稿人。 他们不是计算机或人工智能领域的专家,而是气象领域的学者。
三位评审员均对这一结果给予了高度评价。 一位审稿人称赞:“华为云盘古气象模型让人们重新审视天气预报模型的未来,模型的开放性将推动这一领域的发展。”
该论文的审稿人之一、美国科罗拉多州立大学的 Imme Ebert 教授也为《自然》撰写了一篇观点文章,进一步阐释了这项工作的价值。 这篇文章与盘古气象大模型论文同一天在线发表。
不是替代而是补充
华为云盘古气象模型在天气预报方面的出色表现,让人不禁思考:AI预报会取代传统预报吗?
“谈论取代传统的数值预测方法是不合适的。” 田奇表示,盘古气象大模型的目标不是取代,而是让每个行业、企业乃至每个人都拥有专家助手,让工作更高效、更轻松。
毕凯峰、谢灵曦也表示,人工智能天气预报还存在同化不足、对再分析数据依赖度高、极端天气预估能力弱等诸多不足。 “至少在未来一段时间内,人工智能天气预报方法和传统天气预报方法将结合起来,形成混合预报系统。两种方法将充分发挥各自的优势,比如传统方法的可解释性以及人工智能方法的效率。”
“我们认为,人工智能天气预报应该与数值天气预报共存,相互比较验证,为人类提供更准确、更可信的天气预报。”田奇说。
“人工智能和医学图像分析的结合已经有10多年了,到目前为止,人工智能仍然发挥着辅助作用,无法取代医生,尤其是高水平专家。在气象领域也是如此。” 谢灵曦表示,盘古气象模型虽然在一定程度上得到了业界的认可,但还有很长的路要走,还有很多未解决的问题。 他希望有更多的同事来探索人工智能在天气预报和更广泛的科学领域的应用。
本网站转载其他媒体之作品,意在为公众提供免费服务。如权利所有人拒绝在本网站发布其作品,可与本网站联系,本网站将视情况予以撤除。