文字| 《中国科学报》记者 赵广利 实习生沉秋月
毕凯峰是清华大学钱学森力学班2016级本科生。 2020年毕业后加入华为,担任工程师。 三年后,他作为第一作者在该杂志上发表了一篇论文。
毕凯峰
该论文通讯作者、华为云人工智能首席科学家田琪向中国科学报证实,数据显示,这是近年来中国科技企业作为唯一作者单位发表的首篇官方论文。
该论文于7月6日发表,介绍了华为云盘古大模型研发团队的研究成果——“用于准确中期全球天气预报的三维神经网络”。 传统数值预测方法的人工智能模型”。
纸
《中国科学报》进一步获悉,毕凯峰加入华为云后,“半年内升职两级”,现任总工程师。 论文主要作者、华为云高级研究员谢灵曦透露:“这篇论文90%以上的工作量是由第一作者毕凯峰完成的。”
来自气象领域的三位专家审稿人均对这一成果给予了高度评价。 一位审稿人称赞:“华为云盘古气象模型让人们重新审视天气预报模型的未来,模型的开放性将推动这一领域的发展。”
谢灵曦表示,盘古气象预训练模型已于2023年3月公开。
“我们公开了论文中使用的1小时、3小时、6小时、24小时模型,这些模型运行速度很快,即使单步迭代在CPU上花费的时间不超过1分钟。这意味着使每个研究任何人都可以在几分钟内在个人电脑上完成未来 7 天的高分辨率全球天气预报。” 谢灵溪说道。
缺失数据? 这家伙从欧洲气象局下载了超过 200TB 的数据
盘古气象大模型研究将于2021年启动。
今年也是毕凯峰选择人工智能天气预报并开始准备的时间。 此前一篇关于清华“前班”教育方法的文章透露,毕凯峰因未能找到兴趣方向而“陷入迷茫”。 但自从进入华为后,他“热情被问题点燃”,在实习期间解决了一个大问题并被华为录取,“半年提升了两个级别”。
2020年底,毕凯峰开始涉足AI科学计算领域。 在研究了许多科学计算主题后,他在 2021 年下半年选择了人工智能天气预报。
人们每天看到的日常天气预报、极端灾害预警、气候变化预报等都是“数值天气预报”,更多地依赖于高性能计算和复杂的物理模型,因此瓶颈问题也更加突出。 田奇告诉《中国科学报》,传统的数值方法以28公里×28公里的水平精度预测未来10天的全球天气,需要在拥有3000台服务器的超级计算机集群上计算4-5小时。 但如果想要获得更高精度、更小规模的预测,计算能力需求和计算时间都会呈几何级数增长。
田七图源:华为官网
但人工智能天气预报也存在问题。 例如,在数值方法应用最为广泛的中长期预报中,现有人工智能预报方法的准确度存在显着差距,并受到“缺乏可解释性”、“极端天气预报不准确”等问题的制约。 ”。
田奇研究团队认为,造成这一问题的主要原因有两个:一是原有的AI天气预报模型基于2D神经网络,难以处理不均匀的3D天气数据;二是原有的AI天气预报模型基于2D神经网络,难以处理不均匀的3D天气数据; 二是AI方法缺乏数学物理机制的限制,迭代过程中迭代误差会不断累积。
为此,研究团队提出了一种适应地球坐标系(3D Earth-)的三维神经网络来处理复杂的不均匀3D气象数据,并采用分层时域聚合策略来减少预测迭代次数,从而减少迭代错误。
3D-EST方法理论上可以解决很多问题,但很快,“缺乏实际气象数据”成为新的制约因素——没有理论,就不可能进行模型训练,更不可能比较预测结果并不断优化模型。
毕竟是年轻人。 毕凯峰孜孜不倦地工作。 他花了半年多的时间,从欧洲气象中心下载了超过200TB的再分析数据,并利用10年前的数据逐步构建了AI天气预报的训练框架。 在获得了一些参数调整的经验后,2022年中期,他开始用40年的数据进行实验。
“我们使用了40年的全球天气数据,并用200块GPU卡进行了预训练。经过2个月左右的训练,我们训练出了一个参数达到亿级的大型盘古气象模型。” 田琪告诉《中国科学报》说。
谢灵曦透露,期间,为了支持这些模型的训练,团队成员甚至停止了正在运行的程序,放弃了GPU资源,以保证实验的顺利完成。
结果出乎意料地令人欣喜。 大型盘古气象模型1小时至7天的预报精度高于传统数值方法(与欧洲气象中心的IFS系统相比)。 同时,大型盘古气象模型在V100显卡上仅需1.4秒即可完成24小时全球天气预报,包括位势、湿度、风速、温度、海平面气压等数值。 与传统数值方法相比,预测速度提高10000倍。
2022年11月,欧洲气象中心将通过电子邮件联系研究团队,并就试验进行沟通。 模型开放后,欧洲气象中心积极对其进行测试,并给出了一系列得到积极反馈的测试报告。 这些报告出现在 EMC 技术报告、技术博客和 WMO 研讨会的演示文稿中。 报告肯定了模型在确定性预报和部分天气过程预报方面表现良好,同时还指出它提供了一种“推理功耗显着低于传统方法”的技术模型。
AI天气预报消耗的能源远低于传统方法(来源:ECMWF报告)
今年5月,台风“玛瓦尔”的走向受到广泛关注。 据中央气象局介绍,华为云盘古大模型在“妈娃”路径预报中表现出色,提前5天预测其转向路径。
欧洲气象中心的系列报告和中央气象局的应用无疑为盘古气象大模型的天气预报能力“背书”。
2022年10月上旬,毕凯峰完成论文初稿; 经过谢灵曦的“刷新”后,论文首先被上传到了arXiv平台。
团队没有提交经验,但“过程很顺利”
谢灵曦介绍,一开始,团队并没有明确的提交计划。
“田七老师要我们投票,但我们不知道。” 谢灵曦表示,他和毕凯峰打算投票给一个顶级机器学习会议(比如ICLR或者ICML)。 一个多月后,他们无意中发现了谷歌的类似研究成果,并取得了非常好的效果。
他当时感到有些泄气:“也许谷歌已经提交了一篇文章给。”
但深入研究后,他们发现谷歌已经承认了他们在 arXiv 平台上的工作。 “所以,抱着‘不投票,不投票’的心态,我们鼓起勇气精简了 arXiv 版本并提交。”
“对于这次投稿,我们完全没有把握,因为团队成员没有任何投稿经验和经验(包括子期刊、简讯等)。” 谢灵溪说道。 当时大家都觉得“被盲目拒绝的可能性比较大”。
不过投稿后,编辑非常认可这篇论文,认可团队的贡献; 经过一轮沟通,他们同意将论文送审。
值得一提的是,三位审稿人并非计算机或人工智能领域的专家,而是气象领域的学者。 三位审稿人也同意公开自己的身份和审稿意见。 他们分别来自慕尼黑工业大学、欧洲气象中心和科罗拉多州立大学。 据谢灵曦介绍,审稿人几乎没有对团队的贡献和创新提出质疑,提出的问题大多是关于写作、训练细节、开源等方面。
》第一位审稿人是慕尼黑工业大学的G.教授,是一位非常资深的气象学家,他几乎逐字逐句地阅读了我们的文章,并给出了详细的修改意见;第二位审稿人是欧洲气象中心的一位医生,询问了很多实施情况详情;第三位审稿人是来自科罗拉多州立大学的 Imme Ebert 教授,她仔细测试了我们发布的模型,相信这些模型将促进行业的研究。” 谢灵溪说道。
有趣的是,Imme Ebert- 还受邀撰写了一篇题为“The for AI”的评论文章。 这篇文章与盘古大陆气象大模型论文同日在线发表,进一步说明了这项工作的价值。
“投稿过程还算顺利,非常感谢三位审稿人。” 谢灵曦说,三位审稿人的评论加上团队的答辩加起来有40页。
不是替代传统预测,而是补充
华为云盘古气象大模型在天气预报方面的亮眼表现,让人不禁思考,AI预报会取代传统预报吗?
“谈论取代传统的数值计算预测是不合适的。” 田奇告诉《中国科学报》,盘古模式的目标不是取代,而是让每个行业、企业、甚至每个人都拥有自己的专家助手。 让工作更高效、更轻松。
毕凯峰和谢灵曦也在联合文章中表示,人工智能天气预报还存在很多不足,如缺乏同化、对再分析数据依赖度较高、极端天气预测能力薄弱等。 “至少在未来一段时间内,人工智能天气预报方法和传统天气预报方法将结合起来,形成混合预报系统。两种方法将充分发挥各自的优势,比如传统方法的可解释性以及人工智能方法的效率。”
田奇表示,传统的数值天气预报方法也有自己的优势,比如资料天气预报的可解释性更高。 AI预测方法将产生更平滑的预测结果,这增加了低估当地极端天气事件范围的风险。 “我们认为,人工智能天气预报应该与数值天气预报共存生活网报道,相互比较和验证,为人类提供更准确、更可信的天气预报,而不是谈论谁取代谁。”
“人工智能和医学图像分析的结合已经有10多年了,到目前为止,人工智能仍然发挥着辅助作用,无法取代医生,尤其是高水平专家。在气象领域也是如此。” 谢灵曦表示,虽然盘古天气模型已经在一定程度上得到了业界的认可,但还有很长的路要走,还有很多未解决的问题。 他希望有更多的同事来探索人工智能在天气预报和更广泛的科学领域的应用。
同时,谢灵曦还表示:“我们期待气象学家与AI领域的深入合作,共同探索这个令人兴奋的新方向。”
本网站转载其他媒体之作品,意在为公众提供免费服务。如权利所有人拒绝在本网站发布其作品,可与本网站联系,本网站将视情况予以撤除。