<汇港通讯> 内地媒体报道,由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上国际学术期刊《自然》(Nature)的封面。
DeepSeek R1成为首个通过同行评议的主要大语言模型,发表在《自然》杂志的新版DeepSeek-R1论文,与今年1月未经同行评审的初版有较大差异。
在同行评议过程中,DeepSeek团队根据评审意见减少了对模型的拟人化描述,并增加模型训练的技术细节说明,包括模型训练资料类型和安全性考虑等,并回应了此前关於知识蒸馏的质疑。
DeepSeek明确否认了此前关於其使用OpenAI模型输出进行训练的质疑,指DeepSeek-V3 Base(DeepSeek-R1的基座模型)使用的数据全部来自互联网,虽然可能包含GPT-4产生的结果,但绝非有意而为之,更没有专门的蒸馏环节。
开源後,R1在Hugging Face下载量破1090万次,成为全球最受欢迎的开源推理模型。
DeepSeek团队也首次公开了R1训练成本仅29.4万美元(约229.32万港元)。这个金额即使加上约600万美元(约4680万港元)的基础模型成本,也远低於OpenAI、Google训练AI的成本。
作为全球首个通过同行评审的主流大语言模型,《自然》将该篇论文作为封面论文,此次论文发表标志中国在大模型基础研究领域取得重要突破。《自然》认为,随着AI技术日渐普及,大模型厂商们无法验证的宣传可能会对社会带来真实风险。依靠独立研究人员进行的同行评议,是抑制AI产业过度炒作的有效方式。而DeepSeek所做的一切,是非常值得欢迎的先例。
#DeepSeek (CW)
新闻来源 (不包括新闻图片): 汇港资讯