<汇港通讯> 中国科技巨头华为与浙江大学联合发布国内首个基於升腾千卡算力平台的DeepSeek-R1-Safe基础大模型,声称针对有毒有害言论、政治敏感内容、违法行为教唆等14个维度的普通有害问题,整体防御成功率近100%。
中国工程院院士陈纯称,DeepSeek-R1-Safe的发布旨在打造安全可信的示范应用,推动大模型安全能力与产业生态协同发展。
华为介绍,模型研发团队首次实现基於华为升腾千卡算力平台的千亿级参数满血版大模型安全训练。
测试结果表明,DeepSeek-R1-Safe针对有毒有害言论、政治敏感内容、违法行为教唆等14个维度的普通有害问题,整体防御成功率近100%;针对情境假设、角色扮演、加密编码等多个越狱模式整体防御成功率超过40%。其综合安全防御能力达83%。
内地私募巨头幻方量化旗下开源模型公司DeepSeek(深度求索)1月发布模型DeepSeek-R1。这意味着第三方开发者能够基於该公司的模型进行修改与二次开发。 (WL)
新闻来源 (不包括新闻图片): 汇港资讯