DeepSeek更新!DeepSeek开源发布-Prover-V2-671B新模型
研发家 | 2025-05-01 21

昨日下午,DeepSeek 在 AI 开源社区 Hugging Face 发布了一个名字 DeepSeek-Prover-V2-671B 的新模型。

据介绍,DeepSeek-Prover-V2-671B 它的参数达到6710亿,使用更加有效。 safetensors 文件类型,并支持 BF16、FP8、F32 等待多种计算精度,方便模型更快、节约资源的练习与布署。

该模型采用DeepSeek-V3架构,采用MoE(混合专家)模式,具有61层Transformer层,7168维隐藏层。

同时,最大位置嵌入163840,可以处理复杂的数学证书,采用FP8量化,通过量化技术可以减少模型尺寸,提高推理效率。

一些网民分析说,这个模型被认为是 Prover-V1.5升级版,致力于形式化定理证明,专门用于突破数学问题,擅长自动证明定律和复杂计算,类似于 AlphaGo 围棋中的自我游戏模式。

接着它的性能检测表现将如何,值得期待。

赞一个

分享:
打开微信扫一扫
15
版权及免责声明:本网站所有文章除标明原创外,均来自网络。登载本文的目的为传播行业信息,内容仅供参考,如有侵权请联系删除。文章版权归原作者及原出处所有。本网拥有对此声明的最终解释权
招商合作
请您完善以下信息,我们会尽快与您联系!
论文投稿
参加会议
合作办会
期刊合作
论文辅导
科研绘图
论文翻译润色
论文查重
其他
提交
专家招募
个人信息
联系信息
提交
在线客服
商务合作
专家招募
常见问题
手机端
扫描二维码
与学术大咖共探知识边界
出版支持
翻译服务
润色服务
自助查重
排版校对