首页学术会议论文辅导出版无忧

自助查重科研资讯期刊大数据

与R1相比，总参数1.2万亿增加了一倍!曝光DeepSeek NVIDIA将完全摆脱：都是基于华为芯片

研发家 | 2025-05-01 20

DeepSeek年初 R1的出现使美国AI圈颤抖，甚至导致NVIDIA股价暴跌。现在，更强大的DeepSeek R2也将到来。

根据最新的市场爆料，R2模型将采用更先进的混合专家模型。(MoE)，与上一代R1相比，总参数增加了1.2万亿元左右(R1总参数6710亿元)，与GPT-4相比，单位推理成本降低了97.4%。

当前，中美科技战、贸易战愈演愈烈，NVIDIA H20芯片面临着新的出口管制浪潮。

DeepSeek 在R2预期发布日期临近的情况下，各行各业都非常关注缺乏美国芯片资源的中国指标大模型的发展趋势。

相传，GPT-4，R2规模和ChatGPT Geminini的Turbo和谷歌 2.0 Pro相当，还将结合更智能的门控传输层。(Gating Network)，从而提高负载推理任务的性能。

新闻指出，R2将完全摆脱NVIDIA芯片，整个训练过程中没有使用NVIDIA显卡，全部基于升腾910B。(Ascend 在FP16精度下，910B芯片集群平台的计算性能达到512。 PetaFLOPS，在NVIDIA上一代A100集群中，芯片利用率高达82%，综合性能约为91%。

市场预测，这有望减少中国对海外高档AI芯片的依赖，华为全新的升腾910C芯片也开始进入大规模量产阶段。

成本方面，DeepSeek-与OpenAI旗下的GPT-4相比，R2的单位推理成本大幅降低97.4%。在这些字符中，R2输入每百万字符只需0.07美元，而导出每百万字符只需0.27美元。

根据分析，如果R2像谣言一样强大，可能会再次引发市场对AI基础设施需求的质疑。此外，华为AI芯片的国产替代品将对NVIDIA产生更大的影响。

赞一个

打开微信扫一扫

版权及免责声明：本网站所有文章除标明原创外，均来自网络。登载本文的目的为传播行业信息，内容仅供参考，如有侵权请联系删除。文章版权归原作者及原出处所有。本网拥有对此声明的最终解释权

< 上一篇：V3.00摩尔线程Linux显卡驱动.0发布：支持Wayland 提高GPU渲染性能下一篇：18A量产在即 14A已经上路了!Intel代工释放了两个关键信号：信任、合作 >

推荐会议

更多 >>

热门标签

#学术不端与撤稿观察 #EI会议论文 #文献综述 #论文开题 #SCI #学术会议 #高校动态 #科研萌新 #论文写作 #科研工具

最新文章

NEW

知名学术期刊：再遇投稿抄袭将实名公告！

我国太赫兹探测钙钛矿光伏技术登上权威期刊《自然》

江苏高校国际产学研用合作交流周启幕

苏—非洲高校合作联盟在苏州成立

当数据新闻撞上AIGC 看高校学子“整”出哪些新活儿？

国家青年拔尖人才亲授发表秘诀！RDLink 研发家联合承办讲座，拆解科研人核心痛点

年仅37岁！湘潭大学博导突然去世，刚评上教授不到一年…2025已有超70位中青年学者逝世

申硕成功！本地唯一本科学院，将更名大学

热点资讯

HOT

国家青年拔尖人才亲授发表秘诀！RDLink 研发家联合承办讲座，拆解科研人核心痛点

知名学术期刊：再遇投稿抄袭将实名公告！

我国太赫兹探测钙钛矿光伏技术登上权威期刊《自然》

江苏高校国际产学研用合作交流周启幕

苏—非洲高校合作联盟在苏州成立

当数据新闻撞上AIGC 看高校学子“整”出哪些新活儿？

学术资源免费领取

加微信领取20G科研大礼包！
更有众多热门

关于我们

公司简介

关于我们

商务合作

专家招募

会议合作

期刊合作

研享客-校园大使

帮助与支持

常见问题

在线客服

服务邮箱：customer_service@yanfajia.com

公众号二维码

服务号二维码

友情链接