• 行业咨询
  • 品牌营销
  • 集微资讯
  • 知识产权
  • 集微职场
  • 集微投融资
  • 集微企业库
搜索
爱集微APP下载

扫码下载APP

爱集微APP扫码下载
集微logo
资讯集微报告舆情JiweiGPT企业洞察
2024第八届集微半导体大会集微视频
登录登录
bg_img
search_logo
大家都在搜

DeepSeek发布Prover-V2模型 参数量达6710亿

作者: 张轶群 04-30 20:06
相关舆情 AI解读 生成海报
来源:爱集微 #DeepSeek# #Prover# #671B#
1.1w

今日,DeepSeek今日于AI开源社区Hugging Face上发布了一个名为DeepSeek-Prover-V2-671B的新模型。据悉,DeepSeek-Prover-V2-671B使用了更高效的safetensors文件格式,并支持多种计算精度,方便模型更快、更省资源地训练和部署,参数达6710亿,或为去年发布的Prover-V1.5数学模型升级版本。

在模型架构上,该模型使用了DeepSeek-V3架构,采用MoE(混合专家)模式,具有61层Transformer层,7168维隐藏层。同时支持超长上下文,最大位置嵌入达16.38万,使其能处理复杂的数学证明,并且采用了FP8量化,可通过量化技术减小模型大小,提高推理效率。

责编: 陈兴华
来源:爱集微 #DeepSeek# #Prover# #671B#
分享至:
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

相关推荐
  • Kimi和DeepSeek又又又撞车?

  • 宝马:将把DeepSeek AI整合到中国市场新车型中

  • 工信部:1-2月5G手机出货量4161.9万部,国产品牌占比85%

  • 美国突祭禁令!英伟达未预警客户 中国H20订单恐全数泡汤

  • 我们为什么仍然需要十万卡集群?——管窥“后DeepSeek时代”算力芯片市场的变与不变

  • DeepSeek联合清华大学发表论文 旨在提高AI模型效率

评论

文明上网理性发言,请遵守新闻评论服务协议

登录参与评论

0/1000

提交内容
    没有更多评论
张轶群

微信:zyqjordan23

邮箱:zhangyq@ijiwei.com

集微网记者,关注IC产业,深度报道、企业报道


1807文章总数
536.6w总浏览量
最近发布
  • 国科微:拟购买中芯宁波94.366%股权 股票复牌

    06-05 22:54

  • 前4个月国家高新区规上工业企业营业收入同比增长7.3%

    06-05 22:16

  • 雷军:小米汽车坚持做大量路测,为进一步提升产品品质

    06-05 21:36

  • 习近平同美国总统特朗普通电话

    06-05 21:27

  • ​ Orange Business入华40年:从 “外资运营商” 到 “生态共建者”

    06-05 12:03

最新资讯
  • 吉利李书福:不再建设新汽车工厂,有些车企竞争方式难以启齿

    1小时前

  • 亚马逊将斥资100亿美元在北卡罗来纳州建设数据中心,以推进人工智能发展

    2小时前

  • 奇瑞尹同跃:中国车企出海不应价格战与相互诋毁

    2小时前

  • ASML CEO批评美国芯片出口禁令:适得其反,应专注创新

    2小时前

  • 机构:2024年中国电池制造商占据全球70%装机份额,日韩主要厂商均出现下滑

    2小时前

  • 韩美半导体成立专业团队研发HBM4核心生产设备

    2小时前

关闭
加载

PDF 加载中...

集微logo
网站首页 版权声明 集微招聘 联系我们 网站地图 关于我们 商务合作 rss订阅

联系电话:

0592-6892326

新闻投稿:

laoyaoba@gmail.com

商务合作:

chenhao@ijiwei.com

问题反馈:

1574400753 (QQ)

集微官方微信

官方微信

集微官方微博

官方微博

集微app

APP下载

    友情链接:

  • 凤凰科技

  • 雷锋网

  • 财联社

  • 电子产品世界

  • 与非网

Copyright 2007-2023©IJiWei.com™Inc.All rights reserved | 闽ICP备17032949号

闽公网安备 35020502000344号