• 行业咨询
  • 品牌营销
  • 集微资讯
  • 知识产权
  • 集微职场
  • 集微投融资
  • 集微企业库
搜索
爱集微APP下载

扫码下载APP

爱集微APP扫码下载
集微logo
资讯集微报告舆情JiweiGPT企业洞察
2024第八届集微半导体大会集微视频
登录登录
bg_img
search_logo
大家都在搜

蚂蚁推AI技术 大模型训练提高33%GPU显存 推理提速2倍

作者: 爱集微 2024-01-18
相关舆情 AI解读 生成海报
来源:联合报 #蚂蚁集团#
3.7w

蚂蚁集团在整改之外,在AI大模型领域上仍迈开技术自研步伐。近期新浪科技报导,蚂蚁集团推出技术框架“GMLake”,该框架能够解决大模型训练中的显存问题,最多提高33%的GPU可用显存;同时近期蚂蚁也开源新算法“Lookahead推理加速框架”,降低推理耗时。

在ChatGPT浪潮下,生成式大模型正引领当前AI发展。而为了训练得到高效大模型,需要强大和昂贵的基础算力支撑。目前制约高效训练的因素中,除了算力,显存容量也非常关键,即“内存墙”问题。

一段时间以来,业界已有很多优化工作,包括模型、框架层的改造,甚至牺牲模型精度。目前业界广泛使用的训练框架如PyTorch存在显存管理效率不高,显存资源碎片化的现象,而当业界使用优化手段后,碎片化问题反而更突出。

因此蚂蚁集团和上海交通大学合作GMLake技术研究。该框架采用虚拟、物理两层指针,将碎片化的显存灵活地拼接起来,从而实现了聚零为整。

值得一提的是,GMLake对典型大模型如GPT、GLM、Vicuna等进行了详细评测,最高扩大了约33%的可用显存,即在80GB的A100 GPU上节省约25GB的显存,训练吞吐提高最多4倍。

据了解,GMLake目前已在PyTorch框架上完成集成,对上层模型代码和框架代码完全透明,换言之模型不需要修改任何代码便能使用。

此外,蚂蚁集团还开源一套新算法“Lookahead推理加速框架”,能帮助大模型在推理时,提速2至6倍,效果无损,即插即用,该算法已在蚂蚁大量场景进行了落地,大幅降低推理耗时。

原来词元(token)生成过程,就像早期中文输入法,只能一个字一个字“敲”出来,如采用蚂蚁加速算法后,token生成就像联想输入法,有些整句可直接“蹦”出来。

蚂蚁集团首席技术官何征宇近日通过科创板日报表示,大模型真正历史性的突破是帮助行业生产力提升,而且有可能让人类社会生产力剧增。“我们做大模型技术的最终目标还是会面向产业,也包括金融产业、医疗产业等专业服务场景,帮助他们去做产业升级。”而蚂蚁集团发言人在去年11月表示,在获得官方批准后,集团AI大模型百灵大模型多款产品将向公众开放。

责编: 爱集微
来源:联合报 #蚂蚁集团#
分享至:
THE END
相关推荐
  • 韩歆毅明年3月接任蚂蚁集团CEO 井贤栋专注董事长工作

  • 蚂蚁集团—上海交大人工智能与安全联合研究中心签约暨揭牌仪式举行

  • 人工智能学者张宏江出任蚂蚁集团独立董事

  • 沐创携可迁移后量子密码芯片S20P亮相2024外滩大会

  • 蚂蚁集团研究院院长李振华:没有云服务的AI厂商没有前途

  • 蚂蚁集团启动组织升级,推进蚂蚁“AI First”等三大战略

评论

文明上网理性发言,请遵守新闻评论服务协议

登录参与评论

0/1000

提交内容
    没有更多评论
爱集微

微信:

邮箱:laoyaoba@gmail.com


11.1w文章总数
12012.5w总浏览量
最近发布
  • 聚势赋能,2025年艾为合作伙伴培训圆满收官

    4小时前

  • 炬芯科技「芯」助力荣耀手环10,打造腕上智能健康管家

    4小时前

  • 西湖大学光电研究院联合承办,2025第三届全国人工智能应用场景创新挑战赛智能光电专项赛火力全开

    5小时前

  • 聚焦Wireless Japan 2025:泰凌微电子展示多元无线创新技术方案

    5小时前

  • 中国多地保时捷大降价!深圳卡宴打6.5折75万就能领车

    8小时前

最新资讯
  • 消息称三星将于7月在纽约推出Galaxy Z Flip 7和Fold 7

    43分钟前

  • 卓胜微CTO唐壮:不回避挑战,“正向研发”从来不是口号

    8小时前

  • 广东:加快华润微、方正微、粤芯、增芯等重大项目建设和产能爬坡

    1小时前

  • 美国量子计算创企Infleqtion获1亿美元融资

    4小时前

  • 聚势赋能,2025年艾为合作伙伴培训圆满收官

    4小时前

  • 魏哲家:台积电海外设厂不会导致技术外流

    4小时前

关闭
加载

PDF 加载中...

集微logo
网站首页 版权声明 集微招聘 联系我们 网站地图 关于我们 商务合作 rss订阅

联系电话:

0592-6892326

新闻投稿:

laoyaoba@gmail.com

商务合作:

chenhao@ijiwei.com

问题反馈:

1574400753 (QQ)

集微官方微信

官方微信

集微官方微博

官方微博

集微app

APP下载

    友情链接:

  • 凤凰科技

  • 雷锋网

  • 财联社

  • 电子产品世界

  • 与非网

Copyright 2007-2023©IJiWei.com™Inc.All rights reserved | 闽ICP备17032949号

闽公网安备 35020502000344号