时间:2025/2/25 11:52:27来源:www.pc6.com作者:学臣我要评论(0)
快科技2月25日消息,今天是DeepSeek开源周第二日,一早,DeepSeek如约就放出了开源代码库DeepEP王炸。
据了解,DeepEP是首个用于 MoE 模型训练和推理的开源 EP 通信库,它填补了MoE模型专用通信工具的空白,为大规模分布式AI训练和实时推理场景提供了更高效的底层支持。
在这里,简单介绍一下DeepEP的技术性能特点:
1、高效通信架构
支持优化的全对全通信模式,实现节点内和节点间的NVLink与RDMA互联,提升数据传输效率
2、多精度与调度优化
原生支持FP8低精度运算调度,降低计算资源消耗。
3、重性能内核
据介绍,高吞吐量内核可适用于训练和推理预填充场景,最大化数据处理能力;
4、低延迟内核
它针对推理解码场景设计,采用纯RDMA通信和自适应路由技术,减少延迟。
5、资源控制与重叠机制
通过灵活的GPU资源控制策略,实现计算与通信过程的高效重叠,避免资源闲置。
6、深度优化场景
针对NVLink到RDMA的非对称带宽转发场景进行专项优化,提升异构网络下的传输性能;
此外,它还支持SM(Streaming Multiprocessors)数量动态控制,平衡不同任务(如训练与推理)的吞吐量需求。
相关视频
相关阅读 DeepSeek今日启动开源周:公布首个开源代码库Flash MLA天塌了!医生被质疑后发现DeepSeek才是对的AI日报:DeepSeek开源大模型加速器FlashMLA;海螺AI推I2V-01-Dir水滴公司接入 DeepSeek,赋能研发 AI 保险专家微信搜索接入DeepSeek大模型 称AI不会使用朋友圈聊天等信息百度旗下小度官宣接入DeepSeekiPhone SE 4明天登场:64G起步 苹果要涨价李彦宏回应开源文心4.5:DeepSeek让我们明白要开源
热门文章
DeepSeek今日启动开源
何小鹏:人形机器人想
盛大出手!Tanka AI “
马斯克第13个孩子五个
最新文章
DeepSeek第二炸:开源
DeepSeek今日启动开源
回归GMV,抖音电商有了“定海神针”女孩大学毕业后回家照顾残疾父母:诠释了亲AI日报:DeepSeek开源大模型加速器FlashMLA微软CEO:Xbox将运用生成式AI开发一系列视频
人气排行 2020年放假安排时间表全年图 2020年法定节假2021年放假安排时间表全年图 2021年法定节假微信公众号怎么申请 微信公众号申请要钱吗zune怎么用?zune使用攻略!2014台式机装机配置推荐微信朋友圈三天可见怎么破解 朋友圈仅展示三snmp协议在windows下的安装与配置2016猴年邮票多少钱一套 2016猴年邮票价格表
查看所有0条评论>>