当行业在讨论谁的模子更聪明时,DeepSeek仍然把目光投向更现实的问题:如何让模型更快。
6月27日,DeepSeek民间在Github低调更新了一篇最新论文,介绍其推理加速框架DSpark,试图办理大语言模型在高并发场景下的推理效率瓶颈。
从作者署名来看,这篇论文由DeepSeek与北京大学联合公布,DeepSeek创始人梁文锋也位列作者名单。在论文中,团队开源了DSpark模型权重,并同步发布了面向推测解码、由算法驱动的训练代码仓库DeepSpec。
(文章根源:第一财经)
来源: 第一财经
相关标签: