首页 > AI > 7X24小时AI快讯 > 产品动态> 正文

颠覆传统!DeepSeek V4 Flash小型推理引擎发布,推理时间短至1/5

佚名 整合编辑:太平洋科技 发布于:2026-05-08 17:26
由华为云驱动

近日,DeepSeek团队发布专为Metal平台打造的小型推理引擎DeepSeek V4 Flash。它针对自身模型优化执行,“思考模式”处理复杂问题时思考时间最短可达其他模型的五分之一,支持百万令牌推理,能在128GB RAM的MacBook运行2位量化。当前为Alpha版,后续将推更强版本,有望推动本地推理技术发展。

DeepSeek团队发布专为Metal平台打造的小型推理引擎DeepSeek V4 Flash,提供高效、灵活的本地推理体验。它针对自身模型优化执行,“思考模式”下处理复杂问题时,思考时间最短可达其他模型的五分之一,还支持百万令牌推理,能在128GB RAM的MacBook上运行2位量化。当前版本为Alpha版,团队预计推出更强版本。

技术上,该引擎具备强大上下文窗口和完整本地推理解决方案,包括HTTP API和GGUF模型。这一创新为本地推理提供新选择,有望在市场上占据一席之地,未来随着更强版本推出,或推动本地推理技术发展。

佚名

甄选好物

手机 笔记本 影像 硬件 家居 商用 企业 出行 未来
二维码 回到顶部