佚名
整合编辑:太平洋科技
发布于:2026-05-08 17:26
近日,DeepSeek团队发布专为Metal平台打造的小型推理引擎DeepSeek V4 Flash。它针对自身模型优化执行,“思考模式”处理复杂问题时思考时间最短可达其他模型的五分之一,支持百万令牌推理,能在128GB RAM的MacBook运行2位量化。当前为Alpha版,后续将推更强版本,有望推动本地推理技术发展。
|
DeepSeek团队发布专为Metal平台打造的小型推理引擎DeepSeek V4 Flash,提供高效、灵活的本地推理体验。它针对自身模型优化执行,“思考模式”下处理复杂问题时,思考时间最短可达其他模型的五分之一,还支持百万令牌推理,能在128GB RAM的MacBook上运行2位量化。当前版本为Alpha版,团队预计推出更强版本。 技术上,该引擎具备强大上下文窗口和完整本地推理解决方案,包括HTTP API和GGUF模型。这一创新为本地推理提供新选择,有望在市场上占据一席之地,未来随着更强版本推出,或推动本地推理技术发展。 |
佚名
IT百科
热门搜索
甄选好物
