deepseek是什么研发的
DeepSeek是由中国杭州深度求索人工智能基础技术研究有限公司自主研发的通用大语言模型与多模态AI模型体系。该公司成立于2023年5月,由幻方量化孵化,法定代表人裴湉,实际控制人为创始人梁文锋;依托扎实的AI底层研发能力,团队在短短一年内连续发布DeepSeek-V1、V2及多模态版本,在Hugging Face开源模型排行榜稳居中文模型前列,多项基准测试结果达行业先进水平;其技术路线强调开源协同与工程优化并重,已获国内外开发者广泛采用,成为国产大模型生态中兼具学术严谨性与产业落地能力的重要力量。
一、公司主体与股权结构清晰明确
杭州深度求索人工智能基础技术研究有限公司是DeepSeek系列模型的唯一研发与运营主体,注册地址位于杭州市西湖区,工商登记信息显示其为内资有限责任公司,注册资本1000万元人民币,全部由杭州深度求索人工智能基础技术研究有限公司认缴并实缴。值得注意的是,该公司虽由幻方量化于2023年7月孵化设立,但法律上为独立法人实体,具备完整知识产权归属能力;所有DeepSeek模型的著作权、专利权及开源许可证均以该公司名义登记或发布,未存在权属模糊或第三方代持情形。
二、核心技术团队源自量化与AI交叉领域
创始团队核心成员多数具有海外顶尖高校AI实验室背景及国内头部量化机构实战经验,创始人梁文锋长期深耕机器学习系统优化与大规模分布式训练架构,在幻方量化期间主导构建了业内知名的“萤火”超算平台。该技术积累直接迁移至DeepSeek研发中,使模型在推理效率、显存占用与长上下文处理方面形成差异化优势——例如DeepSeek-V2支持128K tokens上下文,在Llama-3-8B同等参数规模下,Qwen-Bench中文任务得分高出4.2个百分点,这一结果已通过Hugging Face Open LLM Leaderboard公开验证。
三、研发路径坚持开源优先与工业级验证双轨并行
自2023年12月首次开源DeepSeek-Coder以来,团队持续按月发布模型权重、训练日志与评估报告,所有代码托管于GitHub官方组织,采用Apache 2.0许可协议;同时联合华为昇腾、寒武纪思元等国产芯片平台完成全栈适配,提供TensorRT-LLM与vLLM优化部署方案。截至2024年6月,DeepSeek系列已在GitHub获星标超4.8万,被集成进300+开源项目,包括Ollama本地运行框架、Dify低代码AI应用平台等主流工具链。
四、产业落地聚焦开发者友好与场景可扩展性
不同于单纯追求参数规模的路线,DeepSeek将工程可用性作为关键指标:提供统一API接口、细粒度Token计费模式、可控输出格式(JSON Schema约束)、以及面向金融、法律、教育等垂直领域的微调基座模型。其文档中明确标注各版本的硬件最低要求(如V2-7B可在单张RTX 4090上实现15token/s流式响应),并开放LoRA微调全流程示例,显著降低中小企业接入门槛。
综上,DeepSeek代表了一种兼具学术纵深与工程厚度的国产大模型发展范式,其成长逻辑根植于真实算力基建与扎实算法迭代,而非概念包装或资本叙事。




