DEEPSEEK网页版入口网

DEEPSEEK网页版入口网:https://www.deepseek.com/

DEEPSEEK网页版入口网

DeepSeek,全称“杭州深度求索人工智能基础技术研究有限公司”,简称“深度求索”,于2023年7月17日由幻方量化创立,位于杭州市拱墅区,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术,法定代表人、经理、董事为裴湉。

2024年1月5日,该公司发布第一个大模型DeepSeek LLM。之后,相继发布DeepSeek-Coder、DeepSeek-VL、DeepSeek V2、DeepSeek V3等模型。其中,DeepSeek V2模型因在中文综合能力评测中的出色表现,且以极低的推理成本引发行业关注,被称为“AI界的拼多多”。2025年1月20日,该公司正式发布DeepSeek-R1模型,并同步开源模型权重。DeepSeek-R1性能逼近OpenAI o1正式版,推理成本却仅为OpenAI o1的几十分之一。1月27日,DeepSeek应用登顶苹果美国地区应用商店免费App下载排行榜,在美区下载榜上超越了ChatGPT。同日,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一。1月28日,DeepSeek发布开源多模态模型Janus-Pro,其中70亿参数版本的Janus-Pro-7B模型在使用文本提示的图像生成排行榜中优于OpenAI的DALL-E 3和Stability AI的Stable Diffusion。2月8日,QuestMobile数据显示,DeepSeek在1月28日的日活跃用户数首次超越豆包,随后在2月1日突破3000万大关,成为截至2025年2月史上最快达成这一里程碑的应用。

2025年2月16日,腾讯表示微信搜一搜在调用混元大模型丰富AI搜索的同时,在近期灰度测试接入DeepSeek。在灰度测试范围的用户,可在对话框顶部搜索入口,看到“AI搜索”字样,点击进入后,可免费使用DeepSeek-R1满血版模型,获得更多元化的搜索体验。2月19日,虎牙直播宣布接入DeepSeek-R1满血版,支持深度推理和联网搜索。2月25日,DeepSeek发布了其“开源周”第二天的成果:DeepEP,第一个用于MoE模型(混合专家模型)训练和推理的开源EP通信库。3月1日,DeepSeek通过社交平台发布《DeepSeek-V3/R1推理系统概览》技术文章,首次公布模型推理系统优化细节,首次披露理论利润率达545%。

2025年8月21日,DeepSeek正式上线DeepSeek-V3.1

2025年2月28日,DeepSeek公开了Fire-Flyer文件系统(简称3FS)和轻量级数据处理框架Smallpond。3FS面向现代SSD和RDMA网络,能将固态硬盘带宽利用到极致。它可以在没有双方操作系统介入的情况下,将数据直接从一台计算机的内存传输到另一台计算机,也不需要中央处理器、CPU缓存或上下文交换参与。特点就是高通量、低延迟,尤其适合在大规模并行计算机集群中使用。3月1日,DeepSeek通过社交平台发布《DeepSeek-V3/R1推理系统概览》技术文章,首次公布模型推理系统优化细节,披露理论利润率达545%。文章写道:“DeepSeek-V3 / R1 推理系统的优化目标是:更大的吞吐,更低的延迟。”为实现这两个目标,DeepSeek的方案是使用大规模跨节点专家并行(EP),但该方案也增加了系统复杂性。文章的主要内容就是关于如何使用EP增长批量大小(batch size)、隐藏传输耗时以及进行负载均衡。

2025年8月21日,DeepSeek正式上线DeepSeek-V3.1,新版V3.1采用了「混合推理」,一个模型,两种模型:思考与非思考(自主切换)。相较于DeepSeek-R1-0528 ,DeepSeek-V3.1-Think推理速度更快