Deepseek v1.0.8

92次阅读

共计 4057 个字符，预计需要花费 11 分钟才能阅读完成。

DeepSeek，全称杭州深度求索人工智能基础技术研究有限公司。DeepSeek 是一家创新型科技公司，成立于 2023 年 7 月 17 日，使用数据蒸馏技术，得到更为精炼、有用的数据。由知名私募巨头幻方量化孕育而生。专注于开发先进的大语言模型（LLM）和相关技术。注册地址：浙江省杭州市拱墅区环城北路 169 号汇金国际大厦西 1 幢 1201 室。法定代表人为裴湉，经营范围包括技术服务、技术开发、软件开发等。

2024 年 1 月 5 日，发布 DeepSeek LLM（深度求索的第一个大模型）。1 月 25 日，发布 DeepSeek-Coder。2 月 5 日，发布 DeepSeekMath。3 月 11 日，发布 DeepSeek-VL。5 月 7 日，发布 DeepSeek-V2。6 月 17 日，发布 DeepSeek-Coder-V2。9 月 5 日，更新 API 支持文档，宣布合并 DeepSeek Coder V2 和 DeepSeek V2 Chat，推出 DeepSeek V2.5。12 月 13 日，发布 DeepSeek-VL2。12 月 26 日晚，正式上线 DeepSeek-V3 首个版本并同步开源。2025 年 1 月 31 日，英伟达宣布 DeepSeek-R1 模型登陆 NVIDIANIM。同一时段内，亚马逊和微软也接入 DeepSeek-R1 模型。英伟达称，DeepSeek-R1 是最先进的大语言模型。

DeepSeek-R1 已发布并开源，性能对标 OpenAI o1 正式版，DeepSeek-V3 在推理速度上相较历史模型有了大幅提升。在目前大模型主流榜单中，DeepSeek-V3 在开源模型中位列榜首，与世界上最先进的闭源模型不分伯仲。

DeepSeek-V3 的综合能力

DeepSeek-V3 在推理速度上相较历史模型有了大幅提升。

在目前大模型主流榜单中，DeepSeek-V3 在开源模型中位列榜首，与世界上最先进的闭源模型不分伯仲。

	Benchmark (Metric)	DeepSeek V3	DeepSeek V2.5	Qwen2.5	Llama3.1	Claude-3.5	GPT-4o
	Benchmark (Metric)		0905	72B-Inst	405B-Inst	Sonnet-1022	0513

	Architecture	MoE	MoE	Dense	Dense	-	-

	# Activated Params	37B	21B	72B	405B	-	-

	# Total Params	671B	236B	72B	405B	-	-
English	MMLU (EM)	88.5	80.6	85.3	88.6	88.3	87.2
	MMLU-Redux (EM)	89.1	80.3	85.6	86.2	88.9	88.0
	MMLU-Pro (EM)	75.9	66.2	71.6	73.3	78.0	72.6
	DROP (3-shot F1)	91.6	87.8	76.7	88.7	88.3	83.7
	IF-Eval (Prompt Strict)	86.1	80.6	84.1	86.0	86.5	84.3
	GPQA-Diamond (Pass@1)	59.1	41.3	49.0	51.1	65.0	49.9
	SimpleQA (Correct)	24.9	10.2	9.1	17.1	28.4	38.2
	FRAMES (Acc.)	73.3	65.4	69.8	70.0	72.5	80.5
	LongBench v2 (Acc.)	48.7	35.4	39.4	36.1	41.0	48.1
Code	HumanEval-Mul (Pass@1)	82.6	77.4	77.3	77.2	81.7	80.5
	LiveCodeBench (Pass@1-COT)	40.5	29.2	31.1	28.4	36.3	33.4
	LiveCodeBench (Pass@1)	37.6	28.4	28.7	30.1	32.8	34.2
	Codeforces (Percentile)	51.6	35.6	24.8	25.3	20.3	23.6
	SWE Verified (Resolved)	42.0	22.6	23.8	24.5	50.8	38.8
	Aider-Edit (Acc.)	79.7	71.6	65.4	63.9	84.2	72.9
	Aider-Polyglot (Acc.)	49.6	18.2	7.6	5.8	45.3	16.0
Math	AIME 2024 (Pass@1)	39.2	16.7	23.3	23.3	16.0	9.3
	MATH-500 (EM)	90.2	74.7	80.0	73.8	78.3	74.6
	CNMO 2024 (Pass@1)	43.2	10.8	15.9	6.8	13.1	10.8
Chinese	CLUEWSC (EM)	90.9	90.4	91.4	84.7	85.4	87.9
	C-Eval (EM)	86.5	79.5	86.1	61.5	76.7	76.0
	C-SimpleQA (Correct)	64.1	54.1	48.4	50.4	51.3	59.3

通义（官网 https://www.tiangong.cn/）阿里 AI 大模型，是一款超大规模预训练模型，是您日常办公、学 * 提效、生活娱乐的 AI 超级助理；为您提供全方位、方便快捷的协助。

通义具备以下核心能力：
【日常办公】在文档撰写、实时录音、文档 / 网页速读、代码生成解释等方面提供高效的办公服务；1000 万字长文本、一键速读 1000 份资料，能实现跨文档的摘要、分析和内容创作。
【学 * 提效】在线解析网页、论文与图书，实现多文本摘要和结构化总结，助力学生党快速获取知识、文字工作者一键生成摘要、各行业信息分拣和文本互动。
【生活娱乐】陪伴您度过愉快的生活，提供【全民唱跳】、【涂鸦作画】、【照相馆】等趣味玩法，AI 帮助您创作有趣的视频，记录生活美好的时刻，和朋友家人一起体会 AI 创作的乐趣。
【智能体创建】为您提供简单易上手的智能体配置创建能力，可以精准匹配你的需求，简单快捷创建您需要的工具，或您想要聊天的角色。
如果您在使用过程中遇到任何问题，欢迎您在应用内点击“我要反馈”进行反馈。我们会珍视每一个反馈，持续不断地学 * 和进步。

文小言（原文心一言 APP，官网 https://yiyan.baidu.com/），是百度旗下新搜索智能助手，基于文心大模型，提供搜索、创作、聊天等丰富多样的 AI 能力。

* 怎么问都可以：当你碰到问题，只要你有需求，即刻获得为您定制的回答。搜地图导航，搜休闲音乐，搜高清图片，搜专业百科，搜表格导图，什么都能搜！提问不设限，问文档，问图片，问对话，怎么问都可以！
* 记忆与自由订阅：只需让小言记住你的喜好，你的需求和你的日程安排。不只做你最贴心的提醒助手，帮你协调日程，助你健康生活，更是永远只站在你背后的朋友，回答更懂你，做只属于你的专项新闻小记者！
* 文章与图片创作：无论是汇报材料、美食点评、vlog 脚本，各种刚需文创一站式满足。绘画能力大升级，玩转生图
* 语聊数字人：口语外教或是虚拟女友，全语音对话，随时交互；纵横娱乐和专业，只要你要，小言就有！沉浸式聊天，超拟真对话态，更真实，更沉浸。
* 智能体助手团：小言已经为你定制了更专业的智能体专家团。只需说出你的需求，小言“智能体文创团”给你无限创意。更专，更垂，更精，更帮你忙，才是文小言。

清华大学智谱清言 ai（官网 https://chatglm.cn/）又称智谱 ai，是一款强大的人工智能助手，具备角色扮演、文本生成、代码生成、通用问答、多轮对话等功能，智能快速响应，方便快捷，解决不同的需要，让你轻松玩转 ai，适用于编程、文章创作、广告文案、写作等多种场合，操作简单！

智谱清言是清华大学计算机系知识工程研究室团队，是清华大学知识成果转化的创业公司。

讯飞星火认知大模型是科大讯飞（官网 https://www.xfyun.cn/）发布的大模型。该模型具有 7 大核心能力，即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模交互，该模型对标ChatGPT。

讯飞星火大模型，懂你的 AI 助手。作为全新一代认知智能大模型，讯飞星火具备“文案创作、图片生成、智能搜索、数据分析、提炼总结、智能翻译、灵感获取、创作润色以及代码编程”等能力。

全新发布的讯飞星火 V4.0，对标全球头部大模型厂商，新增“星火智能体、个人空间、日程待办与风格标签”能够高效处理复杂任务，解决你的工作与生活难题。

天工大模型（官网 https://www.tiangong.cn/）是昆仑万维自研的双千亿级大语言模型，是中国首个对标ChatGPT 的双千亿级大语言模型，可满足文案创作、知识问答、代码编程、逻辑推演、数理推算等需求。

天工比较擅长的领域包括——

【知识搜索】
天工能够解答众多领域的问题，包括科技、文化、历史、地理、经济、医学、财务、法律、生活常识等。
【AI 音乐创作】
天工支持“AI 音乐生成”功能，输入一段文字，再选择你想要的音乐风格，天工 AI 即可为你生成一首歌曲。
【AI 画画】
天工支持“文生图”功能，输入文字提示词，即可为你生成图画作品。
【文章撰写】
天工能够撰写各类文案，邮件、报告、策划、方案、脚本、小说、文摘、大纲都不在话下。天工还能智能改写、续写、扩写、缩写、生成摘要，关于文案的需求都能一键搞定。
【灵感助手】
天工能为您提供富有创意的建议，如行程规划、调研分析、活动创意等，为您带来源源不断的灵感。
【代码生成】
天工能够根据您的需求生成编程代码，涵盖 Python, C++, Java 等多种编程语言。

豆包（官网 https://www.doubao.com）是字节跳动旗下 AI 智能助手，为你的生活、学习、工作提供帮助。豆包可以为你搜索信息，答疑解惑，分析总结，提供灵感，辅助创作。豆包的知识渊博，专业可靠，同时也善解人意，需要的时候能够深入浅出。豆包也会倾听你的烦恼和心事，和你畅聊任何你感兴趣的话题。

豆包有着简单清爽的界面设计，无需学 *，让你一打开就可以使用。语音输入功能让你可以轻松输入，而且识别准确，还支持不同的方言，让沟通更简单、更高效。豆包还提供了多种音色，能用自然、亲切的声音回答你。

除了豆包自己，还有各种各样不同的 AI 智能体，能满足你在学 *、生活、创作、职业、情感等方面的需求，你也可以定制属于自己的 AI 智能体，选择你喜欢的说话风格、技能和背景。快来探索吧！

获取手机 App

DeepSeek 官方推出的免费 AI 助手