Deepseek v1.0.8

92次阅读
没有评论

共计 4057 个字符,预计需要花费 11 分钟才能阅读完成。

DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司。DeepSeek 是一家创新型科技公司,成立于 2023 年 7 月 17 日,使用数据蒸馏技术,得到更为精炼、有用的数据。由知名私募巨头幻方量化孕育而生。专注于开发先进的大语言模型(LLM)和相关技术。注册地址:浙江省杭州市拱墅区环城北路 169 号汇金国际大厦西 1 幢 1201 室。法定代表人为裴湉,经营范围包括技术服务、技术开发、软件开发等。

2024 年 1 月 5 日,发布 DeepSeek LLM(深度求索的第一个大模型)。1 月 25 日,发布 DeepSeek-Coder。2 月 5 日,发布 DeepSeekMath。3 月 11 日,发布 DeepSeek-VL。5 月 7 日,发布 DeepSeek-V2。6 月 17 日,发布 DeepSeek-Coder-V2。9 月 5 日,更新 API 支持文档,宣布合并 DeepSeek Coder V2 和 DeepSeek V2 Chat,推出 DeepSeek V2.5。12 月 13 日,发布 DeepSeek-VL2。12 月 26 日晚,正式上线 DeepSeek-V3 首个版本并同步开源。2025 年 1 月 31 日,英伟达宣布 DeepSeek-R1 模型登陆 NVIDIANIM。同一时段内,亚马逊和微软也接入 DeepSeek-R1 模型。英伟达称,DeepSeek-R1 是最先进的大语言模型。

Deepseek v1.0.8

DeepSeek-R1 已发布并开源,性能对标 OpenAI o1 正式版,DeepSeek-V3 在推理速度上相较历史模型有了大幅提升。在目前大模型主流榜单中,DeepSeek-V3 在开源模型中位列榜首,与世界上最先进的闭源模型不分伯仲。

DeepSeek-V3 的综合能力

DeepSeek-V3 在推理速度上相较历史模型有了大幅提升。

在目前大模型主流榜单中,DeepSeek-V3 在开源模型中位列榜首,与世界上最先进的闭源模型不分伯仲。

Benchmark (Metric) DeepSeek V3 DeepSeek V2.5 Qwen2.5 Llama3.1 Claude-3.5 GPT-4o
0905 72B-Inst 405B-Inst Sonnet-1022 0513
Architecture MoE MoE Dense Dense - -
# Activated Params 37B 21B 72B 405B - -
# Total Params 671B 236B 72B 405B - -
English MMLU (EM) 88.5 80.6 85.3 88.6 88.3 87.2
MMLU-Redux (EM) 89.1 80.3 85.6 86.2 88.9 88.0
MMLU-Pro (EM) 75.9 66.2 71.6 73.3 78.0 72.6
DROP (3-shot F1) 91.6 87.8 76.7 88.7 88.3 83.7
IF-Eval (Prompt Strict) 86.1 80.6 84.1 86.0 86.5 84.3
GPQA-Diamond (Pass@1) 59.1 41.3 49.0 51.1 65.0 49.9
SimpleQA (Correct) 24.9 10.2 9.1 17.1 28.4 38.2
FRAMES (Acc.) 73.3 65.4 69.8 70.0 72.5 80.5
LongBench v2 (Acc.) 48.7 35.4 39.4 36.1 41.0 48.1
Code HumanEval-Mul (Pass@1) 82.6 77.4 77.3 77.2 81.7 80.5
LiveCodeBench (Pass@1-COT) 40.5 29.2 31.1 28.4 36.3 33.4
LiveCodeBench (Pass@1) 37.6 28.4 28.7 30.1 32.8 34.2
Codeforces (Percentile) 51.6 35.6 24.8 25.3 20.3 23.6
SWE Verified (Resolved) 42.0 22.6 23.8 24.5 50.8 38.8
Aider-Edit (Acc.) 79.7 71.6 65.4 63.9 84.2 72.9
Aider-Polyglot (Acc.) 49.6 18.2 7.6 5.8 45.3 16.0
Math AIME 2024 (Pass@1) 39.2 16.7 23.3 23.3 16.0 9.3
MATH-500 (EM) 90.2 74.7 80.0 73.8 78.3 74.6
CNMO 2024 (Pass@1) 43.2 10.8 15.9 6.8 13.1 10.8
Chinese CLUEWSC (EM) 90.9 90.4 91.4 84.7 85.4 87.9
C-Eval (EM) 86.5 79.5 86.1 61.5 76.7 76.0
C-SimpleQA (Correct) 64.1 54.1 48.4 50.4 51.3 59.3

通义(官网 https://www.tiangong.cn/)阿里 AI 大模型,是一款超大规模预训练模型,是您日常办公、学 * 提效、生活娱乐的 AI 超级助理;为您提供全方位、方便快捷的协助。

通义具备以下核心能力:
【日常办公】在文档撰写、实时录音、文档 / 网页速读、代码生成解释等方面提供高效的办公服务;1000 万字长文本、一键速读 1000 份资料,能实现跨文档的摘要、分析和内容创作。
【学 * 提效】在线解析网页、论文与图书,实现多文本摘要和结构化总结,助力学生党快速获取知识、文字工作者一键生成摘要、各行业信息分拣和文本互动。
【生活娱乐】陪伴您度过愉快的生活,提供【全民唱跳】、【涂鸦作画】、【照相馆】等趣味玩法,AI 帮助您创作有趣的视频,记录生活美好的时刻,和朋友家人一起体会 AI 创作的乐趣。
【智能体创建】为您提供简单易上手的智能体配置创建能力,可以精准匹配你的需求,简单快捷创建您需要的工具,或您想要聊天的角色。
如果您在使用过程中遇到任何问题,欢迎您在应用内点击“我要反馈”进行反馈。我们会珍视每一个反馈,持续不断地学 * 和进步。

文小言(原文心一言 APP,官网 https://yiyan.baidu.com/),是百度旗下新搜索智能助手,基于文心大模型,提供搜索、创作、聊天等丰富多样的 AI 能力。

* 怎么问都可以:当你碰到问题,只要你有需求,即刻获得为您定制的回答。搜地图导航,搜休闲音乐,搜高清图片,搜专业百科,搜表格导图,什么都能搜!提问不设限,问文档,问图片,问对话,怎么问都可以!
* 记忆与自由订阅:只需让小言记住你的喜好,你的需求和你的日程安排。不只做你最贴心的提醒助手,帮你协调日程,助你健康生活,更是永远只站在你背后的朋友,回答更懂你,做只属于你的专项新闻小记者!
* 文章与图片创作:无论是汇报材料、美食点评、vlog 脚本,各种刚需文创一站式满足。绘画能力大升级,玩转生图
* 语聊数字人:口语外教或是虚拟女友,全语音对话,随时交互;纵横娱乐和专业,只要你要,小言就有!沉浸式聊天,超拟真对话态,更真实,更沉浸。
* 智能体助手团:小言已经为你定制了更专业的智能体专家团。只需说出你的需求,小言“智能体文创团”给你无限创意。更专,更垂,更精,更帮你忙,才是文小言。

清华大学智谱清言 ai(官网 https://chatglm.cn/)又称智谱 ai,是一款强大的人工智能助手,具备角色扮演、文本生成、代码生成、通用问答、多轮对话等功能,智能快速响应,方便快捷,解决不同的需要,让你轻松玩转 ai,适用于编程、文章创作、广告文案、写作等多种场合,操作简单!

智谱清言是清华大学计算机系知识工程研究室团队,是清华大学知识成果转化的创业公司。

讯飞星火认知大模型是 科大讯飞 (官网 https://www.xfyun.cn/) 发布的大模型。该模型具有 7 大核心能力,即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模交互,该模型对标ChatGPT

讯飞星火大模型,懂你的 AI 助手。作为全新一代认知智能大模型,讯飞星火具备“文案创作、图片生成、智能搜索、数据分析、提炼总结、智能翻译、灵感获取、创作润色以及代码编程”等能力。

全新发布的讯飞星火 V4.0,对标全球头部大模型厂商,新增“星火智能体、个人空间、日程待办与风格标签”能够高效处理复杂任务,解决你的工作与生活难题。

天工大模型(官网 https://www.tiangong.cn/)是 昆仑万维 自研的双千亿级大语言模型 ,是中国首个对标ChatGPT 的双千亿级大语言模型,可满足文案创作、知识问答、代码编程、逻辑推演、数理推算等需求。

天工比较擅长的领域包括——

【知识搜索】
天工能够解答众多领域的问题,包括科技、文化、历史、地理、经济、医学、财务、法律、生活常识等。
【AI 音乐创作】
天工支持“AI 音乐生成”功能,输入一段文字,再选择你想要的音乐风格,天工 AI 即可为你生成一首歌曲。
【AI 画画】
天工支持“文生图”功能,输入文字提示词,即可为你生成图画作品。
【文章撰写】
天工能够撰写各类文案,邮件、报告、策划、方案、脚本、小说、文摘、大纲都不在话下。天工还能智能改写、续写、扩写、缩写、生成摘要,关于文案的需求都能一键搞定。
【灵感助手】
天工能为您提供富有创意的建议,如行程规划、调研分析、活动创意等,为您带来源源不断的灵感。
【代码生成】
天工能够根据您的需求生成编程代码,涵盖 Python, C++, Java 等多种编程语言。

豆包(官网 https://www.doubao.com)是字节跳动旗下 AI 智能助手,为你的生活、学习、工作提供帮助。豆包可以为你搜索信息,答疑解惑,分析总结,提供灵感,辅助创作。豆包的知识渊博,专业可靠,同时也善解人意,需要的时候能够深入浅出。豆包也会倾听你的烦恼和心事,和你畅聊任何你感兴趣的话题。

豆包有着简单清爽的界面设计,无需学 *,让你一打开就可以使用。语音输入功能让你可以轻松输入,而且识别准确,还支持不同的方言,让沟通更简单、更高效。豆包还提供了多种音色,能用自然、亲切的声音回答你。

除了豆包自己,还有各种各样不同的 AI 智能体,能满足你在学 *、生活、创作、职业、情感等方面的需求,你也可以定制属于自己的 AI 智能体,选择你喜欢的说话风格、技能和背景。快来探索吧!

获取手机 App
DeepSeek 官方推出的免费 AI 助手
Deepseek v1.0.8
下载地址

蓝奏云

密码:7fpr

百度云盘

密码:aj9z

正文完
 
admin
版权声明:本站原创文章,由 admin 2025-02-05发表,共计4057字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。若链接失效,请回复此篇文章获取最新链接。
评论(没有评论)
验证码