凯发·k8(国际) - 官方网站_AI应用_K8凯发旗舰厅(中国)官方网站计算机

K8凯发旗舰厅(中国)官方网站计算机｜DeepSeek V|高樹千佳子|3发布加

2025-04-30 凯发k8国际生物

　　近日◈✿◈，DeepSeek-V3的正式发版引起AI业内广泛高度关注◈✿◈，其在保证了模型能力的前提下◈✿◈，训练效率和推理速度大幅提升◈✿◈。我们认为◈✿◈，DeepSeek新一代模型的发布意味着AI大模型的应用将逐步走向普惠◈✿◈，助力AI应用广泛落地◈✿◈；同时训练效率大幅提升凯发vip◈✿◈，◈✿◈，亦将助力推理算力需求高增高樹千佳子◈✿◈。我们持续看好AI产业链的加速落地机遇◈✿◈，建议重点关注AI应用◈✿◈、AI Infra◈✿◈、AI算力三大主线K8凯发旗舰厅(中国)官方网站◈✿◈。

　　12月26日◈✿◈，DeepSeek-V3（深度求索）首个版本正式发布并同步开源◈✿◈，已在网页端和API全面上线◈✿◈。其在训练效率和推理速度上相较历史模型有了大幅提升高樹千佳子◈✿◈，同时可保证领先的模型能力表现◈✿◈，引起业内高度关注◈✿◈。

　　参考官方论文◈✿◈，DeepSeek v3为6710亿参数MoE架构模型◈✿◈，激活37B◈✿◈，在14.8T token上进行了预训练◈✿◈。能力上◈✿◈，模型暂不支持多模态输入◈✿◈，但在通识和专业知识测试集上表现优秀◈✿◈，MMLU pro正确率75.9%◈✿◈，GPQA-Diamond正确率59.1%◈✿◈，达到国内第一梯队◈✿◈，接近Claude 3.5 Sonnet的水平◈✿◈；并且在数学和代码领域测试表现突出◈✿◈，MATH 500正确率90.2%◈✿◈，SWE-bench正确率42.0%◈✿◈，Codeforces得分51.6◈✿◈，超越所有非o系列模型◈✿◈。模型生成速度达到60TPS◈✿◈，是前代模型的三倍◈✿◈。定价上◈✿◈，API定价为输入每百万tokens 0.5元（缓存命中）/2元（缓存未命中）◈✿◈，输出每百万tokens 8元◈✿◈，与字节Doubao-pro-256k定价输入每百万tokens 5元◈✿◈，输出每百万tokens 9元的水平相当K8凯发旗舰厅(中国)官方网站◈✿◈，在国产模型中性价比较高◈✿◈。

　　豆包pro◈✿◈、DeepSeek v3等国产模型连续发布◈✿◈。模型能力上高樹千佳子K8凯发旗舰厅(中国)官方网站◈✿◈，国产模型在文本和知识能力上接近GPT-4K8凯发旗舰厅(中国)官方网站◈✿◈、Claude◈✿◈、Llama等海外前沿模型水平◈✿◈，多模态能力逐步完备◈✿◈，逻辑和代码能力在非o1技术路线下达到可用水平◈✿◈。价格上◈✿◈，国产模型API百万tokens输出普遍定价10元以内◈✿◈，是GPT-4o的1/3甚至更低高樹千佳子◈✿◈。我们预计模型性价比持续提升下K8凯发旗舰厅(中国)官方网站◈✿◈，国内AI应用依托丰富生态和成熟流量加速各领域落地K8凯发旗舰厅(中国)官方网站◈✿◈。其中◈✿◈，Agent模式有望以更长的任务流程◈✿◈、更好的场景理解◈✿◈、更高的自主能力药理研究◈✿◈！◈✿◈，成为所有互联网用户的数字助手◈✿◈，在企业管理◈✿◈、教育◈✿◈、办公◈✿◈、金融等领域展现应用价值◈✿◈。

　　1）训练效率大幅提升◈✿◈，GPT4的训练成本约为DeepSeek V3的6.2倍◈✿◈。根据DeepSeek V3的官方技术文档◈✿◈，本次DeepSeek的训练仅使用了2048个H800 GPU◈✿◈，总训练GPU卡时为2788千小时（其中预训练为2664千小时）K8凯发旗舰厅(中国)官方网站◈✿◈，平均到每个GPU上◈✿◈，仅为1361小时◈✿◈，约合56.7天◈✿◈。与之相对比◈✿◈，根据英伟达CEO黄仁勋在GTC2024上的演讲内容◈✿◈，GPT-4 MoE使用8000个H100训练了90天凯发国际官网◈✿◈，◈✿◈，合计约为17280千卡时◈✿◈，相当于DeepSeek V3的6.2倍◈✿◈。

　　2）训练效率提升归因◈✿◈：我们认为DeepSeek V3训练提效的原因主要包括低精度计算高樹千佳子◈✿◈、小参数量◈✿◈、高质量数据等方面◈✿◈。精度方面◈✿◈，根据英伟达官方文档◈✿◈，其GPU的8位精度算力通常是16位精度算力的2倍◈✿◈，因此数据精度从FP16降低到FP8可以贡献一倍效率提升◈✿◈。参数方面◈✿◈，GPT-4 MoE模型总参数量达到1800B◈✿◈，而按照DeepSeek V3官方文档◈✿◈，其总参数量只有671B◈✿◈，约为GPT-4 MoE的1/3◈✿◈，同时高樹千佳子◈✿◈，DeepSeek的激活参数大约为37B◈✿◈，而GPT4-MoE每次推理激活的参数量约为280B◈✿◈，二者约为7.57倍关系◈✿◈；数据方面◈✿◈，GPT-4 MoE使用了13万亿（1300B）token◈✿◈，而DeepSeek V3使用的token数量约为14.8万亿（1480B）◈✿◈，数据量相差不大◈✿◈，但DeepSeek V3技术文档提及了使用模型生成训练数据等凯发k8官网下载客户端中心◈✿◈，◈✿◈，因此我们认为数据质量或有较大幅度提升◈✿◈。此外◈✿◈，采用负载均衡◈✿◈、更好的流水线策略亦是其官方提及的提升训练效率的重要原因凯发k8国际首页登录◈✿◈，◈✿◈。

　　3）从推理侧助推AI普惠◈✿◈，带动推理算力需求倍增◈✿◈，打开更广阔算力市场空间凯发,凯发k8,K8◈✿◈，◈✿◈。我们认为◈✿◈，DeepSeek模型相比GPT4模型更小的参数量也意味着更低的推理成本◈✿◈，推理成本的降低K8凯发旗舰厅(中国)官方网站◈✿◈，将是AI应用普及的前奏◈✿◈，正如4G提速降费给我国移动互联网产业提供了助力◈✿◈。当前AI应用渗透率仍然较低◈✿◈，产业仍在早期◈✿◈，根据我们在2024年12月13日外发的报告《计算机行业“智能网联”系列报告54—算力需求测算◈✿◈：Agent+Sora》◈✿◈，随着Agent成为流量入口◈✿◈，渗透率达到30%左右◈✿◈，全球Agent的推理token数量将增长3个数量级以上高樹千佳子◈✿◈，且视频生成与实时视频理解等形态的AI同样有望带来巨量需求增长◈✿◈，并且根据我们对视频生成模型的测算◈✿◈，视频推理算力需求将有望达到训练算力需求的2-3个数量级以上◈✿◈。算力需求的指数级提升与模型训练推理成本的下降将构成产业飞轮◈✿◈，带动全产业链扩张◈✿◈，随着AI进一步普及到日常生活与产业当中◈✿◈，我们认为推理算力需求将仍然驱动AI算力产业链持续增长◈✿◈。

　　AI核心技术发展不及预期◈✿◈，AI被不当使用造成严重社会影响◈✿◈，企业数据安全风险◈✿◈，信息安全风险◈✿◈，行业竞争加剧◈✿◈。

　　▍投资策略◈✿◈：建议关注AI全产业相关投资机会◈✿◈，综合梳理以下投资主线）AI 应用◈✿◈：伴随模型能力升级◈✿◈，Agent等应用形式有望加速落地◈✿◈，带动办公◈✿◈、教育◈✿◈、管理◈✿◈、端侧◈✿◈、具身智能等应用领域公司加速兑现业绩弹性◈✿◈。