凯发·k8(国际) - 官方网站

研究领域 2型糖尿病 肥胖症 代谢功能障碍相关脂肪性肝炎 阿片类药物引起的便秘 先天性高胰岛素血症 新闻中心 新药研发 药学研究 加入凯发k8 关于凯发k8国际 公司概况 凯发k8国际 研究成果 AI应用 糖尿病 肥胖问题 非酒精性脂肪肝 高尿酸血症 阿兹海默症 肠胃道炎

AI应用

K8凯发旗舰厅(中国)官方网站计算机|DeepSeek V|高樹千佳子|3发布加

  近日◈✿◈,DeepSeek-V3的正式发版引起AI业内广泛高度关注◈✿◈,其在保证了模型能力的前提下◈✿◈,训练效率和推理速度大幅提升◈✿◈。我们认为◈✿◈,DeepSeek新一代模型的发布意味着AI大模型的应用将逐步走向普惠◈✿◈,助力AI应用广泛落地◈✿◈;同时训练效率大幅提升凯发vip◈✿◈,◈✿◈,亦将助力推理算力需求高增高樹千佳子◈✿◈。我们持续看好AI产业链的加速落地机遇◈✿◈,建议重点关注AI应用◈✿◈、AI Infra◈✿◈、AI算力三大主线K8凯发旗舰厅(中国)官方网站◈✿◈。

  12月26日◈✿◈,DeepSeek-V3(深度求索)首个版本正式发布并同步开源◈✿◈,已在网页端和API全面上线◈✿◈。其在训练效率和推理速度上相较历史模型有了大幅提升高樹千佳子◈✿◈,同时可保证领先的模型能力表现◈✿◈,引起业内高度关注◈✿◈。

  参考官方论文◈✿◈,DeepSeek v3为6710亿参数MoE架构模型◈✿◈,激活37B◈✿◈,在14.8T token上进行了预训练◈✿◈。能力上◈✿◈,模型暂不支持多模态输入◈✿◈,但在通识和专业知识测试集上表现优秀◈✿◈,MMLU pro正确率75.9%◈✿◈,GPQA-Diamond正确率59.1%◈✿◈,达到国内第一梯队◈✿◈,接近Claude 3.5 Sonnet的水平◈✿◈;并且在数学和代码领域测试表现突出◈✿◈,MATH 500正确率90.2%◈✿◈,SWE-bench正确率42.0%◈✿◈,Codeforces得分51.6◈✿◈,超越所有非o系列模型◈✿◈。模型生成速度达到60TPS◈✿◈,是前代模型的三倍◈✿◈。定价上◈✿◈,API定价为输入每百万tokens 0.5元(缓存命中)/2元(缓存未命中)◈✿◈,输出每百万tokens 8元◈✿◈,与字节Doubao-pro-256k定价输入每百万tokens 5元◈✿◈,输出每百万tokens 9元的水平相当K8凯发旗舰厅(中国)官方网站◈✿◈,在国产模型中性价比较高◈✿◈。

  豆包pro◈✿◈、DeepSeek v3等国产模型连续发布◈✿◈。模型能力上高樹千佳子K8凯发旗舰厅(中国)官方网站◈✿◈,国产模型在文本和知识能力上接近GPT-4K8凯发旗舰厅(中国)官方网站◈✿◈、Claude◈✿◈、Llama等海外前沿模型水平◈✿◈,多模态能力逐步完备◈✿◈,逻辑和代码能力在非o1技术路线下达到可用水平◈✿◈。价格上◈✿◈,国产模型API百万tokens输出普遍定价10元以内◈✿◈,是GPT-4o的1/3甚至更低高樹千佳子◈✿◈。我们预计模型性价比持续提升下K8凯发旗舰厅(中国)官方网站◈✿◈,国内AI应用依托丰富生态和成熟流量加速各领域落地K8凯发旗舰厅(中国)官方网站◈✿◈。其中◈✿◈,Agent模式有望以更长的任务流程◈✿◈、更好的场景理解◈✿◈、更高的自主能力药理研究◈✿◈!◈✿◈,成为所有互联网用户的数字助手◈✿◈,在企业管理◈✿◈、教育◈✿◈、办公◈✿◈、金融等领域展现应用价值◈✿◈。

  1)训练效率大幅提升◈✿◈,GPT4的训练成本约为DeepSeek V3的6.2倍◈✿◈。根据DeepSeek V3的官方技术文档◈✿◈,本次DeepSeek的训练仅使用了2048个H800 GPU◈✿◈,总训练GPU卡时为2788千小时(其中预训练为2664千小时)K8凯发旗舰厅(中国)官方网站◈✿◈,平均到每个GPU上◈✿◈,仅为1361小时◈✿◈,约合56.7天◈✿◈。与之相对比◈✿◈,根据英伟达CEO黄仁勋在GTC2024上的演讲内容◈✿◈,GPT-4 MoE使用8000个H100训练了90天凯发国际官网◈✿◈,◈✿◈,合计约为17280千卡时◈✿◈,相当于DeepSeek V3的6.2倍◈✿◈。

  2)训练效率提升归因◈✿◈:我们认为DeepSeek V3训练提效的原因主要包括低精度计算高樹千佳子◈✿◈、小参数量◈✿◈、高质量数据等方面◈✿◈。精度方面◈✿◈,根据英伟达官方文档◈✿◈,其GPU的8位精度算力通常是16位精度算力的2倍◈✿◈,因此数据精度从FP16降低到FP8可以贡献一倍效率提升◈✿◈。参数方面◈✿◈,GPT-4 MoE模型总参数量达到1800B◈✿◈,而按照DeepSeek V3官方文档◈✿◈,其总参数量只有671B◈✿◈,约为GPT-4 MoE的1/3◈✿◈,同时高樹千佳子◈✿◈,DeepSeek的激活参数大约为37B◈✿◈,而GPT4-MoE每次推理激活的参数量约为280B◈✿◈,二者约为7.57倍关系◈✿◈;数据方面◈✿◈,GPT-4 MoE使用了13万亿(1300B)token◈✿◈,而DeepSeek V3使用的token数量约为14.8万亿(1480B)◈✿◈,数据量相差不大◈✿◈,但DeepSeek V3技术文档提及了使用模型生成训练数据等凯发k8官网下载客户端中心◈✿◈,◈✿◈,因此我们认为数据质量或有较大幅度提升◈✿◈。此外◈✿◈,采用负载均衡◈✿◈、更好的流水线策略亦是其官方提及的提升训练效率的重要原因凯发k8国际首页登录◈✿◈,◈✿◈。

  3)从推理侧助推AI普惠◈✿◈,带动推理算力需求倍增◈✿◈,打开更广阔算力市场空间凯发,凯发k8,K8◈✿◈,◈✿◈。我们认为◈✿◈,DeepSeek模型相比GPT4模型更小的参数量也意味着更低的推理成本◈✿◈,推理成本的降低K8凯发旗舰厅(中国)官方网站◈✿◈,将是AI应用普及的前奏◈✿◈,正如4G提速降费给我国移动互联网产业提供了助力◈✿◈。当前AI应用渗透率仍然较低◈✿◈,产业仍在早期◈✿◈,根据我们在2024年12月13日外发的报告《计算机行业“智能网联”系列报告54—算力需求测算◈✿◈:Agent+Sora》◈✿◈,随着Agent成为流量入口◈✿◈,渗透率达到30%左右◈✿◈,全球Agent的推理token数量将增长3个数量级以上高樹千佳子◈✿◈,且视频生成与实时视频理解等形态的AI同样有望带来巨量需求增长◈✿◈,并且根据我们对视频生成模型的测算◈✿◈,视频推理算力需求将有望达到训练算力需求的2-3个数量级以上◈✿◈。算力需求的指数级提升与模型训练推理成本的下降将构成产业飞轮◈✿◈,带动全产业链扩张◈✿◈,随着AI进一步普及到日常生活与产业当中◈✿◈,我们认为推理算力需求将仍然驱动AI算力产业链持续增长◈✿◈。

  AI核心技术发展不及预期◈✿◈,AI被不当使用造成严重社会影响◈✿◈,企业数据安全风险◈✿◈,信息安全风险◈✿◈,行业竞争加剧◈✿◈。

  ▍投资策略◈✿◈:建议关注AI全产业相关投资机会◈✿◈,综合梳理以下投资主线)AI 应用◈✿◈:伴随模型能力升级◈✿◈,Agent等应用形式有望加速落地◈✿◈,带动办公◈✿◈、教育◈✿◈、管理◈✿◈、端侧◈✿◈、具身智能等应用领域公司加速兑现业绩弹性◈✿◈。

凯发·k8(国际) - 官方网站| http://www.hydpyxgs.com