节目

0426深度求索:率道而行,端然正己

主播: 老杨
最近更新: 1天前时长: 07:15
每日先声 | 老杨谈谈
扫码下载蜻蜓app
听书/听小说/听故事
4.5亿用户的选择
节目简介

# DeepSeek V4大模型

# 激活参数调用机制

# 百万Token上下文窗口

# DSA注意力新技术

# 国产芯片适配方案

中国AI团队深度求索无预警推出开源DeepSeek V4大模型,同步更新官网并上线API接口。此前一年深度求索仅推出多次小版本更新,引发外界对其技术突破的猜测,此次V4一次性推出两个版本,完成前期技术积累的落地。
DeepSeek V4分为Pro旗舰版与Flash经济适用版,采用混合专家架构。混合专家架构通过激活参数调用机制,仅激活部分参数完成任务响应,实现了大总参数带来的充足知识储备,同时控制了推理成本,是深度求索敢于对标国际顶尖模型的底气。官方评测显示,Pro版在数学编程、逻辑推理等硬核领域可对标全球顶尖模型,超越绝大多数开源模型,仅在冷门世界知识储备上略逊于海外巨头模型。
DeepSeek V4将100万Token上下文作为标配,依托吸收注意力机制实现超长上下文处理。这项DSA注意力新技术可跳过无关内容仅聚焦相关信息,既控制了计算量爆炸,又实现了又长又低成本的上下文记忆能力,可支持整本书、完整大型代码库的处理。
深度求索宣布下半年将批量应用国产算力,目前已经完成国产芯片适配方案,完成与华为升腾系列芯片的深度适配,在国产算力平台可流畅运行。这一布局意味着即便无法采购海外高端芯片,深度求索仍可正常运行,同时作为开源标杆,将带动全产业链搭建国产算力生态。
深度求索V4发布稿结尾引用荀子“率道而行,端然正己”,过去一年深度求索默默打磨技术、适配国产算力,此次发布是中国AI技术实力与发展韧性的展示。

评论1条评论
Neo

Neo:翻译千问好用

1天前
回到顶部
/
收听历史
清空列表