**DeepSeek-V4 预览版正式上线** 国产通用大模型性能跻身全球第一梯队
标题:DeepSeek-V4 预览版正式上线 国产通用大模型性能跻身全球第一梯队 国内AI企业深度求索(DeepSeek)近日正式宣布,旗下新一代通用大模型DeepSeek-V4 预览版即日起正式对外开放体验,普通用户和企业开发者均可通过官方开放平台接入测试。 作为DeepSeek大模型系列的全新迭代产品,V4版本在底层架构和训练策略上均做了针对性优化,综合能力较上一代产品实现跨越式提升。
根据官方披露的测试数据,DeepSeek-V4在多个全球主流大模型基准测试中表现亮眼,其中MMLU大规模多任务语言理解准确率达89.1%,GSM8K小学数学测试准确率达94.7%,整体性能跻身全球通用大模型第一梯队。 该版本目前支持128K上下文窗口,可一次性处理约10万字的文本内容,同时具备成熟的多模态理解能力,可完成图表解读、图文推理等复杂交互任务。 针对垂直应用场景,DeepSeek-V4也做了专项优化,代码生成准确率较上一代提升22%,可覆盖从需求拆解、代码编写到调试修复的全流程开发辅助需求,大幅提升研发人员工作效率。
面向B端用户的专属微调接口也同步开放,企业可基于自身业务数据快速完成定制化适配,降低大模型落地的技术和成本门槛。 业内分析认为,DeepSeek-V4预览版的上线,是国内大模型技术追赶全球顶尖水平的重要标志。 随着通用大模型的推理能力、多模态理解能力持续突破,未来大模型将进一步渗透到科研、工业制造、企业服务等高复杂度场景,为千行百业的智能化升级提供核心技术支撑。
据了解,DeepSeek-V4正式版预计将于2024年下半年推出,届时将开放更长上下文窗口及更多垂直场景能力。
<< 上一篇
网友留言(0 条)