DeepSeek多模态模型来了已公布技术报告

admin wap (6) 2026-04-30 22:57:30

每经记者｜叶晓丹每经编辑｜廖丹

4月30日，《每日经济新闻》记者注意到，DeepSeek在Github上正式发布了多模态模型，公布了背后的技术报告。

DeepSeek多模态模型来了已公布技术报告 (http://www.paipi.cn/) wap 第1张图片来源：Github网站

DeepSeek在技术报告中提到，尽管多模态大语言模型（MLLMs）取得了显著进展，但主流的思维链（CoT）范式仍主要局限于语言学领域。虽然近期研究重点通过高分辨率裁剪技术（例如基于图像的思考）来弥合感知鸿沟，却忽视了一个更根本的瓶颈：参照鸿沟。自然语言固有的模糊性往往无法为复杂的空间布局提供精确、明确的指引，导致需要严谨参照的任务出现逻辑崩溃。

而DeepSeek多模态技术报告提出基于视觉原语的思考——这一创新推理框架将点、边界框等空间标记提升为“思维的基本单元”。通过将这些视觉原语直接融入思考过程，DeepSeek的模型在“推理”时能够“指代”，从而将其认知轨迹有效锚定在图像的物理坐标中。

值得注意的是，DeepSeek技术报告提到，其框架基于高度优化的架构，具备极高的视觉标记效率。尽管模型规模紧凑且图像标记预算显著较低，DeepSeek的多模态模型在具有挑战性的计数和空间推理基准测试上，能够与GPT-5.4、Claude-Sonnet-4.6和 Gemini-3-Flash等前沿模型匹配。这为开发更高效、更具可扩展性的System-2类多模态智能指明了方向。

THE END

两个月融资两轮、估值超百亿元！灵心巧手创始人周永：从未考虑行业热度，“我只想做机器猫的口袋”

生态环境部：争取年内引入首批金融机构参与全国碳排放权交易市场

DeepSeek多模态模型来了已公布技术报告

相关文章阅读

生态环境部：争取年内引入首批金融机构参与全国碳排放权交易市场

一图速览！酒类上市公司2025年报出炉

一图速览！酒类上市公司2026年一季报

德林海迎AI眼镜“大佬”？祝铭明拟斥资逾4亿元入股：仅为财务投资目的

栏目最新文章

克罗斯：门德斯是当今最佳左后卫，但奥利塞成功压制了他

最热文章

生态环境部：争取年内引入首批金融机构参与全国碳排放权交易市场

巨人网络史玉柱被重庆证监局出具警示函，因公司2020年一笔关联交易

湖南海利拟参与丰乐农化51%股权公开竞价；科蓝软件涉嫌信披违规被立案｜公告精选

华瑞股份原实控人又被监管问责 1883万元业绩补偿仍未履行

A股铜压延板块大涨之际，江西铜业宣布拟分拆子公司江铜铜箔赴港上市，股东包括蜂巢能源、中信证券等

朝鲜展示在俄乌战场缴获的西方武器，包括“豹”-2、M1A1“艾布拉姆斯”坦克！普京：铭记俄朝士兵并肩作战的英勇事迹

安世半导体控制权仍受限，闻泰科技去年亏损87亿元！5月6日起“披星戴帽”

一图速览！酒类上市公司2025年报出炉

DeepSeek多模态模型来了已公布技术报告

一图速览！酒类上市公司2026年一季报

DeepSeek多模态模型来了 已公布技术报告

相关文章阅读

生态环境部：争取年内引入首批金融机构参与全国碳排放权交易市场

一图速览！酒类上市公司2025年报出炉

一图速览！酒类上市公司2026年一季报

德林海迎AI眼镜“大佬”？ 祝铭明拟斥资逾4亿元入股 ：仅为财务投资目的

栏目最新文章

克罗斯：门德斯是当今最佳左后卫，但奥利塞成功压制了他

最热文章

生态环境部：争取年内引入首批金融机构参与全国碳排放权交易市场

巨人网络史玉柱被重庆证监局出具警示函，因公司2020年一笔关联交易

湖南海利拟参与丰乐农化51%股权公开竞价；科蓝软件涉嫌信披违规被立案｜公告精选

华瑞股份原实控人又被监管问责 1883万元业绩补偿仍未履行

A股铜压延板块大涨之际，江西铜业宣布拟分拆子公司江铜铜箔赴港上市，股东包括蜂巢能源、中信证券等

朝鲜展示在俄乌战场缴获的西方武器，包括“豹”-2、M1A1“艾布拉姆斯”坦克！普京：铭记俄朝士兵并肩作战的英勇事迹

安世半导体控制权仍受限，闻泰科技去年亏损87亿元！5月6日起“披星戴帽”

一图速览！酒类上市公司2025年报出炉

DeepSeek多模态模型来了 已公布技术报告

一图速览！酒类上市公司2026年一季报

DeepSeek多模态模型来了已公布技术报告

德林海迎AI眼镜“大佬”？祝铭明拟斥资逾4亿元入股：仅为财务投资目的

DeepSeek多模态模型来了已公布技术报告