DeepSeek识图模式全面开放,500亿募资加速多模态AI竞争

2026年5月,中国AI领域迎来重磅消息:DeepSeek正式向所有用户开放”识图模式”,并同步曝出高达500亿元人民币的新一轮融资。这两大动作标志着DeepSeek从纯文本大模型迈向多模态AI的全面进化,也折射出中国AI公司在全球资本寒冬中的逆势生长。

DeepSeek识图模式:多模态能力的全面开放

5月10日起,DeepSeek App端正式全面上线”识图模式”,所有用户均可免费使用。该功能基于DeepSeek自研的多模态大模型DeepSeek-VL3,支持六大核心识别能力:

  • 物体识别:覆盖超过2000种常见物品类别,从电子产品到日常用品,准确率超过90%。
  • 场景与地标识别:可快速识别全球知名地标和室内外场景,支持旅行导览和位置分析。
  • 动植物识别:支持数千种动植物物种鉴定,准确率达92%以上,是植物爱好者和宠物主人的实用工具。
  • 文字OCR:中英文手写体和印刷体高精度识别,支持表格、名片、菜单等结构化提取。
  • 人脸属性分析:可识别人脸年龄、表情、性别等属性,同时内置严格的隐私保护机制。
  • 医疗影像辅助:支持X光片、CT影像的初步辅助判别,已与多家三甲医院开展合作测试。
DeepSeek多模态AI技术概念图

技术层面,DeepSeek-VL3采用动态分辨率适配机制,最高可处理8K分辨率图像,在保持高精度识别的同时显著降低推理成本。其多模态对齐框架有效抑制了”视觉幻觉”问题——即模型看到不存在的内容——这一直是视觉AI领域的顽疾。更值得关注的是,识图模式支持端侧推理,用户手机上的图像无需上传云端即可完成识别,从根源上保障了用户隐私。

根据官方路线图,识图模式从5月10日开始分批上线,首批覆盖中英双语用户,预计6月底前完成全球所有语区的开放。业界普遍认为,DeepSeek此举将直接对标OpenAI的GPT-4o视觉能力和Google Gemini的多模态生态,国内多模态AI竞争将进入白热化阶段。

500亿募资:资本寒冬中的超级独角兽

与识图模式同步曝光的,是DeepSeek母公司深度求索即将完成的新一轮融资。据多家科技媒体披露,本轮融资金额高达500亿元人民币(约69亿美元),由新加坡淡马锡和高瓴资本联合领投,阿里巴巴、腾讯跟投,中东主权基金亦有参与。

若交易完成,DeepSeek的投后估值将达到约1600亿元人民币(约220亿美元),成为中国估值最高的AI初创公司之一。这笔巨额资金将主要用于三大方向:算力基础设施扩建(采购更多GPU集群)、多模态模型持续研发、以及海外市场拓展。

AI投资与技术创新概念图

市场分析人士指出,DeepSeek的高估值反映了全球资本对中国AI原生企业的持续看多。在中国大模型赛道竞争日益激烈的背景下——百度文心、阿里通义千问、字节豆包等巨头环伺——DeepSeek凭借开源策略和技术透明度,成功建立了开发者社区的信任护城河。此次500亿融资将进一步拉大其与第二梯队的技术差距。

行业影响与未来展望

识图模式的全面开放,意味着DeepSeek完成了从”纯文本助手”到”多模态AI平台”的关键转型。结合近期上线的联网搜索、代码解释器等能力,DeepSeek正在构建一个完整的AI工具体系。在商业化层面,视觉理解能力将为其打开电商、医疗、教育、安防等多个垂直领域的应用场景。

然而,挑战同样存在。全球范围内,OpenAI、Google、Anthropic等巨头在多模态领域持续迭代,国内竞品也在加速追赶。DeepSeek能否将技术领先转化为可持续的商业模式,将是下一阶段的核心命题。

© 版权声明

相关文章