最新 AI 创业 产品 工具 应用 论文 笔记 markdown DeepSeek Qwen3 Github 开源项目 前端 RAG 知识图谱 OpenAI MCP Agent Manus 视频 即梦 可灵 短剧 数字人 AI工具 Python Coze 扣子空间 Dify 智能体 Cursor 多模态 效率 提示词 搜索 Transformer 产品经理 刘强东 京东 外卖 面试 巴菲特 游戏 强化学习 量化 关税 语音 redis Mistral 豆包 数据可视化 SaaS Deep Research DeepWiki Claude Ollama 2025 API
统一框架下的具身多模态推理:自变量机器人让AI放下海德格尔的锤子
百度推出首个多模态高度融合数字人
百度推出首个多模态高度融合数字人
形式化证明迈向多模态,MLLM正确率仅4%!港科大等推出全新基准
形式化证明迈向多模态,MLLM正确率仅4%!港科大等推出全新基准
直击CVPR现场:中国玩家展商面前人从众,腾讯40+篇接收论文亮眼
直击CVPR现场:中国玩家展商面前人从众,腾讯40+篇接收论文亮眼
北京内推 | 联想研究院人工智能实验室招聘多模态算法实习生
北京内推 | 联想研究院人工智能实验室招聘多模态算法实习生
松下发布多模态大模型,文本、图像、音频随意切换
松下发布多模态大模型,文本、图像、音频随意切换
多模态通用感知大模型的技术演进与应用探索
多模态通用感知大模型的技术演进与应用探索
细粒度视觉推理链引入数学领域,准确率暴涨32%,港中文MMLab打破多模态数学推理瓶颈
细粒度视觉推理链引入数学领域,准确率暴涨32%,港中文MMLab打破多模态数学推理瓶颈
工业异常检测新突破,复旦等多模态融合监测入选CVPR 2025
工业异常检测新突破,复旦等多模态融合监测入选CVPR 2025
如何选择最佳多模态大模型压缩方案?哈工大、度小满开源EFFIVLM-BENCH基准测试框架
通过对话即可执行DNA、RNA和蛋白质任务,InstaDeep提出多模态智能体ChatNT
如何选择最佳多模态大模型压缩方案?哈工大、度小满开源EFFIVLM-BENCH基准测试框架
如何选择最佳多模态大模型压缩方案?哈工大、度小满开源EFFIVLM-BENCH基准测试框架
多模态大一统新架构!蚂蚁提出Ming-Omni!融合图像,文本,语音三模态!多模态任务一网打尽
多模态大一统新架构!蚂蚁提出Ming-Omni!融合图像,文本,语音三模态!多模态任务一网打尽
CVPR 2025 Highlight | 国科大等新方法破译多模态「黑箱」,精准揪出犯错元凶
CVPR 2025 Highlight | 国科大等新方法破译多模态「黑箱」,精准揪出犯错元凶
英伟达提出最强「描述一切」模型 (DAM),可生成图像或视频特定区域的详细描述,拿下7个基准SOTA!
英伟达提出最强「描述一切」模型 (DAM),可生成图像或视频特定区域的详细描述,拿下7个基准SOTA!
TokLIP:融合理解与生成的新一代多模态视觉Tokenizer
TokLIP:融合理解与生成的新一代多模态视觉Tokenizer
多模态RAG的三类图文问答实现方式,你知道多少种?
多模态RAG的三类图文问答实现方式,你知道多少种?
刚刚,ChatGPT 多模态更新,Canvas 现在支持下载 PDF、代码、3D 模型
刚刚,ChatGPT 多模态更新,Canvas 现在支持下载 PDF、代码、3D 模型
突破多模态图像翻译难题:ABS-Mamba借SAM2、CNN、Mamba及LoRA+微调创佳绩 !
突破多模态图像翻译难题:ABS-Mamba借SAM2、CNN、Mamba及LoRA+微调创佳绩 !
6月12日AI新品爆发!多模态、轻量化、开源成主流,这些模型值得关注
6月12日AI新品爆发!多模态、轻量化、开源成主流,这些模型值得关注
人大-清华-腾讯发布:音频 - 视觉多模态任务统一框架
人大-清华-腾讯发布:音频 - 视觉多模态任务统一框架
CVPR 2025 多模态大一统:斯坦福 x 复旦提出符号主义建模生成式任务
CVPR 2025 多模态大一统:斯坦福 x 复旦提出符号主义建模生成式任务
CVPR 2025 多模态大一统:斯坦福 x 复旦提出符号主义建模生成式任务
阶跃星辰走“窄门”
阶跃星辰走“窄门”
AI真有希望考清北了!豆包1.6多模态推理发威,闯关数理化带图大题
AI真有希望考清北了!豆包1.6多模态推理发威,闯关数理化带图大题
CVPR 2025 | 多模态统一学习新范式来了,数据、模型、代码全部开源
CVPR 2025 | 多模态统一学习新范式来了,数据、模型、代码全部开源
CVPR 2025 | 多模态统一学习新范式来了,数据、模型、代码全部开源
CVPR2025 | 多模态LLM评测Tutorial
CVPR2025 | 多模态LLM评测Tutorial
ACL 2025 | 多维阅卷,智识觉醒:港科广打开多模态大模型看图写作评估的认知之门
ACL 2025 | 多维阅卷,智识觉醒:港科广打开多模态大模型看图写作评估的认知之门
蚂蚁集团开源的Ming-Lite-Omni:多模态大模型的“全能王”,你不可不知!
蚂蚁集团开源的Ming-Lite-Omni:多模态大模型的“全能王”,你不可不知!
突破多模态图像翻译难题:ABS-Mamba借SAM2、CNN、Mamba及LoRA+微调创佳绩 !
突破多模态图像翻译难题:ABS-Mamba借SAM2、CNN、Mamba及LoRA+微调创佳绩 !
从文本到多模态,Embedding 模型选型指南
从文本到多模态,Embedding 模型选型指南
像素空间推理揭秘「o3」关键技术:好奇心驱动RL解锁多模态推理全新范式
像素空间推理揭秘「o3」关键技术:好奇心驱动RL解锁多模态推理全新范式
地铁换乘都搞不定?ReasonMap基准揭示多模态大模型细粒度视觉推理短板
地铁换乘都搞不定?ReasonMap基准揭示多模态大模型细粒度视觉推理短板
比自回归更灵活、比离散扩散更通用,首个纯Discrete Flow Matching多模态巨兽降临