最新
AI
创业
产品
工具
应用
论文
笔记
markdown
DeepSeek
Qwen3
Github
开源项目
前端
RAG
知识图谱
OpenAI
MCP
Agent
Manus
视频
即梦
可灵
短剧
数字人
AI工具
Python
Coze
扣子空间
Dify
智能体
Cursor
多模态
效率
提示词
搜索
Transformer
产品经理
刘强东
京东
外卖
面试
巴菲特
游戏
强化学习
量化
关税
语音
redis
Mistral
豆包
数据可视化
SaaS
Deep Research
DeepWiki
Claude
Ollama
2025
API
统一框架下的具身多模态推理:自变量机器人让AI放下海德格尔的锤子
机器之心 · 2小时前 ·
阅读原文
百度推出首个多模态高度融合数字人
· 21小时前 ·
阅读原文
形式化证明迈向多模态,MLLM正确率仅4%!港科大等推出全新基准
新智元 · 1天前 ·
阅读原文
直击CVPR现场:中国玩家展商面前人从众,腾讯40+篇接收论文亮眼
关注前沿科技 · 1天前 ·
阅读原文
北京内推 | 联想研究院人工智能实验室招聘多模态算法实习生
帮你找工作的 · 1天前 ·
阅读原文
松下发布多模态大模型,文本、图像、音频随意切换
· 1天前 ·
阅读原文
多模态通用感知大模型的技术演进与应用探索
青稞 · 1天前 ·
阅读原文
细粒度视觉推理链引入数学领域,准确率暴涨32%,港中文MMLab打破多模态数学推理瓶颈
关注前沿科技 · 1天前 ·
阅读原文
工业异常检测新突破,复旦等多模态融合监测入选CVPR 2025
关注前沿科技 · 2天前 ·
阅读原文
如何选择最佳多模态大模型压缩方案?哈工大、度小满开源EFFIVLM-BENCH基准测试框架
机器之心 · 2天前 ·
阅读原文
通过对话即可执行DNA、RNA和蛋白质任务,InstaDeep提出多模态智能体ChatNT
ScienceAI · 2天前 ·
阅读原文
如何选择最佳多模态大模型压缩方案?哈工大、度小满开源EFFIVLM-BENCH基准测试框架
· 2天前 ·
阅读原文
多模态大一统新架构!蚂蚁提出Ming-Omni!融合图像,文本,语音三模态!多模态任务一网打尽
妙妙房 · 2天前 ·
阅读原文
CVPR 2025 Highlight | 国科大等新方法破译多模态「黑箱」,精准揪出犯错元凶
· 3天前 ·
阅读原文
英伟达提出最强「描述一切」模型 (DAM),可生成图像或视频特定区域的详细描述,拿下7个基准SOTA!
AIGC Studio · 3天前 ·
阅读原文
TokLIP:融合理解与生成的新一代多模态视觉Tokenizer
· 3天前 ·
阅读原文
多模态RAG的三类图文问答实现方式,你知道多少种?
筱可AI研习社 · 3天前 ·
阅读原文
刚刚,ChatGPT 多模态更新,Canvas 现在支持下载 PDF、代码、3D 模型
关注科技资讯 · 4天前 ·
阅读原文
突破多模态图像翻译难题:ABS-Mamba借SAM2、CNN、Mamba及LoRA+微调创佳绩 !
AI 引擎 · 5天前 ·
阅读原文
6月12日AI新品爆发!多模态、轻量化、开源成主流,这些模型值得关注
静静和小沐沐 · 5天前 ·
阅读原文
人大-清华-腾讯发布:音频 - 视觉多模态任务统一框架
CourseAI · 5天前 ·
阅读原文
CVPR 2025 多模态大一统:斯坦福 x 复旦提出符号主义建模生成式任务
机器之心 · 5天前 ·
阅读原文
CVPR 2025 多模态大一统:斯坦福 x 复旦提出符号主义建模生成式任务
· 6天前 ·
阅读原文
阶跃星辰走“窄门”
马舒叶 · 6天前 ·
阅读原文
AI真有希望考清北了!豆包1.6多模态推理发威,闯关数理化带图大题
新智元 · 6天前 ·
阅读原文
CVPR 2025 | 多模态统一学习新范式来了,数据、模型、代码全部开源
机器之心 · 6天前 ·
阅读原文
CVPR 2025 | 多模态统一学习新范式来了,数据、模型、代码全部开源
· 6天前 ·
阅读原文
CVPR2025 | 多模态LLM评测Tutorial
· 1周前 ·
阅读原文
ACL 2025 | 多维阅卷,智识觉醒:港科广打开多模态大模型看图写作评估的认知之门
让你更懂AI的 · 1周前 ·
阅读原文
蚂蚁集团开源的Ming-Lite-Omni:多模态大模型的“全能王”,你不可不知!
AGI小兵 · 1周前 ·
阅读原文
突破多模态图像翻译难题:ABS-Mamba借SAM2、CNN、Mamba及LoRA+微调创佳绩 !
AI 引擎 · 1周前 ·
阅读原文
从文本到多模态,Embedding 模型选型指南
玄姐 · 1周前 ·
阅读原文
像素空间推理揭秘「o3」关键技术:好奇心驱动RL解锁多模态推理全新范式
· 1周前 ·
阅读原文
地铁换乘都搞不定?ReasonMap基准揭示多模态大模型细粒度视觉推理短板
· 1周前 ·
阅读原文
比自回归更灵活、比离散扩散更通用,首个纯Discrete Flow Matching多模态巨兽降临
机器之心 · 1周前 ·
阅读原文
×
加载中...