最新
AI
创业
产品
工具
DeepSeek
Qwen3
Github
开源项目
前端
RAG
OpenAI
MCP
Agent
Manus
视频
数字人
AI工具
Python
Coze
扣子空间
Dify
智能体
Cursor
多模态
效率
提示词
搜索
Transformer
产品经理
刘强东
京东
外卖
用多模态LLM超越YOLOv3!强化学习突破多模态感知极限|开源
关注前沿科技 · 12小时前 ·
原文
阿里Qwen3多模态大模型:功能全、速度快,全面体验分享
朝圣的猫 · 2天前 ·
原文
显存暴降50%!阿里开源旗舰多模态模型,GPU救星来了
· 2天前 ·
原文
五一不给休息了,Qwen又开源Omni-3B模型
· 3天前 ·
原文
多模态RAG演进-MRAG1.0->MRAG2.0->MRAG3.0
余俊晖 · 3天前 ·
原文
科大讯飞研发总监王磊磊将在AICon 上海分享多模态降噪技术的实践与应用
AICon 全球人工智能开发与应用大会 · 3天前 ·
原文
北京内推 | 中电信人工智能公司招聘多模态大模型算法实习生
帮你找工作的 · 3天前 ·
原文
NVIDIA Eagle 2.5:用80亿参数挑战长文本多模态学习的极限
· 3天前 ·
原文
创新驱动,稳健前行——智象未来荣登【星辰100】2025中国AI产业逐浪者榜单
奔跑的小象 · 4天前 ·
原文
揭秘AI未来核心!拆解多模态大模型三层架构设计
多模态智能体 · 4天前 ·
原文
Qwen3 发布,阿里也要靠多模态和性价比打天下了
涯山 · 4天前 ·
原文
阿里Qwen3 多模态大模型 全新发布 手搓版试用报告
朝圣的猫 · 4天前 ·
原文
33,000美元奖金池!Meta CRAG-MM挑战赛开启,多模态RAG巅峰对决
让你更懂AI的 · 4天前 ·
原文
东南&港中文&复旦联合提出LMM-R1 | 双引擎强化,3B小模型推理性能飙升4.8%,领跑多模态泛化
AGI灵魂写手 · 4天前 ·
原文
调用多模态模型时,你是否遇到我这个问题?
法号轻尘 · 5天前 ·
原文
浙大+阿里提出快慢思考新方法:在多模态Reasoning上准确率涨10%,长度砍半
编辑部 · 5天前 ·
原文
错过血亏!2025顶会超火方向:多模态目标检测发论文稳了!
· 5天前 ·
原文
乌鸦AI日报:国内首个多模态AI程序员正式上岗;谷歌被曝每月巨资贿赂三星,助推 Gemini 应用预装
· 5天前 ·
原文
图像编辑开源新SOTA,来自多模态卷王阶跃!大模型行业正步入「多模态时间」
关注前沿科技 · 5天前 ·
原文
博士招生 | 每月最高2W澳币 澳门大学 郑哲东课题组 招收多模态方向博士
AI前沿速递 · 5天前 ·
原文
月之暗面最新开源模型!Kimi-Audio:革新多模态音频处理,统一音频理解、生成与对话!
痕小子 · 5天前 ·
原文
多模态大模型轻量化探索-视觉大模型SAM的视觉编码器
余俊晖 · 6天前 ·
原文
从零手搓MCP多模态引擎到对接DeepSeek:保姆级图文搜索系统搭建全记录
阿文 · 6天前 ·
原文
探索InternVL3:开源多模态大模型的最新突破
法号轻尘 · 6天前 ·
原文
ICLR 2025 | 计算开销减半!Dynamic-LLaVA刷新多模态大模型推理加速上限
让你更懂AI的 · 6天前 ·
原文
从拍照识物到拍照理解意图,夸克如何用一个AI相机,撬动多模态交互的未来
AI产品黄叔 · 6天前 ·
原文
「拍照问夸克」,从「Know-What」到「Get it Done」的跃迁
张勇毅 · 6天前 ·
原文
多模态大模型痛点全解析!这两篇论文硬核出击!
AI前沿速递 · 6天前 ·
原文
DAM-3B大显身手!多模态AI如何精准“读懂”图像和视频
· 6天前 ·
原文
阿里发布多模态UniME:硬负样本+知识蒸馏=性能天花板,准确率暴涨27%
编辑部 · 1周前 ·
原文
全面评测文心X1/4.5 Turbo!思维链升级,推理白菜价,多模态被玩疯了
陈骏达 · 1周前 ·
原文
多模态技术爆发元年,行业应用如何落地?
李忠良 · 1周前 ·
原文
首届CogMAEC@MM’25研讨会求稿,探索认知驱动的多模态情感与共情智能
编辑部 · 1周前 ·
原文
腾讯低调开源「作业终结者」:3B参数实现多模态SOTA,数学物理全通吃
让你更懂AI的 · 1周前 ·
原文
金融领域推理大模型DianJin-R1、Fin-R1及文档转markdown、docx的多模态大模型做法
刘焕勇 · 1周前 ·
原文
首篇多模态CoT综述 | 2万字带你领略跨模态推理框架与AGI进化路径,重构机器人/医疗/ADAS技术底座
AGI灵魂写手 · 1周前 ·
原文
Skywork R1V2:多模态混合强化学习突破推理能力新高度、Trillion-7B:高效韩语多语言大模型技术报告
无影寺 · 1周前 ·
原文
Skywork R1V2:多模态混合强化学习突破推理能力新高度
无影寺 · 1周前 ·
原文
NVIDIA发布DAM-3B:让图像和视频的局部描述“有模有样”!
基咯咯 · 1周前 ·
原文
全球首个工业界多模态推理模型Skywork-R1V
· 1周前 ·
原文
3B级别新SOTA!腾讯低调开源的多模态“小”模型,有望做“AI作业帮”,还能端侧部署
机智流科技 · 1周前 ·
原文
UniToken:多模态AI的“全能选手”,一次编码搞定图文理解与图像生成!
关注前沿科技 · 1周前 ·
原文
小白学大模型:多模态 Qwen2.5-VL
· 1周前 ·
原文
AI大模型开发实战指南:从多模态到情感计算
铁蛋 · 1周前 ·
原文
设备预测性维护进入2.0时代:多模态AI如何突破误报困局
· 1周前 ·
原文
关于多模态编码位置的简单思考
Khazzz1c · 1周前 ·
原文
Liquid:字节最新开源的多模态LLM,视觉与语言统一生成!
昕科技 · 1周前 ·
原文
多模态RAG:解读检索、重排、精炼三大关键技术
CourseAI · 1周前 ·
原文
多模态幻觉新突破!NUS、复旦团队提出跨模态偏好优化新范式,幻觉率直降55.5%
让你更懂AI的 · 1周前 ·
原文
×
加载中...