最新 AI 创业 产品 工具 应用 论文 笔记 markdown DeepSeek Qwen3 Github 开源项目 前端 RAG 知识图谱 OpenAI MCP Agent Manus 视频 即梦 可灵 短剧 数字人 AI工具 Python Coze 扣子空间 Dify 智能体 Cursor 多模态 效率 提示词 搜索 Transformer 产品经理 刘强东 京东 外卖 面试 巴菲特 游戏 强化学习 量化 关税 语音 redis Mistral 豆包 数据可视化 SaaS Deep Research DeepWiki Claude Ollama 2025 API
多模态BUG修复新SOTA:慕尼黑工大GUIRepair登上SWE-bench Multimodal榜单第一
快手可灵团队提出MIDAS:压缩比64倍、延迟低于500ms,多模态互动数字人框架实现交互生成新突破
聚焦结构化注意力,探索提升多模态大模型文档问答性能
聚焦结构化注意力,探索提升多模态大模型文档问答性能 - vivo互联网技术
Nano Banana 爆火背后:谷歌藏了个 “多模态工具箱”?
多模态大模型持续学习系列研究,综述+Benchmark+方法+Codebase一网打尽!
DeepSeek、GPT-5都在尝试的快慢思考切换,有了更智能版本,还是多模态
做一个「运维知识库 + 多模态检索问答」的案例
谷歌2.5 Image:『你是我的神』,准备丢掉PS了
多模态融合新纪元:Ovis2.5 本地部署教程,实现文本、图像与代码的深度协同推理
We-Math 2.0:全新多模态数学推理数据集 × 首个综合数学知识体系
ICCV 2025 | 打造通用工具智能体的基石:北大提出ToolVQA数据集,引领多模态多步推理VQA新范式
融资2.5亿美金,硅谷几个顶级VC都投了,从零到独角兽只用3年
多模态大模型在化学与材料学的「体检表」——哪些能力靠谱,哪些还差很远?
GLM-4.5V 是怎么炼成的|深度拆解
保姆级教程:部署你的AI桌面助手
多模态大脑建模技术迈入新纪元:Meta 10亿参数模型获Algonauts 2025大脑建模竞赛冠军
“迁移学习+多模态融合”真香警告!抄思路就能发一篇
“迁移学习+多模态融合”真香警告!抄思路就能发一篇
Apache SeaTunnel 新定位!迈向多模态数据集成的统一工具
智谱开源的GLM4.5V到底行不行?掏出祖传多模态理解测试!
智谱开源的GLM4.5V到底行不行?掏出祖传多模态理解测试!
刚刚,智谱开源了他们的最强多模态模型,GLM-4.5V。
刚刚,智谱开源了他们的最强多模态模型,GLM-4.5V。
「多模态」智谱再次上桌,glm-4.5V 开源
「多模态」智谱再次上桌,glm-4.5V 开源
多模态大模型统一布局生成方法微调数据集设计及模型架构统一训练思路
多模态大模型统一布局生成方法微调数据集设计及模型架构统一训练思路
AI 编程冲击来袭,程序员怎么办?IDEA研究院张磊:底层系统能力才是护城河
AI 编程冲击来袭,程序员怎么办?IDEA研究院张磊:底层系统能力才是护城河
开源播客创作工具!网页/PDF/视频秒变专业播客,NotebookLM平替神器!
开源播客创作工具!网页/PDF/视频秒变专业播客,NotebookLM平替神器!
MiMo-VL-7B:小米开源多模态大模型的“逆袭”之路,这波技术操作我给满分!
MiMo-VL-7B:小米开源多模态大模型的“逆袭”之路,这波技术操作我给满分!
【探展WAIC】从“眼见为虚”到“AI识真”:如何用大模型筑造多模态鉴伪盾牌
【探展WAIC】从“眼见为虚”到“AI识真”:如何用大模型筑造多模态鉴伪盾牌
GPT-5 技术发布会全解析:从推理范式突破到多模态能力革新
GPT-5 技术发布会全解析:从推理范式突破到多模态能力革新
博士招生 | 英国兰卡斯特大学 多模态大模型PhD招生
博士招生 | 英国兰卡斯特大学 多模态大模型PhD招生
陈天桥联手代季峰筹备新AI公司;小红书开源多模态大模型丨AIGC日报
陈天桥联手代季峰筹备新AI公司;小红书开源多模态大模型丨AIGC日报
北京内推 | 阿里夸克大模型团队招聘多模态大模型算法工程师/实习生
北京内推 | 阿里夸克大模型团队招聘多模态大模型算法工程师/实习生
乌鸦AI日报:OpenAI 或于明日凌晨发布 GPT-5;OpenAI 正以 5000 亿美元估值进行股票出售谈判
乌鸦AI日报:OpenAI 或于明日凌晨发布 GPT-5;OpenAI 正以 5000 亿美元估值进行股票出售谈判
从“字”到“画”:基于Elasticsearch Serverless 的多模态商品搜索实践
从“字”到“画”:基于Elasticsearch Serverless 的多模态商品搜索实践