文章列表

最新 AI 创业产品工具应用论文笔记 markdown DeepSeek Qwen3 Github 开源项目前端 RAG 知识图谱 OpenAI MCP Agent Manus 视频即梦可灵短剧数字人 AI工具 Python Coze 扣子空间 Dify 智能体 Cursor 多模态效率提示词搜索 Transformer 产品经理刘强东京东外卖面试巴菲特游戏强化学习量化关税语音 redis Mistral 豆包数据可视化 SaaS Deep Research DeepWiki Claude Ollama 2025 API

GPT-5来了！8月发布，多模态AI改写未来

GPT-5来了！8月发布，多模态AI改写未来

DS · 1天前 · 阅读原文

三阶段式多模态RAG竞赛获奖方案及问题拆解DAG+路由式RAG思路

三阶段式多模态RAG竞赛获奖方案及问题拆解DAG+路由式RAG思路

刘焕勇 · 2天前 · 阅读原文

卷出新高度！智谱GLM-4.5深度实测：AI“全家桶”真的好用吗？

像素呼吸 · 2天前 · 阅读原文

MMGraphRAG：通过可解释的多模态知识图谱桥接视觉与语言模型

MMGraphRAG：通过可解释的多模态知识图谱桥接视觉与语言模型

Wolfgang · 2天前 · 阅读原文

端云＋多模态”新范式：《移远通信AI大模型技术方案白皮书》正式发布

端云＋多模态”新范式：《移远通信AI大模型技术方案白皮书》正式发布

· 2天前 · 阅读原文

多阶段的多模态RAG幻觉缓解方案：智能眼镜等实时交互场景比赛方案-MM-RAG

多阶段的多模态RAG幻觉缓解方案：智能眼镜等实时交互场景比赛方案-MM-RAG

llmnlp · 3天前 · 阅读原文

火山引擎多模态数据湖：AI时代的数据湖如何挖掘图片、视频、语音的“富矿”？

字节跳动数据平台 · 3天前 · 阅读原文

科学能力太强，这个多模态推理「六边形战士」被严重低估！Intern-S1开源登顶

科学能力太强，这个多模态推理「六边形战士」被严重低估！Intern-S1开源登顶

新智元 · 4天前 · 阅读原文

多阶段+验证式多模态RAG竞赛获奖方案及竖排文档古籍数据合成、OCR总结

多阶段+验证式多模态RAG竞赛获奖方案及竖排文档古籍数据合成、OCR总结

刘焕勇 · 4天前 · 阅读原文

智象未来亮相 WAIC：多模态智能体，重塑创作的未来版图

智象未来亮相 WAIC：多模态智能体，重塑创作的未来版图

奔跑的小象 · 4天前 · 阅读原文

多模态大模型，真的「懂」世界吗？——揭秘 MLLM 的核心知识缺陷

机器之心 · 5天前 · 阅读原文

多模态大模型，真的「懂」世界吗？——揭秘 MLLM 的核心知识缺陷

多模态大模型，真的「懂」世界吗？——揭秘 MLLM 的核心知识缺陷

关注AI的 · 5天前 · 阅读原文

AI遇上华夏上古，复旦、上智院、上海创智学院联合发布早期中华文明多模态大模型

ScienceAI · 5天前 · 阅读原文

【CVPR 2025】即插即用，思维链数据集 + 多模态微调，14 项基准性能碾压 GPT-4o！

【CVPR 2025】即插即用，思维链数据集 + 多模态微调，14 项基准性能碾压 GPT-4o！

AI模块工坊 · 5天前 · 阅读原文

99%的时序工具都过时了！多模态LLM才是终极解决方案？

99%的时序工具都过时了！多模态LLM才是终极解决方案？

时序之心 · 5天前 · 阅读原文

一文搞懂多模态大模型：视觉-语言模型（VLM）

一文搞懂多模态大模型：视觉-语言模型（VLM）

AllenTang · 6天前 · 阅读原文

国资+腾讯入局！阶跃星辰5亿融资冲击10亿营收

国资+腾讯入局！阶跃星辰5亿融资冲击10亿营收

DS · 6天前 · 阅读原文

Intern-S1发布8小时内，我用了8000万Tokens生成了3000篇ACL2025论文解读博客！

Intern-S1发布8小时内，我用了8000万Tokens生成了3000篇ACL2025论文解读博客！

闻星 · 6天前 · 阅读原文

深度｜海豚智能发布超声多模态大模型，百度百舸为“看懂超声”注入核心算力引擎

深度｜海豚智能发布超声多模态大模型，百度百舸为“看懂超声”注入核心算力引擎

Z Potentials · 6天前 · 阅读原文

全能高手&科学明星，上海AI实验室开源发布『书生』科学多模态大模型Intern-S1 | WAIC 2025

全能高手&科学明星，上海AI实验室开源发布『书生』科学多模态大模型Intern-S1 | WAIC 2025

Intern-S1 · 6天前 · 阅读原文

实测爆火的阶跃星辰Step 3，性能SOTA，开源多模态推理之王

机器之心 · 6天前 · 阅读原文

阶跃星辰发布新一代基模 Step 3，原生多模态推理模型，性能达到开源 SOTA

阶跃星辰发布新一代基模 Step 3，原生多模态推理模型，性能达到开源 SOTA

阶跃星辰 · 1周前 · 阅读原文

也看多模态文档训练数据该如何合成？DocGenome、MonkeyOCR方案

也看多模态文档训练数据该如何合成？DocGenome、MonkeyOCR方案

刘焕勇 · 1周前 · 阅读原文

文生图模型攻击论文原理笔记 - 永是珞珈一恐龙

永是珞珈一恐龙 · 1周前 · 阅读原文

阶跃发布会划重点：全新基模推理效率可达DeepSeek 300%、芯片大佬站台、神秘资方签约

阶跃发布会划重点：全新基模推理效率可达DeepSeek 300%、芯片大佬站台、神秘资方签约

程茜 · 1周前 · 阅读原文

多模态大模型点燃医疗AI革命 —— ChatGPT-4o与未来医疗的全景展望

多模态大模型点燃医疗AI革命 —— ChatGPT-4o与未来医疗的全景展望

Wolfgang · 1周前 · 阅读原文

BLIP3-o统一图像生成与理解，多模态融合趋势显现

BLIP3-o统一图像生成与理解，多模态融合趋势显现

CourseAI · 1周前 · 阅读原文

ACM MM 2025 | ISDrama让剧本“动”起来！多模态生成沉浸式空间戏剧

ACM MM 2025 | ISDrama让剧本“动”起来！多模态生成沉浸式空间戏剧

张彧 · 1周前 · 阅读原文

如何利用多模态大模型进行淘宝商品理解?

如何利用多模态大模型进行淘宝商品理解?

场景智能技术团队 · 1周前 · 阅读原文

一文搞懂大语言模型如何进化为多模态大模型？

一文搞懂大语言模型如何进化为多模态大模型？

AllenTang · 1周前 · 阅读原文

“多模态融合+迁移学习”真香！思路模仿一下就能再来一篇！

“多模态融合+迁移学习”真香！思路模仿一下就能再来一篇！

· 1周前 · 阅读原文

首个多模态工业信号基座模型FISHER，权重已开源，来自清华&上交等

首个多模态工业信号基座模型FISHER，权重已开源，来自清华&上交等

· 1周前 · 阅读原文

3种方案揭秘多模态AI黑箱运行机制

3种方案揭秘多模态AI黑箱运行机制

CourseAI · 1周前 · 阅读原文

让数据为 AI 所用：构建企业级 AI 原生多模态数据智能平台

让数据为 AI 所用：构建企业级 AI 原生多模态数据智能平台

李松 · 1周前 · 阅读原文

多模态RAG知识平台建设思路

· 1周前 · 阅读原文

首个多模态工业信号基座模型FISHER，权重已开源，来自清华&上交等

首个多模态工业信号基座模型FISHER，权重已开源，来自清华&上交等

· 1周前 · 阅读原文

多模态RAG技术：从语义抽取到VLM应用与规模化挑战

多模态RAG技术：从语义抽取到VLM应用与规模化挑战

金海 · 1周前 · 阅读原文

字节的SoloPK腾讯的Codebuddy，产品经理终于开始“多模态”工作了

字节的SoloPK腾讯的Codebuddy，产品经理终于开始“多模态”工作了

Kevin那些事儿 · 1周前 · 阅读原文

RAG的下半场：当大模型学会“看图说话”，我们的知识库将如何进化？

RAG的下半场：当大模型学会“看图说话”，我们的知识库将如何进化？

abby 兔子小姐 · 1周前 · 阅读原文

多模态大模型在OCR生成上表现如何？多页文档理解数据集Doc-750K

多模态大模型在OCR生成上表现如何？多页文档理解数据集Doc-750K

刘焕勇 · 1周前 · 阅读原文

多模态情感分析——基于多尺度自适应跨模态注意力融合（MACAF）的三模态情感分析

多模态情感分析——基于多尺度自适应跨模态注意力融合（MACAF）的三模态情感分析

· 1周前 · 阅读原文

多模态“卷王”阶跃星辰：如何利用 JuiceFS 打造高效经济的大模型存储平台 - JuiceFS

JuiceFS · 1周前 · 阅读原文

多模态视觉语言模型FILA-细粒度分辨率融合策略

多模态视觉语言模型FILA-细粒度分辨率融合策略

余俊晖 · 1周前 · 阅读原文

余家辉：OpenAI多模态灵魂人物，30岁年薪1亿美金，字节Seed负责人吴永辉嫡系弟子

余家辉：OpenAI多模态灵魂人物，30岁年薪1亿美金，字节Seed负责人吴永辉嫡系弟子

ZF编辑部 · 1周前 · 阅读原文

大模型长文生成思路：融合多模态配图+细粒度引用方案-DeepWriter

大模型长文生成思路：融合多模态配图+细粒度引用方案-DeepWriter

· 1周前 · 阅读原文

登上Nature正刊！哈佛等团队多模态医学图像新突破！

登上Nature正刊！哈佛等团队多模态医学图像新突破！

AI前沿速递 · 1周前 · 阅读原文

多模态都是假的：最强模型数不清手指、认不出雷碧

叶小钗 · 1周前 · 阅读原文

2025必将是多模态融合爆发的一年！127种创新思路汇总！

2025必将是多模态融合爆发的一年！127种创新思路汇总！

· 1周前 · 阅读原文