最新 AI 创业 产品 工具 应用 论文 笔记 markdown DeepSeek Qwen3 Github 开源项目 前端 RAG 知识图谱 OpenAI MCP Agent Manus 视频 即梦 可灵 短剧 数字人 AI工具 Python Coze 扣子空间 Dify 智能体 Cursor 多模态 效率 提示词 搜索 Transformer 产品经理 刘强东 京东 外卖 面试 巴菲特 游戏 强化学习 量化 关税 语音 redis Mistral 豆包 数据可视化 SaaS Deep Research DeepWiki Claude Ollama 2025 API
会议记录神器Get笔记:语音转文字+智能总结,免费600分钟超长待机!
会议记录神器Get笔记:语音转文字+智能总结,免费600分钟超长待机!
AI 语音爆发的这半年,一位「局中人」看到的赛道爆发逻辑
AI 语音爆发的这半年,一位「局中人」看到的赛道爆发逻辑
TEN VAD 企业级别的语音检测器开源了,效果非常好
TEN VAD 企业级别的语音检测器开源了,效果非常好
开源端到端语音大模型:直接从原始音频输入,生成语音输出
开源端到端语音大模型:直接从原始音频输入,生成语音输出
Parakeet 本地化语音识别转录部署指南并在pyVideoTrans中使用
Parakeet 本地化语音识别转录部署指南并在pyVideoTrans中使用
展商动态 | 云蝠智能携大模型语音交互智能体亮相WAIC 2025,解锁智能体协作新范式
展商动态 | 云蝠智能携大模型语音交互智能体亮相WAIC 2025,解锁智能体协作新范式
MiniMax-Speech,零样本语音合成新突破,32 种语言轻松拿捏!
MiniMax-Speech,零样本语音合成新突破,32 种语言轻松拿捏!
淘宝直播数字人:TTS语音合成技术
淘宝直播数字人:TTS语音合成技术
做语音识别现在还能融3000万美金?海外顶级VC押注AI-Native的语音交互,下一个操作系统级的机会!
做语音识别现在还能融3000万美金?海外顶级VC押注AI-Native的语音交互,下一个操作系统级的机会!
这款 AI 原生的语音输入法flow A轮融资 3000 万美金,体验碾压微信搜狗输入法
这款 AI 原生的语音输入法flow A轮融资 3000 万美金,体验碾压微信搜狗输入法
速递|AI语音助手Wispr Flow靠
速递|AI语音助手Wispr Flow靠"默念输入"A轮吸金3000万美元,40%用户非技术背景
速递|无代码AI语音Synthflow,获Accel领投2000万美元,4500万通话量攻破企业壁垒
速递|无代码AI语音Synthflow,获Accel领投2000万美元,4500万通话量攻破企业壁垒
AI 新工具,一键生成 PPT,还带“语音讲解”和“逐字稿”!
AI 新工具,一键生成 PPT,还带“语音讲解”和“逐字稿”!
微信悄悄修改语音发送界面,网友喊“丑”登顶微博热搜
微信悄悄修改语音发送界面,网友喊“丑”登顶微博热搜
割裂但上瘾!MiniMax AI语音逆天新玩法,一句话DIY任意音色
割裂但上瘾!MiniMax AI语音逆天新玩法,一句话DIY任意音色
MiniMax卷向AI语音生成!一句话定制任意音色、情感,免费可用
MiniMax卷向AI语音生成!一句话定制任意音色、情感,免费可用
搞定FunASR部署:修复离线加载与GUI集成的两大关键补丁
搞定FunASR部署:修复离线加载与GUI集成的两大关键补丁
让小爱音箱可播放任何想听的歌曲,还支持语音控制和本地音乐文件播放
让小爱音箱可播放任何想听的歌曲,还支持语音控制和本地音乐文件播放
SiriusXM 与 Narrativ 合作,为音频广告开发 AI 语音复制技术
SiriusXM 与 Narrativ 合作,为音频广告开发 AI 语音复制技术
GUIRoboTron-Speech:首个端到端语音交互智能体
GUIRoboTron-Speech:首个端到端语音交互智能体
谷歌上线 Search Live 语音搜索功能了
谷歌上线 Search Live 语音搜索功能了
美团提出首个语音交互GUI智能体,端到端语音训练能力优于传统文本训练
美团提出首个语音交互GUI智能体,端到端语音训练能力优于传统文本训练
C#实现语音预处理:降噪、静音检测、自动增益(附Demo源码) - zhuweisky
开发一个语音对话数字人
开发一个语音对话数字人
iOS微信8.0.60值得更新的3个功能!
iOS微信8.0.60值得更新的3个功能!
首个全面梳理语音大模型发展脉络的权威综述,入选ACL 2025主会
首个全面梳理语音大模型发展脉络的权威综述,入选ACL 2025主会
首个全面梳理语音大模型发展脉络的权威综述,入选ACL 2025主会
将任何内容一键转为语音播客 coze空间播客功能多场景实测与详细使用指南
将任何内容一键转为语音播客 coze空间播客功能多场景实测与详细使用指南
聊一聊语音对话机器人
聊一聊语音对话机器人
12K+ Star的离线语音神器!50MB模型秒杀云端API,隐私零成本,20+语种支持!
12K+ Star的离线语音神器!50MB模型秒杀云端API,隐私零成本,20+语种支持!
从文字到配音:AI语音克隆一站式生成配音和字幕
从文字到配音:AI语音克隆一站式生成配音和字幕
如何使用鸿蒙AI功能开发语音助手
如何使用鸿蒙AI功能开发语音助手
读2万字论文秒出播客,发个链接就能唠!揭秘豆包最新语音模型技术
读2万字论文秒出播客,发个链接就能唠!揭秘豆包最新语音模型技术
告别天价API账单!开源Chatterbox语音服务器上线,隐私与效率双赢!
告别天价API账单!开源Chatterbox语音服务器上线,隐私与效率双赢!
开源语音新巅峰!ChatTTS:笑声停顿皆可控,轻松克隆真人语音
开源语音新巅峰!ChatTTS:笑声停顿皆可控,轻松克隆真人语音
阿里开源语音黑科技!SenseVoice:50+语言识别、听懂你的情绪,速度超Whisper 15倍
阿里开源语音黑科技!SenseVoice:50+语言识别、听懂你的情绪,速度超Whisper 15倍
Kokoro TTS:一款强大的CLI文字转语音工具,能将文本快速转换为自然流畅的语音
Kokoro TTS:一款强大的CLI文字转语音工具,能将文本快速转换为自然流畅的语音
深度|AI语音独角兽11Labs创始人:“人性”中的不完美,恰恰是人愿意互动的关键
深度|AI语音独角兽11Labs创始人:“人性”中的不完美,恰恰是人愿意互动的关键
谷歌最新文本转语音TTS模型实测,一键生成多人播客(附教程)
谷歌最新文本转语音TTS模型实测,一键生成多人播客(附教程)
语音转字幕:从声音到文字的奇妙旅程
语音转字幕:从声音到文字的奇妙旅程
高效制作旁白神器:Abogen 助你快速搞定社交媒体语音内容
高效制作旁白神器:Abogen 助你快速搞定社交媒体语音内容
vui:小型对话式语音模型,能在本地设备上运行
vui:小型对话式语音模型,能在本地设备上运行
速递| 获a16z领投1700万美元,AI语音新星Toma意外切入汽车经销商,两周定制训练自动化
速递| 获a16z领投1700万美元,AI语音新星Toma意外切入汽车经销商,两周定制训练自动化
“text-to-speech”一款在线的免费文本转语音网站
“text-to-speech”一款在线的免费文本转语音网站
“TTSMaker”一款免费的文本转语音的在线工具
“TTSMaker”一款免费的文本转语音的在线工具
AI文本转语音进入“Next Level”!独角兽ElevenLabs发布Eleven v3:狠狠拿捏情感控制
AI文本转语音进入“Next Level”!独角兽ElevenLabs发布Eleven v3:狠狠拿捏情感控制
在视频翻译中使用 HuggingFace 上的众多模型进行语音识别
在视频翻译中使用 HuggingFace 上的众多模型进行语音识别
Z Potentials|冷月,00后打造AI语音平台Fish Audio,半年增长500万美元ARR,打造永不背叛AI语音陪伴
Z Potentials|冷月,00后打造AI语音平台Fish Audio,半年增长500万美元ARR,打造永不背叛AI语音陪伴
一年时间从0到1亿美元估值,要做语音领域的Scale AI,为什么语音数据比文本数据珍贵1000倍?
一年时间从0到1亿美元估值,要做语音领域的Scale AI,为什么语音数据比文本数据珍贵1000倍?
一年时间从0到1亿美元估值,要做语音领域的Scale AI,为什么语音数据比文本数据珍贵1000倍?
06-01榜单速递:AI模型决策透明化实战+多语言语音合成黑科技解析
06-01榜单速递:AI模型决策透明化实战+多语言语音合成黑科技解析
程序员圈爆火,狂揽2.4K星!1秒内AI语音双向对话,支持个性化发音和多端适配,颠覆你的交互想象!
程序员圈爆火,狂揽2.4K星!1秒内AI语音双向对话,支持个性化发音和多端适配,颠覆你的交互想象!
强化学习数据合成框架SynLogic及语音大模大模型评估
强化学习数据合成框架SynLogic及语音大模大模型评估
强大到逆天效果-强力推荐扣子空间新推出的双人语音播客AI自动生成功能
强大到逆天效果-强力推荐扣子空间新推出的双人语音播客AI自动生成功能
[开源APP推荐] Mumble - 高质量、低延迟的免费群组语音聊天应用
[开源APP推荐] Mumble - 高质量、低延迟的免费群组语音聊天应用
速递|Anthropic推出Claude语音模式,卡位AI语音入口
速递|Anthropic推出Claude语音模式,卡位AI语音入口