最新
AI
创业
产品
工具
应用
论文
笔记
markdown
DeepSeek
Qwen3
Github
开源项目
前端
RAG
知识图谱
OpenAI
MCP
Agent
Manus
视频
即梦
可灵
短剧
数字人
AI工具
Python
Coze
扣子空间
Dify
智能体
Cursor
多模态
效率
提示词
搜索
Transformer
产品经理
刘强东
京东
外卖
面试
巴菲特
游戏
强化学习
量化
关税
语音
redis
Mistral
豆包
数据可视化
SaaS
Deep Research
DeepWiki
Claude
Ollama
2025
API
硅谷顶级VC如何看语音AI?Greylock合伙人揭秘语音Agent构建的三层策略
深思圈 · 2天前 ·
阅读原文
470万美元种子轮背后:这位华人CEO如何用语音AI征服硅谷投资人?
深思圈 · 3天前 ·
阅读原文
AI 硬件 PM 指南 2 : 语音交互,让硬件听懂人话
硬核PM · 4天前 ·
阅读原文
whisper语音转文字及其视频配置中英文字幕应用 - weiwei22844
weiwei22844 · 1周前 ·
阅读原文
马斯克:Grok 4现已免费提供给所有用户,免费用户每天可少量查询;苹果测试全新AI语音控制功能丨AIGC日报
· 2周前 ·
阅读原文
被低估的AI语音,AI商业化的下一张船票已来
乌鸦智能说 · 2周前 ·
阅读原文
语音合成(TTS)跳跃与重复问题的解析:成因、机制及解决方案
张北北 · 2周前 ·
阅读原文
苹果Siri新功能曝光:仅凭语音执行精准操作
卞纯 · 2周前 ·
阅读原文
被低估的AI语音,AI商业化的下一张船票已来
智能乌鸦 · 2周前 ·
阅读原文
我用AI做了两个工具,终于实现手机微信输入法在PC端的语音输入了!!!
东瓶西镜同学 · 2周前 ·
阅读原文
语音活动检测(VAD) - 凌逆战
凌逆战 · 2周前 ·
阅读原文
我的AI早报系统2.0:这次,我用MiniMax语音+MCP给它注入了灵魂
苍何 · 3周前 ·
阅读原文
微软的 Azure AI 语音只需几秒音频就能生成逼真的深度伪造
AI音频时代 · 3周前 ·
阅读原文
08-06榜单速递:高效工具优化网站性能、AI语音与健康管理
MaiMai · 3周前 ·
阅读原文
速递|Meta的AI音频竞赛再落子,双月连购PlayAI+WaveForms,补全AI情感语音拼图
theinformation · 3周前 ·
阅读原文
中英双语一起破防!北大×腾讯发布“地狱级”测试基准,直击语音对话模型软肋
让你更懂AI的 · 3周前 ·
阅读原文
MiniMax语音模型上新!40种语言真人级生成,喜马拉雅、网易已接入声线
王 涵 · 3周前 ·
阅读原文
乌鸦AI日报:ChatGPT 有望每周吸引7亿用户;通义语音大牛鄢志杰转投京东
· 3周前 ·
阅读原文
E2 TTS:令人尴尬地简单、完全非自回归、零样本的语音合成技术
张北北 · 3周前 ·
阅读原文
通义语音大牛鄢志杰转投京东,阿里高P技术骨干正遭大厂集体“围猎”
· 3周前 ·
阅读原文
Voicebox:大规模文本引导的多语言通用语音生成技术
张北北 · 4周前 ·
阅读原文
豆包语音输入法识别率高的离谱
吴俊驰 · 1个月前 ·
阅读原文
Parakeet 日语音视频转录整合包
pyvideotrans · 1个月前 ·
阅读原文
豆包上新同声传译,顺便狙击阿里AI眼镜?
涯角 · 1个月前 ·
阅读原文
6.2K Star!MIT出品的多语言语音合成神器,CPU实时推理吊打商业软件!
菜菜 · 1个月前 ·
阅读原文
AI语音领域“新王易主”!MiniMax强势登顶,ElevenLabs时代落幕!
半点轻松 · 1个月前 ·
阅读原文
刚刚,字节掏出AI同传模型王炸,2秒延迟,0样本复刻你的声音,一手实测来了
江 宇 · 1个月前 ·
阅读原文
微信刚刚更新:内置的这个语音识别,太特么强了
· 1个月前 ·
阅读原文
李沐B站更新了!教你手搓语音大模型,代码全开源还能在线试玩
关注前沿科技 · 1个月前 ·
阅读原文
AI语音助手专用的“响应加速器”
前端设计大神 · 1个月前 ·
阅读原文
开源真强大,不敢相信,太真实,揭秘8.3k star 开源神器 VoiceCraft 如何封神!!!
小华 · 1个月前 ·
阅读原文
速递|AI可接管60%非紧急来电:AI语音Hyper获630万美元融资,为公共紧急电话系统“减淤疏堵”
techcrunch · 1个月前 ·
阅读原文
首个开源「AI智能语音转文本模型」,质量超whisper,成本爆降。
开源AI · 1个月前 ·
阅读原文
10分钟长音频直接对话!Audio Flamingo 3开源,语音版AGI来了
· 1个月前 ·
阅读原文
也玩音频克隆IndexTTS - weiwei22844
weiwei22844 · 1个月前 ·
阅读原文
Index-TTS Windows 一键整合包下载和使用
pyvideotrans · 1个月前 ·
阅读原文
Mistral首个开源语音模型来了!全面碾压Whisper,多项测试超越GPT-4o mini
· 1个月前 ·
阅读原文
完全透明开源的共情语音大模型,三阶段训练,四大模块实现端到端对话 | 紫东太初联合长城汽车开源OpenS2S
关注前沿科技 · 1个月前 ·
阅读原文
前端语音 + 后端大模型:手把手教你0成本打造一个会「听」会「说」的智能助理
老码小张 · 1个月前 ·
阅读原文
全球首创!B站推出影视级TTS语音模型,支持零样本语音+情绪双克隆,精准时长控制!
痕小子 · 1个月前 ·
阅读原文
Meta斥资近亿美元收购语音AI公司,扎克伯格的超级智慧版图浮出水面!
二爷 Feng · 1个月前 ·
阅读原文
小语种字幕解决方案:Gemini攻克小语种语音识别,生成广播级SRT字幕
pyvideotrans · 1个月前 ·
阅读原文
Whisper语音识别断句不够好?用AI 大模型和结构化输出打造完美字幕【附提示词】
pyvideotrans · 1个月前 ·
阅读原文
开源语音转文字神器!浏览器本地运行,无需上传,Whisper驱动,隐私+实时两不误!
痕小子 · 1个月前 ·
阅读原文
TMM 2025 | 超越SOTA!AdaMesh用10秒视频生成个性化语音动画,表情生动性提升40%。
AIGC Studio · 1个月前 ·
阅读原文
19条作品涨粉66万!用MiniMax语音一句话生成古代才女独白,涨粉+变现双双起飞
阿伦AIGC · 1个月前 ·
阅读原文
当 Normalizing flow 遇上语音生成:AI 说话变 “真人” 的秘密在这里!
张北北 · 1个月前 ·
阅读原文
80%留存、19%付费率!这款AI语音键盘凭什么拿下5600万美元融资?
智能乌鸦 · 1个月前 ·
阅读原文
1年15倍增长,硅谷顶级VC投资2000万美金,这家来自欧洲的公司如何在拥挤的AI语音客服赛道杀出重围
深思圈 · 1个月前 ·
阅读原文
对话Wispr Flow 创始人 Tanay:语音输入,如何创造极致的 Voice AI 产品体验
Vela · 1个月前 ·
阅读原文
1年15倍增长,硅谷顶级VC投资2000万美金,这家来自欧洲的公司如何在拥挤的AI语音客服赛道杀出重围
Leo · 1个月前 ·
阅读原文
语音AI小巨头ElevenLabs创始人:今年将通过与AI代理对话的图灵测试,实现无障碍的跨语言交流
瓜哥 · 1个月前 ·
阅读原文
NLP之文本纠错开源大模型:兼看语音大模型总结
刘焕勇 · 1个月前 ·
阅读原文
会议记录神器Get笔记:语音转文字+智能总结,免费600分钟超长待机!
朝圣的猫 · 1个月前 ·
阅读原文
AI 语音爆发的这半年,一位「局中人」看到的赛道爆发逻辑
苏子华 · 1个月前 ·
阅读原文
TEN VAD 企业级别的语音检测器开源了,效果非常好
前端设计大神 · 1个月前 ·
阅读原文
开源端到端语音大模型:直接从原始音频输入,生成语音输出
· 1个月前 ·
阅读原文
Parakeet 本地化语音识别转录部署指南并在pyVideoTrans中使用
pyvideotrans · 1个月前 ·
阅读原文
×
加载中...