最新
AI
创业
产品
工具
应用
论文
笔记
markdown
DeepSeek
Qwen3
Github
开源项目
前端
RAG
知识图谱
OpenAI
MCP
Agent
Manus
视频
即梦
数字人
AI工具
Python
Coze
扣子空间
Dify
智能体
Cursor
多模态
效率
提示词
搜索
Transformer
产品经理
刘强东
京东
外卖
面试
巴菲特
游戏
强化学习
量化
关税
语音
redis
Mistral
IndexTTS-vLLM:让语音合成更快速、更高效
· 17小时前 ·
原文
开源播客TTS神器!高效TTS模型:Muyan-TTS,0.33秒生成1秒音频,零样本语音合成!
痕小子 · 1天前 ·
原文
92ms极速Token响应!VITA团队开源实时语音大模型,推理效率暴增5倍
让你更懂AI的 · 2天前 ·
原文
动嘴比动手快,我做了个AI语音备忘录
银海inhai · 2天前 ·
原文
90元,DIY小智AI腕表开源,DeepSeek语音交互超有趣!
* · 2天前 ·
原文
字节"扣子空间 mini版"全面开源,超强深度研究能力,还集成了语音播客生成功能!
node · 3天前 ·
原文
VITA-Audio:一款高效的语音语言模型,能够快速生成音频和文本内容
· 4天前 ·
原文
最强国产TTS接入MCP后,10分钟克隆哪吒2人物语音
f_f_412 · 4天前 ·
原文
一个使用 Python 实现的小智语音客户端,旨在通过代码学习和在没有硬件条件下体验 AI 小智的语音功能。
大概是BUG · 4天前 ·
原文
一点小更新 3.69 : 使用 LLM 大模型对语音识别结果重新断句
pyvideotrans · 5天前 ·
原文
RealtimeTTS: 一款将大模型文字流实时转高质量语音的库
前端设计大神 · 6天前 ·
原文
RealtimeVoiceChat: 又一款开源的实时语音聊天工具
前端设计大神 · 6天前 ·
原文
RealtimeSTT: 一款开源的实时声音转录库
前端设计大神 · 6天前 ·
原文
新型开源端到端 AI 语音模型!Voila:195ms 超低延迟引领全双工对话!
痕小子 · 6天前 ·
原文
中科院实时语音交互新突破:LLaMA-Omni2如何让AI对话更自然流畅?
高效码农 · 6天前 ·
原文
Parakeet TDT 0.6B V2:从实验室到行业颠覆,英伟达 0.6B 参数语音模型如何 1 秒搞定 60 分钟音频转录
昕科技 · 1周前 ·
原文
语音交互革命:揭秘新一代AI助手Voila如何突破技术边界
高效码农 · 1周前 ·
原文
英伟达全新开源自动语音识别模型与其他开源语音模型的对比
TOPGO · 1周前 ·
原文
【HN测评012】高效率AI语音聊天引擎:普通人的下一个"搞钱"风口已经来了
ShowHN Today · 1周前 ·
原文
超越人类反应速度 | 开源语音大模型Voila支持195ms情感对话、百万音色+10秒声音克隆。
AI产品汇 · 1周前 ·
原文
英伟达开源语音识别模型!0.6B 参数登顶 ASR 榜单,1 秒转录 60 分钟音频!
痕小子 · 1周前 ·
原文
一键包:语音转文本,视频自动添加字幕,语音识别funasr还是很不错的
云天河 · 1周前 ·
原文
RealtimeVoiceChat:用语音与AI进行自然流畅对话的实时交互项目
· 1周前 ·
原文
毫秒响应延迟!开源统一语音对话模型Voila
弹贝斯的鱼 · 1周前 ·
原文
【HN日榜】500ms低延迟!AI语音聊天,开启实时交流新体验
ShowHN Today · 1周前 ·
原文
一款名为 Dia 的新开源文本到语音模型
AI音频时代 · 1周前 ·
原文
Z Product|被Meta收购后再创业,Sesame突破语音“恐怖谷”,a16z押注,“让AI听懂人心,让沟通回归自然”
Z Potentials · 1周前 ·
原文
F5R-TTS:腾讯出品,TTS领域的新王者?流匹配+强化学习,语音克隆新高度!
AGI小兵 · 1周前 ·
原文
Dia:两个本科生打造的开源AI语音模型,复刻NotebookLM
renee创业狗 · 1周前 ·
原文
【技术分享】Edge-TTS与Cloudflare Worker结合,免费TTS服务轻松搭建!
周辉 · 1周前 ·
原文
Rask:以假乱真的AI对口型、翻译、语音克隆工具
AI收藏家 · 1周前 ·
原文
效果炸裂,谷歌的免费笔记神器正式支持中文语音播客
大个青椒 · 1周前 ·
原文
13.5K Star!支持5国语言+全栈语音生成,这个开源AI语音项目绝了!
小华 · 2周前 ·
原文
语音领域ISCA Fellow 2025公布:上海交大俞凯、台大李宏毅等三位华人入选
机器之心 · 2周前 ·
原文
清华与智谱联合发布TTS模型GLM-4-Voice,支持情绪、语气控制,多语言,实时效果很不错~
看风 · 2周前 ·
原文
Kimi-Audio开源横扫全场景,1300万+小时数据炼成语音世界“大一统”
· 2周前 ·
原文
可以在终端运行的轻量化AI编程助手,还可以直接使用语音编程!
二爷 Feng · 2周前 ·
原文
一个开源的文本转语音工具,支持超长文本和多角色配音,旨在帮助用户轻松将文本内容转换为高质量的语音输出。
大概是BUG · 2周前 ·
原文
一键数字人再次升级,内置多个参考语音-多个参考视频,还支持自主上传音频和视频
云天河 · 2周前 ·
原文
Dia-1.6B TTS: 最佳文本转语音AI模型
李孟lm · 2周前 ·
原文
如何导出微信好友的所有语音
kanadeblisst · 2周前 ·
原文
BosonAI推出音频理解和音频生成:一款具有实时音频推理和表达性语音合成的先进AI解决方案
AI音频时代 · 2周前 ·
原文
电视装了智能体,只凭台词就能找到剧集了
关注前沿科技 · 2周前 ·
原文
两本科生自学3个月复刻谷歌爆款产品,开源AI语音新标杆一天揽获5000星标
· 2周前 ·
原文
16亿参数!Nari Labs发布文本到语音模型Dia,逼真对话+情感控制,等你来体验
· 2周前 ·
原文
【HN日榜】ESP32秒变AI语音助手!开源项目让你体验实时语音交互
ShowHN Today · 2周前 ·
原文
融合大模型的对话式语音 AI 变革与技术架构
吴桐 · 2周前 ·
原文
两本科生自学3个月复刻谷歌爆款产品,开源AI语音新标杆一天揽获5000星标
关注前沿科技 · 2周前 ·
原文
速递|两名本科生3个月打造的AI语音模型,挑战谷歌NotebookLM,16亿参数实现自然对话生成
techcrunch · 3周前 ·
原文
Dia是由Nari Labs开发的一个拥有1.6B参数的文本到语音模型
· 3周前 ·
原文
【HN日榜】Dia:开源文本转语音模型,生成逼真对话!
ShowHN Today · 3周前 ·
原文
04-21榜单速递:AI调试工具与语音克隆技术领衔,7款开发者效率工具深度解析
MaiMai · 3周前 ·
原文
IBM Granite 3.3:语音识别、推理增强与RAG的完美融合
基咯咯 · 3周前 ·
原文
级联vs端到端、全双工、轮次检测、方言语种、商业模式…语音 AI 开发者都在关心什么?丨Voice Agent 学习笔记
RTE开发者社区 · 3周前 ·
原文
视听语音LLM效率革命!MMS-LLaMA词误率0.74%创纪录,Token开销暴降86%
AGI灵魂写手 · 3周前 ·
原文
智能语音备忘录:SpeechRecognition与gTTS的奇妙融合 - TechSynapse
TechSynapse · 3周前 ·
原文
语音交互革命!开源神器Oliva:一句话秒搜海量数据,多AI协作颠覆传统搜索
AGI小兵 · 3周前 ·
原文
GLM-4-Voice 9B 实时多语言语音对话AI,具有情感、语调和语速(附源代码+模型权重)
dustinsea · 3周前 ·
原文
浙大赵洲教授团队发布MegaTTS3,让AI语音更自然的新一代语音合成技术
让你更懂AI的 · 4周前 ·
原文
深入解析语音AI项目:ABexit/ASR-LLM-TTS的技术实现与应用前景
脚丫先生 · 4周前 ·
原文
开源TTS项目GPT-SoVITS,支持跨语言合成、支持多语言~
看风 · 4周前 ·
原文
SparkAudio/VoxBox:为文本到语音(TTS)系统训练提供大规模语音语料库
· 4周前 ·
原文
MegaTTS 3:字节跳动开源语音神器,吊打VALL-E,自然度逼近真人录音
AGI小兵 · 4周前 ·
原文
实时语音交互数字人VideoChat,可自定义形象与音色,支持音色克隆,首包延迟低至3s
看风 · 4周前 ·
原文
[开源APP推荐] Vocable AAC - 免提文本转语音
wjh2005 · 1个月前 ·
原文
还在手写笔记?实测多款AI语音转写神器!学生党/打工人速存
爱琢磨新事物的 · 1个月前 ·
原文
开源语音克隆利器-OpenVoice
开源派 · 1个月前 ·
原文
语音指令怎么避免同音词干扰?
JYeontu · 1个月前 ·
原文
ElevenLabs MCP:为开发者与创作者赋能的语音AI智能处理工具!
司木源 · 1个月前 ·
原文
开口跪!小智 AI 语音情感值拉满,全靠 CosyVoice 2.0! 太顶了,多语言、方言、声音克隆全拿捏!
老码小张 · 1个月前 ·
原文
推出 Amazon Nova Sonic:为生成式 AI 应用程序带来类似人类的语音对话体验
Danilo Poccia · 1个月前 ·
原文
AI语音迎来「特斯拉时刻」,一条工作流「吃掉」全球百亿市场
· 1个月前 ·
原文
半开源语音克隆神器 MegaTTS3:安装难、用起来更难?手把手带你从零到精通
pyvideotrans · 1个月前 ·
原文
用Python实现超酷语音合成第二弹——edge-tts
十月狐狸 · 1个月前 ·
原文
安利免费开源的声音克隆、文本转语音整合包软件、一键本地安装!
星哥说事 · 1个月前 ·
原文
成本最高降90%!百度发布端到端语音语言大模型,已在文小言上线
褚杏娟 · 1个月前 ·
原文
音频生成技术探索与淘宝域实践
淘天内容AI团队 · 1个月前 ·
原文
微信语音(silk)转mp3
kanadeblisst · 1个月前 ·
原文
一键包:B站开源语音克隆TTS,速度-质量达到sota水平,超越 CosyVoice2、Fish-Speech 等模型
云天河 · 1个月前 ·
原文
免费中文离线语音转文本服务,HassOS零配置开箱即用
来鸭来鸭一起来鸭 · 1个月前 ·
原文
×
加载中...