首页
友链
推荐
红枫百科[AI]
Windows系统激活
Search
1
QQ9.7.20永久禁止(QQ/NT)自动更新
72 阅读
2
DnF台服:账号任务实现演示
33 阅读
3
记录CentOS系统下检测端口访问并记录访问日志的教程
25 阅读
4
DNF台服:增幅附加值随机增长
23 阅读
5
DNF台服:新职业转职变更卷
23 阅读
闲言碎语
运维笔记
教程笔记
AI智能体
网站源码
其他源码
值得一看
DNF台服
登录
/
注册
Search
Gcn
累计撰写
71
篇文章
累计收到
0
条评论
首页
栏目
闲言碎语
运维笔记
教程笔记
AI智能体
网站源码
其他源码
值得一看
DNF台服
页面
友链
推荐
红枫百科[AI]
Windows系统激活
搜索到
1
篇与
的结果
2026-05-05
[AI] · 开源大模型体验
VoxCPM2VoxCPM2 是一个无需分词器的扩散自回归文本到语音(TTS)模型——拥有 20亿参数、支持 30种语言、输出 48kHz 音频,基于超过 200万小时 的多语言语音数据训练而成。亮点🌍 30种语言多语种支持 —— 无需语言标签;直接输入任意支持语言的文本🎨 语音设计 —— 仅凭自然语言描述(性别、年龄、音调、情感、语速等)即可生成全新语音;无需参考音频🎛️ 可控克隆 —— 从短音频片段克隆任意声音,并可选提供风格引导以控制情感、语速和表达,同时保留音色🎙️ 终极克隆 —— 提供参考音频及其对应转录文本,实现音频延续式克隆;忠实复现每一个声音细节🔊 48kHz 录音室级音质输出 —— 接受16kHz参考音频;通过 AudioVAE V2 内置的超分辨率模块输出48kHz音频,无需外部升采样器🧠 上下文感知合成 —— 自动根据文本内容推断合适的韵律和表现力⚡ 实时流式合成 —— 在 NVIDIA RTX 4090 上 RTF 低至约 0.3,使用 Nano-VLLM 加速后可达约 0.13📜 完全开源且可商用 —— Apache-2.0 许可证,允许免费用于商业用途支持的语言(30种)阿拉伯语、缅甸语、中文、丹麦语、荷兰语、英语、芬兰语、法语、德语、希腊语、希伯来语、印地语、印尼语、意大利语、日语、高棉语、韩语、老挝语、马来语、挪威语、波兰语、葡萄牙语、俄语、西班牙语、斯瓦希里语、瑞典语、他加禄语、泰语、土耳其语、越南语中文方言:四川话、粤语、吴语、东北话、河南话、陕西话、山东话、天津话、闽南话{dplayer src="https://d.tiansj.net/usr/uploads/2026/05/2626587239.mp4"/}生成声音文件高保真:小哥哥~你都好久没理我啦,人家心里空空的好想你嘛, 不许冷落我好不好,就多陪陪我一会儿下嘛~.zip
2026年05月05日
5 阅读
0 评论
0 点赞