文章来源:08AI导航网发布时间:2025-04-10 16:45:50
MiniMax Audio Speech-02是一款强大的文本转语音(TTS)模型,能够将任何文件或URL瞬间转化为逼真的音频 。它支持高达20万字符的单次输入,覆盖30多种语言,并带有地道口音 。此外,Speech-02还支持无限语音克隆、亚秒级流媒体处理以及多种音频格式(如FLAC、WAV、MP3和PCM) 。
Speech-02模型提供两种版本:speech-02-hd-preview(以99%的语音相似度和工作室级清晰度为特点,适合配音、有声书等需要逼真表现的场景)和speech-02-turbo-preview(在低延迟和高性能之间取得平衡,适合实时应用) 。
多语言支持:Speech-02支持30多种语言的文本转语音,包括英语、中文、日语、韩语、法语、德语、西班牙语、葡萄牙语、意大利语、阿拉伯语、俄语、土耳其语、荷兰语、乌克兰语、越南语、印地语、泰语、波兰语、罗马尼亚语、希腊语、芬兰语和印尼语等,且带有地道口音。
语音库丰富:拥有300多个真实自然的声音,支持多种语言的地道表达。
单次输入字符数:单次输入支持高达20万字符。
流媒体处理速度:支持亚秒级流媒体处理。
模型版本:包括speech-02-hd-preview和speech-02-turbo-preview。前者以99%的语音相似度和工作室级清晰度为特点,适合配音、有声书等需要逼真表现的场景;后者则在低延迟和高性能之间取得平衡,适合实时应用。
无限语音克隆:能够以行业领先的质量,快速克隆出多种风格和语调的语音。
语音控制:用户可以轻松控制语音的情感、音量、速度和输出格式。
语音混合:可以将现有的语音组合起来,创造出全新的独特语音。
音频格式支持:支持FLAC、WAV、MP3和PCM等多种音频格式。
有声书制作:适合将长篇小说、学术论文等转化为高质量的音频内容。
播客创作:帮助播客创作者制作更具吸引力和多样性的内容。
电影与游戏配音:提供电影级低音和沉浸式音频效果。
国际会议与翻译:支持在多种语言之间即时无缝切换。
目前,Speech-02模型已经在MiniMax Audio平台及API平台上线,但国内版尚未推出。
MiniMax Audio平台:https://www.minimax.io/audio
MiniMax Audio API平台:https://www.minimax.io/platform
相关攻略 更多
最新资讯 更多
AI眼镜 “百镜大战” 打响!小小米眼镜官方微博上线引发市场热潮,产业链有望迎来快速发展期
更新时间:2025-04-19
新春第一课!自治区科协举办人工智能科普报告会
更新时间:2025-04-19
加速人工智能赛道布局!东莞市政府高规格召开新春第一场新闻发布会
更新时间:2025-04-19
东莞2025年“一号文”发布 聚焦“人工智能+先进制造”
更新时间:2025-04-19
马斯克:无人机和人工智能将主导未来战争 美国要加大投资
更新时间:2025-04-19
法国印度将联合主持AI行动峰会
更新时间:2025-04-19
法印将联合主持AI行动峰会,法媒:法欧希望借此峰会确立自身竞争地位
更新时间:2025-04-18
OpenAI前高管创立的AI公司据称洽谈融资 估值或达200亿美元
更新时间:2025-04-18
谷歌放弃 “不开发武器 AI” 承诺引争议,吴恩达表态支持
更新时间:2025-04-18
外交部:欢迎各国来华出席2025世界人工智能大会
更新时间:2025-04-18