Voice-Pro:一款集字幕、翻译和TTS于一体的多语言音频处理工具

文章来源：08AI导航网发布时间：2024-12-13 19:12:30

Voice-Pro，一款集字幕、翻译和TTS于一体的多语言音频处理工具，一键安装。

Voice-Pro主要功能：

Voice-Pro支持超过90多种语言的实时翻译，适合直播或即时翻译场景。

Voice-Pro主要功能：

Studio选项卡

提供 YouTube 下载器、噪音消除、字幕、翻译和 TTS 的集成环境

ffmpeg支持的所有视频/音频格式都可以使用

可选择输出音频格式（wav、flac、mp3）

100 种语言的语音识别和字幕创建

选择适合 PC 性能的字幕创建选项（Whisper 模型和计算类型）

翻译成 100 多种语言并通过 TTS 生成语音

多语言视频中保留了原始视频的BGM和音效。

支持TTS语音速度、音量、音调调节

Whisper Caption卡

专门用于创建字幕的选项卡。支持 90 多种语言

显示使用视频创建的字幕

提供*亮点功能

提供降噪功能（1-Demucs、2-MDXNet）

Translate选项卡

专用翻译选项卡。支持 100 多种语言

支持字幕文件（ass、ssa、srt、mpl2、tmp、vtt、microdvd、json）

也可以直接输入文字

自动检测上传文件的语言

TTS选项卡

仅 TTS 选项卡。支持超过100种语言和400种语音

支持字幕文件（ass、ssa、srt、mpl2、tmp、vtt、microdvd、json）

也可以直接输入文字

自动检测上传文件的语言

音调、音量和速度可调

Live Translation选项卡

实时语音识别和翻译支持

选择音频输入源，例如麦克风、扬声器等。

提供保存捕获的音频、识别的字幕和翻译的字幕的功能

Batch选项卡

批量处理大量文件

字幕、翻译、TTS

Voice-Pro特征：

您可以下载 YouTube 视频（mp4、webm）并将其另存为音频文件（mp3、wav、flac）。

您可以通过消除噪音和分离人声来提高语音识别的准确性。使用MDX-Net和Meta的Demucs 。

通过ai语音识别，提供自动字幕制作、机器翻译、TTS功能。

您可以轻松制作多语言视频。

一键安装。安装后，您可以永久使用它，无需额外费用。 (※ 免费版有30分钟使用时间限制)

提供Web-UI 。推荐使用谷歌Chrome浏览器。

Voice-Pro项目地址：https://github.com/abus-aikorea/voice-pro

上一篇: PixVerse AI如何使用详细教程指南

PixVerse AI如何使用详细教程指南_映技派,专注ai人工智能!,PixVerse 是一款 AI 文字或图片生成视频工具，在 PixVerse AI 网页版或 Discord 输入文字提示词或上传图片，PixVerse 就能快

下一篇: HeyGen推出Avatar Look功能

HeyGen推出Avatar Look功能_映技派,专注ai人工智能!,HeyGen最近推出了Avatar Looks功能，这项功能允许用户上传任意数量的视频素材，系统会利用这些素材生成个性化的虚拟数字分身。用户可以自由修改数字分身的背景、服装、姿势和摄像角度等，从而根据自己的需求调整和个性化视频内容。