首页 > > AI资讯> Ai产品

Voice-Pro:一款集字幕、翻译和TTS于一体的多语言音频处理工具

于2024-12-16发布在Ai产品 29

Voice-Pro，一款集字幕、翻译和TTS于一体的多语言音频处理工具，一键安装。

Voice-Pro支持超过90多种语言的实时翻译，适合直播或即时翻译场景。

Voice-Pro主要功能：

Studio选项卡

提供 YouTube 下载器、噪音消除、字幕、翻译和 TTS 的集成环境
ffmpeg支持的所有视频/音频格式都可以使用
可选择输出音频格式（wav、flac、mp3）
100 种语言的语音识别和字幕创建
选择适合 PC 性能的字幕创建选项（Whisper 模型和计算类型）
翻译成 100 多种语言并通过 TTS 生成语音
多语言视频中保留了原始视频的BGM和音效。
支持TTS语音速度、音量、音调调节

Whisper Caption卡

专门用于创建字幕的选项卡。支持 90 多种语言
显示使用视频创建的字幕
提供世界级亮点功能
提供降噪功能（1-Demucs、2-MDXNet）

Translate选项卡

专用翻译选项卡。支持 100 多种语言
支持字幕文件（ass、ssa、srt、mpl2、tmp、vtt、microdvd、json）
也可以直接输入文字
自动检测上传文件的语言

TTS选项卡

仅 TTS 选项卡。支持超过100种语言和400种语音
支持字幕文件（ass、ssa、srt、mpl2、tmp、vtt、microdvd、json）
也可以直接输入文字
自动检测上传文件的语言
音调、音量和速度可调

Live Translation选项卡

实时语音识别和翻译支持
选择音频输入源，例如麦克风、扬声器等。
提供保存捕获的音频、识别的字幕和翻译的字幕的功能

Batch选项卡

批量处理大量文件
字幕、翻译、TTS

Voice-Pro特征：

您可以下载 YouTube 视频（mp4、webm）并将其另存为音频文件（mp3、wav、flac）。
您可以通过消除噪音和分离人声来提高语音识别的准确性。使用MDX-Net和Meta的Demucs 。
通过ai语音识别，提供自动字幕制作、机器翻译、TTS功能。
您可以轻松制作多语言视频。
一键安装。安装后，您可以永久使用它，无需额外费用。 (※ 免费版有30分钟使用时间限制)
提供Web-UI 。推荐使用谷歌Chrome浏览器。

Voice-Pro项目地址：https://github.com/abus-aikorea/voice-pro

HeyGen推出Avatar Look功能

Kimi探索版:AI搜索的革新

OpenBB：一个免费开源的金融数据分析平台

OpenBB：一个免费开源的金融数据分析平台

2024-12-16

Kotaemon：一个能让你与文档进行对话的开源工具

Kotaemon：一个能让你与文档进行对话的开源工具

2024-12-16

EZ-Work：一款AI文档翻译助手

EZ-Work：一款AI文档翻译助手

2024-12-16

Notebook Copilot：免费开源的笔记本开发助手

Notebook Copilot：免费开源的笔记本开发助手

2024-12-16

有哪些好用的AI文生图工具

有哪些好用的AI文生图工具

2024-12-16

YesPlayMusic：开源免费且高颜值的第三方网易云播放器

YesPlayMusic：开源免费且高颜值的第三方网易云播放器

2024-12-16

最新工具

Solo独立开发者社区

在这里和众多独立开发者们一起分享最新动态、推动产品落地及运营和市场化。你能在这里...

出海网站经验总结

分享在开发海外网站过程中积累的经验。无论您是刚开始计划将业务拓展到海外，还是已经...

独立开发者导航站

发掘最优秀的工具，独立开发者导航站助力你快速发布下一个应用，发掘最优秀的独立开发...

创造者日报

一个独立开发者和创业者展示产品和交流的社区，每天分享和发现有趣的产品。用户可以在...

w2solo

一个国内的独立开发者社区，致力于搭建和维护好国内独立开发者圈子和氛围，w2solo由众...

IndieHackers

一个聚集了独立创业者和产品开发者的社区，你可以在IndieHackers阅读他们的成功案例、...

新趣集

一个类似ProductHunt的产品发现社区，它让创造者们有机会展示自己的作品，让用户们有...

Product Hunt

一个集产品展示、社区互动和市场验证于一体的平台，ProductHunt让独立开发者有机会展...

产品周刊 | Product Weekly

HerbertChang创办的一个专注于产品行业的周刊。每期内容包括新产品介绍、行业观点以及...

FreePrivacyPolicy

一个免费的隐私政策生成器，用户通常需要回答一些关于其业务和数据处理的问题，然后生...

用户登录

Voice-Pro:一款集字幕、翻译和TTS于一体的多语言音频处理工具

相关文章

最新文章

最新工具