santinic/audiblez:3.9k Star 开源神器,一键将电子书变身高品质有声书
基于Kokoro-82M语音合成技术的跨平台有声书生成工具
项目地址: https://github.com/santinic/audiblez
Audiblez 是一款革命性的开源工具,能够将普通的EPUB电子书转换为高品质的M4B格式有声书。它采用了最新发布的Kokoro-82M语音合成技术,仅用82M参数就能产生非常自然的语音输出,支持9种语言(英语、西班牙语、法语、印地语、意大利语、日语、葡萄牙语和中文)。
核心亮点
- 高效转换:在Google Colab的T4 GPU上,仅需5分钟就能将16万字符的《动物农场》转换为有声书(约600字符/秒);在M2 MacBook Pro的CPU上约1小时完成(约60字符/秒)
- 多平台支持:
- Linux (Ubuntu/Debian)
- macOS
- Windows
- 丰富的语音选择:
- 20种美式英语语音
- 8种英式英语语音
- 3种西班牙语语音
- 4种印地语语音
- 2种意大利语语音
- 5种日语语音
- 3种巴西葡萄牙语语音
- 7种中文普通话语音
- 灵活的速度调节:支持0.5-2.0倍速调节
- 双模式操作:
- 命令行工具(适合高级用户)
- 图形界面(适合普通用户)
技术优势
Audiblez 基于Apache许可的Kokoro-82M模型,该模型仅用不到100小时的音频训练就达到了出色的语音质量。项目还支持CUDA加速,在配备GPU的设备上能获得显著的性能提升。
使用场景
- 视力障碍人士的阅读辅助
- 通勤时的"听书"体验
- 语言学习者的听力训练
- 自制有声书内容创作
怎么样,看完这个项目是不是觉得很棒?对于电子书爱好者、语言学习者和内容创作者来说,Audiblez绝对是一个改变游戏规则的工具!快来转发给你的书友圈,一起体验科技带来的阅读革命吧!