首页 >> 科技资讯 >
开源电子书到有声读物转换器支持 1000 多种语言
开发人员 Drew Thomasson 最近推出了广受欢迎的 ebook2audiobook 项目的 2.0 版本。2.0 版本带来了新的 GUI、轻松访问微调模型以及用于本地 Mac、Windows 和 Linux 安装的易于使用的安装程序。然而,这些功能只是 ebook2audiobooks 所能实现的冰山一角。
ebook2audiobook 结合使用开源 AI 项目,创建了具有完整章节和元数据的有声读物,甚至能够进行语音克隆。为此,ebook2audiobook 采用兼容的非 DRM 电子书,并使用 Calibre 将它们转换为可用格式。然后,将书分成几章,以帮助组织电子书的音频。最后,使用 Coqui XTTSv2 和 Fairseq 的组合将电子书转换为音频。Coqui 提供了一种文本转语音模型,可以产生高质量的音频,并允许用户使用自己的声音进行叙述。得益于 Facebook 的 Fairseq 模型,用户可以使用超过 1,107 种语言。
虽然 2.0 版本包含了一种在各种操作系统上进行本地安装的更简便方法,但该项目还托管在Hugging Face和Google Colab上,使其更易于访问。但是,需要注意的是,将电子书转换为音频是一个漫长的过程。此外,使用 Hugging Face 转换电子书的用户受到免费层处理能力的限制,这会导致渲染时间变慢和潜在的超时。但是,对于希望在本地运行该项目的用户来说,技术要求是合理的,因为该项目设计为仅在 4 GB 的 RAM 上运行。如需更多信息或试用该项目,请访问以下资源。
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
分享:
最新文章
-
【阿玛尼ea运动鞋是什么档次】阿玛尼EA(Armani Exchange)是意大利奢侈品牌阿玛尼(Giorgio Armani)旗下的...浏览全文>>
-
【阿鲁纳世界排名第几位】在体育界,尤其是网球领域,排名是衡量一名运动员实力的重要标准。对于许多球迷来说...浏览全文>>
-
【阿联酋的首都是哪个城市】阿联酋,全称阿拉伯联合酋长国,是位于中东地区的一个联邦制国家,由七个酋长国组...浏览全文>>
-
【阿利多斯进化成什么】在《宝可梦》系列中,阿利多斯(Alola)是特定地区的一种特殊形态,通常指代的是“阿罗...浏览全文>>
-
【阿里注册资金是多少】阿里巴巴集团作为中国互联网行业的龙头企业,其注册资金一直是外界关注的焦点之一。了...浏览全文>>
-
【阿里鱼卡上UC真的全网免流量吗】最近有不少用户在问:“阿里鱼卡上UC真的全网免流量吗?”这个问题其实涉及...浏览全文>>
-
【阿里鱼卡如何申请】“阿里鱼卡如何申请”是许多用户在使用阿里生态产品时关心的问题。阿里鱼卡是由阿里巴巴...浏览全文>>
-
【阿拉伯文造句】在学习阿拉伯语的过程中,造句是一项非常重要的练习。通过造句,不仅可以巩固语法知识,还能...浏览全文>>
-
【阿拉伯文是什么】阿拉伯文,又称阿拉伯语文字,是用于书写阿拉伯语的一种文字系统。它起源于古代阿拉伯半岛...浏览全文>>
-
【阿拉伯数字大写是怎样写的】在日常生活中,我们经常需要将阿拉伯数字(如1、2、3等)转换为汉字大写形式,尤...浏览全文>>
大家爱看
频道推荐