论坛风格切换切换到宽版
  • 9376阅读
  • 1回复

[多媒体类]MS-TTS/Edge-TTS免费文本转语音,一键合成导出MP3音频(2.0.1.4) [复制链接]

上一主题 下一主题
离线海豚
 

发帖
14003
金钱
437127
威望
0
贡献值
1
只看楼主 倒序阅读 使用道具 0 发表于: 2023-05-09


软件简介:

众所周知,微软的TTS文本转语音效果非常好,非常接近真人,以至于现在网上非常多营销号,个人用户都在使用。该软件由治廷君使用微软接口制做,可以方便的进行文字转语音。
微软官方地址:
https://azure.microsoft.com/zh-cn/products/cognitive-services/text-to-speech





重要说明

MS-TTS使用的是微软文本转语音演示DEMO页面接口,每次合成内容有长度限制以及合成频率限制,长度限制你们不用管,由软件自动分段切割,合成频率这块软件基本已经调整到了最高上限,千万不要自作聪明多开,免得搞一晚上到最后一个都合成不了还跑来问为什么。
Edge-TTS使用的是edge浏览器大声朗读接口,合成条件相对较宽松,但不支持对语言角色进行深度调整,对语音角色没有特别强的定制需求推荐使用Edge-TTS,接口稳定,合成速度快。



视频教程

https://www.bilibili.com/video/BV1Tk4y1Y7h2/


文字教程(以下内容请仔细阅读)



1、下载的压缩包记得先解压缩,再使用!!!



2、解压后运行主程序 MS-TTS.exe 或Edge-TTS.exe(注意:软件有加密保护,会被部分杀毒软件和电脑管家勿报及限制操作权限,建议将杀毒软件及电脑管家关闭后使用,当然,如果不放心,可以不要使用)



3.1 选项


质量:导出音频文件质量
语言:TTS文本转语音中的文本内容所属语言(一定要和合成内容的语言相对应)
语音:根据所先语言不同,对应的语音角色也不相同,要自行根据实际情况选择
语速:语音合成时的说话速度,0是正常水平,>0加快,<0减慢
音调:语音合成时的说话音调,0是正常水平,>0音调升高,<0音调降低
添加角色:可将设置好的角色添加到下方的角色列表,用于文本转语音时实现多角色配音的效果(不添加角色时,所有语音合成直接使用上方角色及各项设置)
  • 保存:保存当前接口角色列表中的角色数据
  • 载入:载入之前保存过的角色列表数据
  • 删除:删除指定角色(删除角色后为同步角色序号将会自动执行保存功能)
  • 清空:清空列表所有角色数据
全局旁白:合成内容中所有未指定角色内容,统一使用左侧中间部分角色信息进行合成。



3.2 简单模式-中小文本


主要用于合成文本内容不多的情况,可以更为方便快捷的对文本内容进行各种自定义

全局间隔,主要用于一键设置全文所有语句间隔停顿时间。

在编辑区域点击鼠标右键,会弹出右键菜单
  • 粘贴:将复制好的文本内容粘贴到编辑区域
  • 清空:清空编辑区域所有内容
  • 插入间隔:插入指定时长停顿
  • 设置角色:使用此功能需要在左侧列表先添加角色,然后使用指定角色对选中范围文本内容进行标记,进行过角色标记的内容在后面进行语音合成时,将以指定的角色设置进行语音合成。


3.3 简单模式-超长文本


在表格区域点击鼠标右键,会弹出右键菜单:
  • 导入:导入需要进行tts合成的txt文本文件导入的txt文本大小不能超过5MB(超过5MB文本文件无法导入)
  • 导入的txt文本文件编码格式必须为UTF-8,非UTF8编码文件在导入后,在状态栏会显示“编码错误”,在进行tts语音合成时,会直接跳过
清空:清空列表也可以直接选中多个txt文本文件,拖动到软件界面完成导入

3.4 软件设置


  • 保存目录:可自定义合成音频保存目录(打开:快速打开保存目录,选择文件夹:选择保存目标文件夹)
  • 合成音频使用原始文件名命名:在超长文本模式下生效,勾选后,最终合并音频文件名以“原始导入文本文件名_tts”进行命名
  • 合成结束打开保存目录:在语音合成任务完成后打开保存目录(如果保存文件夹已经有打开则不会再打开)
  • 分段音频合并数量:在进行超长文本合并时,如果将所有音频进行完整合并,最终生成的音频文件将会非常大,动辙几GB,于是采取了二级合并的模式,可以自行根据需求按指定数量合并(如果还是不能理解,打个比方,你的文本合成音频后,有300个音频文件,如果对这300个音频文件进行完整合并,最终合成的文件只有一个,且文件大小将会达到几GB,不方便移动传输,且合成时间会非常长,现增加的二级合并,意思就是按照指定的数量对前面生成的300个文件进行合并,比如默认二级合并数量50,意思就是以50个音频为一组,对前面的300个音频进行分开合并,这样300个音频文件合成完成后,就会生成6个二级合并的音频文件,每个二级合并音频文件大小就会降到几百MB)
  • 合成结束删除1级音频片段:1级音频片段就是最多的,4位数字开头的音频片段文件
  • 合成结束删除2级音频片段:2级音频片段就是按照上面指定分段音频合并数量对1级音频片段进行合并后生成的3位数字开头音频文件
  • 是否进行最终完整合并:就是将所有分段音频文件合并成一个音频文件。
  • 路径检测显示YES表示路径正常,可正常进行音频合并,NO表示软件保存完整路径中存在空格(),;等特殊特殊字符,需要将路径中的特殊字符去除才可以(最简单的解决方法,将软件解压缩,或是剪切到磁盘根目录,除了C盘其它哪个盘都行,有的电脑系统C盘软件操作需要额外权限)
  • 保存配置:将各项设置内容保存至配置文件
注:删除音频片段时,将遵循保护性逻辑,即:在只存在1级音频片段时,即使勾选合成结束删除1级音频片段也不会执行删除,在同时存在1级音频片段与2级音频片段时,勾选删除1级音频片段生效,而2级音频片段即使勾选删除将不会执行,同理,在同时存在1级、2级音频片段,且进行了最终完整合并的前提下,勾先删除1级、2级音频片段才会生效执行。


4、多音字

MS-TTS运行后会自动在程序目录生成“dict.txt”词典文件,

将需要自动替换的内容按照:
原始内容,替换内容
的格式一行一条,写入“dict.txt”词典文件保存即可,dict必须为utf-8编码),如下:

直接使用拼音替换指定多音字,例如:wēn,wén,wěn,wèn



5、试听合成




5.1 试听

单角色提供最长不超过3000字符内容的角色声音试听,存在多角色时,只能试听第一段内容;


5.2 合成

按照设置好的角色对指定内容进行TTS语音合成


5.3 全局旁白


老版本合成内容角色设置要么全部设置角色,要么全部不设置,在合成内容中同时存在指定角色内容和未指定角色内容时,只能合成指定角色内容,当前版本合成音频时,指定角色内容使用左下方角色列表中指定角色进行合成,未指定角色内容全部使用左侧中间角色数据进行合成,因为这部分内容不需要指定角色,也以叫全局旁白;


5.4 停止

停止正在进行的任务


5.5 更新



为大家减少麻烦,软件已启用自动更新,当软件检测到新版本后会自动下载新版本,下载完成后重新运行即可,**重点:更新时会自动打本页面,请务必仔细阅读更新内容,方便掌握最新功能。


软件报病毒


软件有加密保护,会被部分杀软误报,所以,如果你在使用过程中遇到这样或那样的问题,请尝试关闭各类杀毒软件或电脑管家后再试一下,当然:如果不放心请勿使用,谢谢!!!


常见问题:合成正常,但无法进行最终合并

  • 1、检查软件保存完整路径以及输出音频保存路径是否存在空格(),;等特殊特殊字符,如有,需要将路径中的特殊字符去除;
  • 2、彻底退出杀毒软件/电脑管家,鼠标右键-使用管理员模式运行此程序;


下载地址:

城通盘:https://url61.ctfile.com/d/12483661-53139189-db63b1?p=3333 访问码:3333
天翼云:https://cloud.189.cn/t/eq6vUnuInANz 访问码:8bwn
蓝奏云:https://mefcl.lanzouw.com/b012cemda 密码:atgt
123 盘:https://www.123pan.com/s/QdiA-LJxmh

评价一下你浏览此帖子的感受

精彩

感动

搞笑

开心

愤怒

无聊

灌水
我爱潜水!
离线ylmqsg

发帖
53
金钱
415
威望
0
贡献值
0
只看该作者 1 发表于: 2023-05-12
谢谢分享。
快速回复
限100 字节
 
上一个 下一个