微软TTS语音合成工具 免费文字转语音软件
2022年12月11日晚间,国家网信办等三部门发布《互联网信息服务深度合成管理规定》,且将于2023年1月10日施行,规定对深度合成技术界定如下:
深度合成技术,是指利用深度学习、虚拟现实等生成合成类算法制作文本、图像、音频、视频、虚拟场景等网络信息的技术,包括但不限于:
(一)篇章生成、文本风格转换、问答对话等生成或者编辑文本内容的技术;
(二)文本转语音、语音转换、语音属性编辑等生成或者编辑语音内容的技术;
(三)音乐生成、场景声编辑等生成或者编辑非语音内容的技术;
(四)人脸生成、人脸替换、人物属性编辑、人脸操控、姿态操控等生成或者编辑图像、视频内容中生物特征的技术;
(五)图像生成、图像增强、图像修复等生成或者编辑图像、视频内容中非生物特征的技术;
(六)三维重建、数字仿真等生成或者编辑数字人物、虚拟场景的技术。
深度合成服务提供者,是指提供深度合成服务的组织、个人。
深度合成服务技术支持者,是指为深度合成服务提供技术支持的组织、个人。
深度合成服务使用者,是指使用深度合成服务制作、复制、发布、传播信息的组织、个人。
训练数据,是指被用于训练机器学习模型的标注或者基准数据集。
沉浸式拟真场景,是指应用深度合成技术生成或者编辑的、可供参与者体验或者互动的、具有高度真实感的虚拟场景。
通过定义可以明确看到,文本转语音榜上有名,而本站应该属于上述定义中的“深度合成服务技术支持者”,而大家应该就是“使用者”了,遗憾的是,本站无法具备规定中对于“技术支持者”所必需的各项要求。
既然不能满足新规要求,且作为守法公民,在此只能遗憾宣布:
为响应《互联网信息服务深度合成管理规定》,本站所有语音合成工具,将会在2022年12月31日全面关停,届时,本站将不再提供任何文本转语音服务,再次感谢大家一直以来的支持与厚爱!
前言
MS-TTS工具经过N个版本更新,该实现的功能都已经一点点肝出来了,称它为全网最强免费TTS文本语音合成工具
应该不为过,所以,接下来可能在很长一段时间内,除去发现重大bug外,应该都不会再进行大的更新了。
当前版本:v1.9.5
更新内容:
1.9.5
1、界面大小可自行调整;
2、Edge接口数据汉化;
3、角色数量增加到20个;
4、恢复强制更新。(原因请自行理解)
5、其它bug修复
1.9.5.1
稳定性修复
1.9.5.2
微软接口wav格式无法合并bug修复
1.9.5.3
修复“Invalid characters in file name”
正文
微软TTS文本转语音引擎的确是非常NB,合成语音非常接近真人,应该是当前同类产品中体验最好的,官网有提供在线语音合成,但不提供合成后的音频文件下载,使用时会比较麻烦,所以写成工具。
注意:
1、记得先解压,然后使用管理员模式运行程序!
2、简单模式-超长文本:导入的txt文件编码必须为utf-8,文件大小不要超过5MB
;
3、试听功能:试听范围为主体内容前150字符;
4、SSML模式:试听模式主体内容长度不得超过150字符,合成模式主体内容长度不得超过2500字符;
视频教程https://www.bilibili.com/video/BV1wg411k7SH/
界面说明
左侧最上方为合成语音质量选项,目前软件支持两种格式,分别为MP3和WAV,每种格式分别有四种质量,请根据实际需求设置调整;
左侧中间有Proxy选项(由于TTS服务器在国外,网络非常不稳定,所以增加了这个选项,有条件就用,如果没条件且又很卡的话,那就换个时间再试,实测:在下半夜及上午时间段,使用效果更好!)
左侧下方为需要配音角色选项,及添加角色按钮,既缩小了界面尺寸,又可以添加更多的角色(最多6个角色),使用方法也很简单,如果你不需要多角色,那么直接在角色里调整好就可以试听合成了,如果是多角色,那么先需要设置好角色选项,然后添加角色,每个角色都需要相同操作,在所有角色添加完成后,右侧文本区选择文本,鼠标右键--设置角色--选择对应的角色即可;
右侧是文本内容区域,以及试听
、合成
、停止
、保存配置
功能按钮。
注:保存配置无法保存添加的角色信息,后续版本可能会改进
不设置角色时,软件默认使用左侧角色设置。
新角色
注意,新角色微软官方定义为测试角色,所以并不是完全开放,如果你选择使用这两个角色,下方出现如下图的提示,则说明当前微软未开放,以后再试吧。
多音字
MS-TTS运行后会自动在程序目录生成“dict.txt”词典文件,
将需要自动替换的内容按照:原始内容,替换内容
的格式一行一条,写入“dict.txt”词典文件保存即可,如下:
语音合成
前提工作准备好就可以点击右侧上方的
试听
或合成
按钮,开始进行语音试听或合成注意:文本内容越多,合成所需时间越长!
中小文本合成完成后,音频在工具目录下的“audio日期时间子目录”中,如下:
超长文本语音合成完成后,音频在工具目录下的“audio文本文件名称”文件夹中,如下
语音合成完成后,将自动调用ffmpeg进行合并。
软件报病毒
软件有加密保护,会被部分杀软误报,不放心请勿使用
,谢谢合作。