微软TTS语音合成工具 免费文字转语音软件

微软TTS语音合成工具 免费文字转语音软件
2022年12月11日晚间,国家网信办等三部门发布《互联网信息服务深度合成管理规定》,且将于2023年1月10日施行,规定对深度合成技术界定如下:深度合成技术,是指利用深度学习、虚拟现实等生成合成类算法制作文本、图像、音频、视频、虚拟场景等网络信息的技术,包括但不限于:(一)篇章生成、文本风格转换、...
  • 2年前
  • 2022年12月11日晚间,国家网信办等三部门发布《互联网信息服务深度合成管理规定》,且将于2023年1月10日施行,规定对深度合成技术界定如下:

    深度合成技术,是指利用深度学习、虚拟现实等生成合成类算法制作文本、图像、音频、视频、虚拟场景等网络信息的技术,包括但不限于:

    (一)篇章生成、文本风格转换、问答对话等生成或者编辑文本内容的技术;

    (二)文本转语音、语音转换、语音属性编辑等生成或者编辑语音内容的技术;

    (三)音乐生成、场景声编辑等生成或者编辑非语音内容的技术;

    (四)人脸生成、人脸替换、人物属性编辑、人脸操控、姿态操控等生成或者编辑图像、视频内容中生物特征的技术;

    (五)图像生成、图像增强、图像修复等生成或者编辑图像、视频内容中非生物特征的技术;

    (六)三维重建、数字仿真等生成或者编辑数字人物、虚拟场景的技术。

    深度合成服务提供者,是指提供深度合成服务的组织、个人。

    深度合成服务技术支持者,是指为深度合成服务提供技术支持的组织、个人。

    深度合成服务使用者,是指使用深度合成服务制作、复制、发布、传播信息的组织、个人。

    训练数据,是指被用于训练机器学习模型的标注或者基准数据集。

    沉浸式拟真场景,是指应用深度合成技术生成或者编辑的、可供参与者体验或者互动的、具有高度真实感的虚拟场景。

    通过定义可以明确看到,文本转语音榜上有名,而本站应该属于上述定义中的“深度合成服务技术支持者”,而大家应该就是“使用者”了,遗憾的是,本站无法具备规定中对于“技术支持者”所必需的各项要求。

    既然不能满足新规要求,且作为守法公民,在此只能遗憾宣布:
    为响应《互联网信息服务深度合成管理规定》,本站所有语音合成工具,将会在2022年12月31日全面关停,届时,本站将不再提供任何文本转语音服务,再次感谢大家一直以来的支持与厚爱!

    前言

    MS-TTS工具经过N个版本更新,该实现的功能都已经一点点肝出来了,称它为全网最强免费TTS文本语音合成工具应该不为过,所以,接下来可能在很长一段时间内,除去发现重大bug外,应该都不会再进行大的更新了。

    当前版本:v1.9.5

    更新内容:

    1.9.5

    • 1、界面大小可自行调整;

    • 2、Edge接口数据汉化;

    • 3、角色数量增加到20个;

    • 4、恢复强制更新。(原因请自行理解)

    • 5、其它bug修复

      1.9.5.1

    • 稳定性修复

      1.9.5.2

    • 微软接口wav格式无法合并bug修复

      1.9.5.3

    • 修复“Invalid characters in file name”

    正文

    微软TTS文本转语音引擎的确是非常NB,合成语音非常接近真人,应该是当前同类产品中体验最好的,官网有提供在线语音合成,但不提供合成后的音频文件下载,使用时会比较麻烦,所以写成工具。

    注意:
    1、记得先解压,然后使用管理员模式运行程序!
    2、简单模式-超长文本:导入的txt文件编码必须为utf-8,文件大小不要超过5MB;
    3、试听功能:试听范围为主体内容前150字符;
    4、SSML模式:试听模式主体内容长度不得超过150字符,合成模式主体内容长度不得超过2500字符;

    视频教程https://www.bilibili.com/video/BV1wg411k7SH/

    界面说明

    左侧最上方为合成语音质量选项,目前软件支持两种格式,分别为MP3和WAV,每种格式分别有四种质量,请根据实际需求设置调整;

    左侧中间有Proxy选项(由于TTS服务器在国外,网络非常不稳定,所以增加了这个选项,有条件就用,如果没条件且又很卡的话,那就换个时间再试,实测:在下半夜及上午时间段,使用效果更好!)


    左侧下方为需要配音角色选项,及添加角色按钮,既缩小了界面尺寸,又可以添加更多的角色(最多6个角色),使用方法也很简单,如果你不需要多角色,那么直接在角色里调整好就可以试听合成了,如果是多角色,那么先需要设置好角色选项,然后添加角色,每个角色都需要相同操作,在所有角色添加完成后,右侧文本区选择文本,鼠标右键--设置角色--选择对应的角色即可;


    右侧是文本内容区域,以及试听合成停止保存配置功能按钮。
    注:保存配置无法保存添加的角色信息,后续版本可能会改进

    不设置角色时,软件默认使用左侧角色设置。

    新角色

    注意,新角色微软官方定义为测试角色,所以并不是完全开放,如果你选择使用这两个角色,下方出现如下图的提示,则说明当前微软未开放,以后再试吧。

    多音字

    MS-TTS运行后会自动在程序目录生成“dict.txt”词典文件,


    将需要自动替换的内容按照:
    原始内容,替换内容
    的格式一行一条,写入“dict.txt”词典文件保存即可,如下:

    语音合成

    前提工作准备好就可以点击右侧上方的试听合成按钮,开始进行语音试听或合成

    注意:文本内容越多,合成所需时间越长!

    中小文本合成完成后,音频在工具目录下的“audio日期时间子目录”中,如下:

    超长文本语音合成完成后,音频在工具目录下的“audio文本文件名称”文件夹中,如下


    语音合成完成后,将自动调用ffmpeg进行合并。


    语音合成完成后自动合并



    解决时长限制


    软件报病毒

    软件有加密保护,会被部分杀软误报,不放心请勿使用,谢谢合作。

    MS-TTS下载地址

    https://null119.lanzoul.com/ik2ix0fh27tg

    TTS的Holla Day

    TTS的Holla Day

    8.5
    韩国 金泰妍 黄美英 徐珠贤
    国之语音

    国之语音

    6.1
    2019年 韩国 宋康昊 朴海日 全美善
    合成人

    合成人

    7.1
    1988年 中国大陆 黄爱玲 赵宝才 房燕
    文字战争

    文字战争

    2004年 美国 
    工具人 第一季

    工具人 第一季

    8.6
    2012年 英国 斯蒂芬·弗雷
    超越文字的魔法

    超越文字的魔法

    7.1
    2011年 美国 波普伊·蒙哥马利 艾米莉·霍尔姆斯 安东尼奥·库普
    文字与图像

    文字与图像

    6.8
    2013年 美国 加拿大 克莱夫·欧文 朱丽叶·比诺什 基冈·康纳·特雷西
    工具人 第二季

    工具人 第二季

    8.8
    2013年 英国 Richard Ayoade
    只有狗能免费通行

    只有狗能免费通行

    2007年 以色列 利奥尔·阿什肯纳齐 阿耶莱特·祖里尔 阿隆·阿布布尔
    免费试吃

    免费试吃

    6.2
    2012年 美国 杰西·艾森伯格 杰森·雷特 惠特尼·阿贝勒
    BBC 地平线系列:扮演上帝——合成生物学前沿

    BBC 地平线系列:扮演上帝——合成生物学前沿

    8.2
    2012年 英国 Adam Rutherford Ed Boyden Rob Carlson
    TOP