网站颜色:

科大讯飞5.0 中英文朗读软件 文字转语音音频并导出 语音合成系统

  • 颜色分类:白色灰色黑色桔色
  • 网络设备类型:其他/other
拍下请留邮箱,会自动将资料发到你邮箱下载!

别家的不支持64位系统(需要远程安装请拍套餐)

(咨询特价)年8月26编辑-

咱家支持64位系统32位系统,XP系统,W8系统。

很简单的说这个软件就是打上汉字就出声音,制作很简单的。有制作好的试听效果,或者你给我一段文字我给你制作一下试听效果。可以自定义换背景音乐 可以转换成您需要的多种播放格式。

名称:科大讯飞《Interphonic5.0完整版》中文语音合成系统

商品简介:兼容win7系统

《科大讯飞 Interphonic5.0完整版》中文语音合成系统(包含三个语音库

本系统不受字数或功能限制,普通版一次最多只能合成64000个文字(含英文)此版本,您尽可一次性合成1000000个文字(含英文)或者一亿个文字(含英文)

★超越其它同类朗读软件,比4.0的性能又有较大提升★多语种,三个音库《小宇(中英文男声)、 小燕(中英文女声)、 小倩(中英文女声)、多音色,可随意调节语速、音高(少年-青年-老年)★增强表现力,语音效果更自然★高准确度的智能文本人性化修改(可以编辑字的发音)★数字、短语文本合成效果显著提升★丰富的参数设置与调节功能★灵活高效的自定义定制资源★个性化背景音乐可自由添加★导出语音文件( WAV音频格式 )★比其它版本增加了最专业的高保真音频转换软件,本软件是独立软件,支持多种音频格式输入或输出,可自由调节音频输出大小。

本朗读软件是完整版

国内最先进的朗读技术!

技术特点

·独创的智能化文本预处理技术;

·独创的语料信息统计模型;

·前后端一致性的语料库设计方法、和语料库的自动构建方法;

·听感量化思想指导下,以变长韵律模板为基础的高精度韵律模型;

·高鲁棒性的智能化文本分析处理技术;

·基于听感损失最小的语料库裁减技术 ;

·特定语种知识和系统建模方法分离的多语种语音合成系统框架;

·面向特定领域应用的定制语音合成技术。

功能特性

1. 高质量语音——将输入文本实时转换成流畅、清晰、自然和具有表现力的语音数据

2. 多语种服务——整合了多语种语音合成引擎,可提供中文、中英文混读、英文、语音合成服务;

3. 高精度文本分析技术——保证了对文本中未登录词(如地名)、多音字、特殊符号(如标点、数字)、韵律短语等智能分析和处理;

4. 多字符集支持——支持输入GB2312、GBK、Big5、Unicode和UTF-8等多种字符集,普通文本和带有CSSML标注等多种格式的文本信息;

5. 多种数据输出格式——支持输出多种采用率的线性Wav,A/U率Wav和Vox等格式的语音数据;

6. 灵活的接口——提供了标准接口、简单接口、COM接口、SAPI接口,便于在多种环境下进行系统的集成;

7. 语音调整功能——开发接口提供了音量、语速、音高等多种合成参数的动态调整功能;

8. 配置和管理工具——合成引擎提供了统一进行配置和管理的工具,完成了全局参数配置、用户词典、用户规则、定制资源包管理等功能;

9. 效果优化——合成引擎提供了以定制资源包和CSSML为代表的多种针对实际应用环境进行合成效果优化的方法;

10.一致的访问方式——能以Client/Server方式访问远程的语音合成服务,并且提供与本地调用相同的开发接口,实现了完全透明的访问;

11.动态负载均衡——提供了动态负载均衡模块,以对用户透明的方式动态调配多台语音合成服务器的资源;

12.背景音和预录音——合成系统还提供了背景音和预录音的功能 ,满足用户不同场合的应用和个性化需求。

·支持语种增加

多语种的语音合成解决方案是InterPhonic系列语音合成系统的重要目标,目前InterPhonic系列语音合成系统已经能够支持中文普通话、粤语和英文三个语种,并在纯中文、中英文混读、粤英文混读方面达到了很好的效果。InterPhonic 5.0系统在此基础上着重改进了:

(1)纯英文文本的合成效果——Sherri音库。该音库选用以英语为母语的发音人,其发音为标准美国英语,朗读风格流畅自然。

(2)新增台湾国语合成效果——小琳音库。该音库发音为带有台湾地区方言特色的国语,音色甜美柔和。

上述新增音库均沿用了科大讯飞先进的语料收集算法,大幅度扩展了英文语料的数量,保证了语料的覆盖面,并且针对英文的特点加入了大量优化规则,可以很好地适应当前各种应用语境。

·增加不同发音人的音库

InterPhonic 5.0系统增加了三种全新的音库——小倩、小琳和Sherri音库。新音库的制作采用了全新的录音语料,并增加了数字、、体育等其他领域的语料文本。新音库将提供给用户听感上最直接的效果改进。

至此,本系统可以提供小宇、小倩、小燕和Sherri七个不同发音人录制的音库,能够支持中文、中英混读、英文、粤英混读和台湾国语,每种音库分别提供6K、8K、11K和16K四种不同采样率的音库安装包。在合成过程中,如果安装了多个音库,用户可以根据需要实时切换并测听不同音色、不同采样率的合成效果。

·粤语口语化功能改进

粤语是一种口语风格很强的语种,为了更好的提高粤语的合成效果,InterPhonic 5.0除了进一步优化口语化规则之外,还在现有小美粤语库的基础上补充了一部分口语化关闭的语料,并提供将口语化关闭的功能,这些改进使得粤语合成效果更符合实际应用的需要。

·预录音功能改进

InterPhonic 3.0语音合成系统实现了预录音的统一管理和处理的功能。用户可以将预录音添加到系统中作为资源,并调整预录音的语音特征,使预录音和合成语音衔接更加自然。

InterPhonic 4.0在InterPhonic 3.0可设置预录音属性的基础上,增加了匹配条件功能和批处理功能。

InterPhonic5.0用预录音智能匹配的方法,最大限度地匹配提示音;用合成模板的方法,改进定制领域合成效果,简化定制流程,加快定制速度。这些改进使得预录音的使用更自然、更灵活,满足更广泛的应用需求。

·数字短语效果改进

针对主流应用环境的普遍需求,科大讯飞广泛收集实际应用的语料,并进行细致分析和专业的优化,InterPhonic 5.0在数字数值、姓名短语等最常见应用下效果提升显著,合成效果更加清晰准确、节奏感更强。

·自定义词库改进

为了进一步改进分词效果发音效果,资源管理中心的自定义词库功能在原来基础上增加了词语的节奏定制功能和粤语加词功能。改进以后的自定义词库可以添加中文、英文、粤语词语,可以设置英文词语朗读模尸并定制词语的朗读节奏。

·系统版本增加

InterPhonic5.0语音合成系统提供了简体中文、繁体中文和英文三种版本,每个版本都配备了相应的安装包,工具界面以及文档,以满足不同类型用户的需求

针对主流应用环境的普遍需求,科大讯飞广泛收集实际应用的语料,并进行细致分析和专业的优化,InterPhonic 5.0在数字数值、姓名短语等最常见应用下效果提升显著,合成效果更加清晰准确、节奏感更强。 音库编号 发音人 发音风格 支持语种 支持采样率
1 小燕 青年女声,音质清脆,风格轻松活泼 中文及中英混读 16k
2小宇 中年男声,音质淳厚,风格沉稳柔和 中英混读及纯英文16k
3 小倩 青年女声,音质甜美,风格轻快活泼 中文及中英混读 16k
项 目 指 标
支持操作系统 Microsoft Windows NT/2000/XP/2003、Linux
支持语种 汉语普通话、英语、粤语、台湾国语
支持音库 女声中英、粤英、台湾国语音库;男声中英、纯英文音库
支持文本类别 普通书面文本、CSSML文本
支持文本控制标记 支持TCCM文本标记
支持语音数据输出格式 采样率 16K,11K,8K,6K
声音数据格式 16bit/8bit PCM,aLaw/uLaw,ADPCM
声音文件格式 Microsoft PCM / aLaw/uLaw Wave, Dialogic Vox
支持速度调整 是,范围是:0.5~2.0
英文字符串处理 按照英文习惯发音
支持字符集 GB2312,GBK,BIG5,UNICODE,GB(咨询特价)
识别汉字数量 支持国标的一级和二级字库,共6763个简体汉字
系统词库词组数量 约300000条
支持用户定义词库 是
语音数据缓冲区设置 支持64K~2M Bytes
断句参数设置 支持回车符处理参数和最大断句长度参数
标点符号发音设置 支持标点符号发音方式的选择和具体发音的设置
数字串发音设置 支持数字串发音方式的选择
发音停顿风格设置 支持发音停顿风格的选择
节奏正确率 93%
句子可懂度 97%
自然度 4.3(5分制)
单线程内存占用 298M Bytes
30路并发内存占用 358M Bytes
最低配置 PIII800;512M RAM

 

长鑫工作室吖热门设计联盟服务商