语音开源软件研究.ppt

上传人:本田雅阁 文档编号:3455552 上传时间:2019-08-27 格式:PPT 页数:24 大小:1.30MB
返回 下载 相关 举报
语音开源软件研究.ppt_第1页
第1页 / 共24页
语音开源软件研究.ppt_第2页
第2页 / 共24页
语音开源软件研究.ppt_第3页
第3页 / 共24页
语音开源软件研究.ppt_第4页
第4页 / 共24页
语音开源软件研究.ppt_第5页
第5页 / 共24页
点击查看更多>>
资源描述

《语音开源软件研究.ppt》由会员分享,可在线阅读,更多相关《语音开源软件研究.ppt(24页珍藏版)》请在三一文库上搜索。

1、语音开源软件研究,开源软件 Open Source精神,在计算机刚开始流行的时候,大多数软件都是免费提供的.当计算机的处理能力越来越强劲,应用软件也越来越复杂,软件也不再免费提供.虽然如此,以黑客为代表的技术狂热者不满软件收费、封闭源码的行为。除了破解商业软件取乐外,他们采承着免费、自由的原则将自己写的一些软件源代码公之于众。,开源软件的应用领域,IT168技术调研中心08年的调查结果显示: 在应用层上面,桌面系统操作接近70%;服务器操作系统接近60%;而数据库也超过了50%.但相对操作系统和数据库来讲,其它类型的开源软件的应用比例都没有超过50%。这说明,开源软件的应用和服务的价值还没有得

2、到最广泛发现. 从用途来看,有26%在工作场所使用开源软件,37. 5%在工作场所和个人都使用开源软件,而技术人员对开源的应用体验与传播起到了关键作用。,开源软件的机遇,全球经济有助于开源软件的进一步普及 1.开源技术的发展将降低开发成本 2.软件厂商的参与提高了开源软件的竞争力 3.开放、创新是开源软件最大的优势,语音开源软件,语音方面的软件项目由于语音信号处理发展所限,没有网络、图像等数量多 非常成熟的语音软件比较少,也就意味着发展的空间很大 主要软件类型有:语音合成与识别、网络电话、语音编码,SFLphone,SFLphone是一种基于IP 的语音电话软件。,SFLphone,开发语言:

3、 C/C+ 操作系统: Linux 软件主页: http:/www.sflphone.org/ 下载地址: http:/www.sflphone.org/download.php,SFLphone-Introduction,SFLphone is a SIP/IAX2 compatible softphone for Linux. The SFLphone projects goal is to create a robust enterprise-class desktop phone. While it can serve home users very well, it is desig

4、ned with a hundred-calls-a-day receptionist in mind. SFLphone is released under the GNU General Public License version 3. It is developed by the global community, and is maintained by Savoir-faire Linux, a Canadian Linux consulting company.,SFLphone-features,Call features Unlimited number of lines C

5、all history + search feature Call transfer Call hold Call recording Multi-way conferencing Peer to peer calls,SFLphone-features,Communication SIP and IAX2 protocols support DTMF(双音多频) support (SIP INFO) Multiple accounts support (多账户支持) STUN(Simple Traversal of UDP over NATs,NAT 的UDP简单穿越) support pe

6、r account SIP(Session Initiation Protocol一个应用层的信令控制协议) Re-invite,SFLphone-features,Audio Pulseaudio(单独调节音量) support Native ALSA(Advanced Linux Sound Architecture高级Linux声音体系) interface, DMix support High definition audio codecs: Celt, Speex 16000/32000, G722 + Standards (G711, GSM) Audio devices dete

7、ction Silence detection with speex(一种格式) audio codec,SFLphone-features,Security Voice encryption (SRTP) Signalling encryption (TLS) Multiple realms authentification mecanism ?,SFLphone-features,Desktop Gnome, KDE and python-cli clients available Account assistant wizard Desktop notification GNOME/KD

8、E address book integration Minimize on start-up Minimize to tray,SFLphone-features,Others Automatic opening of incoming URL Central server providing free SIP/IAX account Locale settings: french, english, german, chinese, spanish, italian, danish,SFLphone-questions,Task or Feature #2647 Cannot initia

9、te ZRTP encrypted calls Bug #2641 recorded/outgoing sound quality is poor,BroadVoice,BroadVoice 是一种由Broadcom和由CableLabs 实验室,电信工程师协会,和ANSI创造的语音编码,应用在有线电话和IP语音通信。,BroadVoice,BroadVoice的根本目的是为在IP网络语音传输进行优化。它的BV16和BV32编码质量很高,具有低延迟(只有5毫秒);低CPU使用率(与ITU编码相比,可节省1/2到1/3的CPU);高质量(与其它编码相比,有较好的MOS得分);适当的比特率(编码效

10、率很高)等特点。该编码可由C和C+编程,支持Unix、Linux、Windows系统,具有很强的通用性。,BroadVoice编码延时,编码延时,BroadVoice编码复杂度,下面的图片是对百万指令每秒(MIPS)计算的复杂性的比较,以及对一个商用DSP的典型的16bit内存总容量RAM内存的要求的对比。,BroadVoice语音输出编码质量,下面的图比较了窄带和宽带编解码器输出的质量,比较方法是ITU-T Recommendation P.862方法,进行PESQ(Perceptual Evaluation of Speech Quality)评价的对比。每条曲线代表一个单一的编解码器,对13种语言评估与PESQ进行评分,对每种语言平均超过96句。,其他软件,OpenVXI 用来创建语音对话系统,sndpeek 识别说话者,Speech at CMU,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1