草稿:CMU Sphinx

Pocketsphinx
编程语言	C
操作系统	Cross-platform
类型	Image library
许可协议	BSD-style
网站	cmusphinx.github.io/wiki/

Sphinx4
编程语言	Java
操作系统	Cross-platform
类型	Image library
许可协议	BSD-style
网站	cmusphinx.github.io/wiki/

本草稿尚未提交审核

提交前，请先查阅维基百科不是什么，以免犯下常见错误。
若您确认所撰草稿符合维基百科的收录要求，请予以提交，让有经验的志愿者审核。
草稿提交没有截止日期，您可以不断改善，直至满意后提交。不过若草稿六个月无编辑，将会视为废弃而删除。

要让草稿被接受，需要至少满足以下要求：

有多个来源能够显示主题符合维基百科的收录指引。来源应该：（1）满足可靠来源指引（2）是第二手来源（3）独立于主题实体（4）对主题有有效介绍。对于一些主题，还有替代标准。
以中立的观点书写。
尊重著作权，不复制粘贴。

我们强烈不鼓励您创建与您自己、您所在的组织、其对手或其产品相关的条目。如果您仍要这么做，请申报利益冲突。

注意：若您提交之后，本模板出现在页面最下方，表示您已成功提交。

如要编辑本草稿，请单击窗口顶部的“编辑”选项。
如果您需要其它帮助，请在条目建立专题的询问桌询问或者使用即时通讯软件向我们经验丰富的编辑者寻求即时帮助。

如何改善您的草稿

Wikipedia:参与贡献 – 如何编辑维基百科的基本概述。
Help:Wiki标记式语言 – 如何使用标记语言
Help:如何引用来源 – 如何引用参考文献
Wikipedia:改进条目 – 如何改进您的条目
Wikipedia:更优秀条目写作指南 – 如何进一步改善您的条目
Wikipedia:可供查证 – 确保您的条目引用了可靠的第三方来源
来源搜索：“"CMU Sphinx"”——Google：网页、新闻、学术、图书、图片；百度：网页、新闻、学术、图片；知网工具书；JSTOR；维基百科图书馆Report

本草稿由TimWu007（贡献·日志）于5个月前最后编辑。

提交草稿等待审核！

CMU Sphinx，简称 Sphinx，是卡内基梅隆大学开发的一组语音识别系统的总称。这些系统包括一系列的语音识别器（Sphinx 2 - 4）和一个声学模型训练器（SphinxTrain）。

在2000年，卡内基梅隆大学的 Sphinx 小组开源了几个语音识别组件，包括 Sphinx 2，并在2001年开源了 Sphinx 3。这些语音解码器附带数个声学模型以及应用程序，可用的资源也包括声学模型训练软件、语言模型编译软件和一个公有的的发音词典 cmudict。

Sphinx 包括若干软件系统，具体描述如下。

Sphinx

Sphinx 是一个连续语音、说话人独立的识别系统，使用隐藏式马可夫声学模型(HMMS)和 N-gram。该系统由李开复开发。Sphinx 的特色是能够分辨具有连续语音、识别说话者大词汇量的可行性，而在当时（1986 年），这种可能性还存在争议。Sphinx 现在仅具有历史意义，因为其性能已被后续版本所超越。一篇存档文章[2] 详细描述了这个系统。

Sphinx 2

一个以性能与速度为导向的识别器，最初由黄学东在卡内基梅隆大学开发，并于2000年由Kevin Lenzo在LinuxWorld上以BSD风格许可证在SourceForge上发布为开源软件。Sphinx 2专注于适合语音应用的实时识别。因此，它包含了端点检测、部分假设生成、动态语言模型切换等功能。它被用于对话系统和语言学习系统中，也可以用于基于计算机的PBX系统，如Asterisk。Sphinx 2的代码也被整合到许多商业产品中。目前它已不再积极开发（除例行维护外）。目前的实时解码器开发正在Pocket Sphinx项目中进行。一篇存档文章详细描述了这个系统。

Sphinx 3

Sphinx 2 使用半连续表示法进行声学建模（即，所有模型使用同一组高斯分布，个别模型以这些高斯分布上的权重向量表示）。Sphinx 3 采用了流行的连续隐马尔可夫模型（HMM）表示法，主要用于高精度、非实时的识别。最近的算法和硬件发展使得 Sphinx 3 能力接近实时传输，尽管尚不适合关键的互动应用。Sphinx 3 正在积极开发中，并且与 SphinxTrain 一起提供了多种现代建模技术，如 LDA/MLLT、MLLR 和 VTLN，这些技术提高了识别精度（有关这些技术的描述，请参见语音识别文章）。

Sphinx 4

Sphinx 4 是对 Sphinx 引擎的全面重写，目的是提供一个更加灵活的框架以便进行语音识别研究，完全使用 Java 编程语言编写。Sun Microsystems 支持了 Sphinx 4 的开发，并为该项目贡献了软件工程专业知识。参与者包括来自 MERL、MIT 和 CMU 的个人。（目前支持的编程语言有 C、C++、C#、Python、Ruby、Java 和 JavaScript。）

PocketSphinx

PocketSphinx 是 Sphinx 的一个版本，可以用于嵌入式系统（例如，基于 ARM 处理器）。PocketSphinx 正在积极开发中，并且包含了固定点运算和高效的 GMM 计算算法等特性。

References

^ http://www.speech.cs.cmu.edu/sphinx

External links

Sphinx developers recommend Vosk now
CMU Sphinx homepage
Sphinx' repository on GitHub should be considered the definitive source for code
SourceForge hosts older releases and files
NeXT on Campus Fall 1990 (This document is postscript format compressed with gzip.) Carnegie Mellon University - Breakthroughs in speech recognition and document management, pgs. 12-13

Category:自由软件文化和文件 Category:语音技术 Category:语音处理

[1] ttp://www.speech.cs.cmu.edu/sphinx

[1]