草稿:CMU Sphinx

Pocketsphinx
程式語言	C
作業系統	Cross-platform
類型	Image library
許可協議	BSD-style
網站	cmusphinx.github.io/wiki/

Sphinx4
程式語言	Java
作業系統	Cross-platform
類型	Image library
許可協議	BSD-style
網站	cmusphinx.github.io/wiki/

本草稿尚未提交審核

提交前，請先查閱維基百科不是什麼，以免犯下常見錯誤。
若您確認所撰草稿符合維基百科的收錄要求，請予以提交，讓有經驗的志願者審核。
草稿提交沒有截止日期，您可以不斷改善，直至滿意後提交。不過若草稿六個月無編輯，將會視為廢棄而刪除。

要讓草稿被接受，需要至少滿足以下要求：

有多個來源能夠顯示主題符合維基百科的收錄指引。來源應該：（1）滿足可靠來源指引（2）是第二手來源（3）獨立於主題實體（4）對主題有有效介紹。對於一些主題，還有替代標準。
以中立的觀點書寫。
尊重著作權，不複製粘貼。

我們強烈不鼓勵您創建與您自己、您所在的組織、其對手或其產品相關的條目。如果您仍要這麼做，請申報利益衝突。

注意：若您提交之後，本模板出現在頁面最下方，表示您已成功提交。

如要編輯本草稿，請單擊窗口頂部的「編輯」選項。
如果您需要其它幫助，請在條目建立專題的詢問桌詢問或者使用即時通訊軟件向我們經驗豐富的編輯者尋求即時幫助。

如何改善您的草稿

Wikipedia:參與貢獻 – 如何編輯維基百科的基本概述。
Help:Wiki標記式語言 – 如何使用標記語言
Help:如何引用來源 – 如何引用參考文獻
Wikipedia:改進條目 – 如何改進您的條目
Wikipedia:更優秀條目寫作指南 – 如何進一步改善您的條目
Wikipedia:可供查證 – 確保您的條目引用了可靠的第三方來源
來源搜尋：「"CMU Sphinx"」——Google：網頁、新聞、學術、圖書、圖片；百度：網頁、新聞、學術、圖片；知網工具書；JSTOR；維基百科圖書館Report

本草稿由TimWu007（貢獻·日誌）於5個月前最後編輯。

提交草稿等待審核！

CMU Sphinx，簡稱 Sphinx，是卡內基梅隆大學開發的一組語音識別系統的總稱。這些系統包括一系列的語音識別器（Sphinx 2 - 4）和一個聲學模型訓練器（SphinxTrain）。

在2000年，卡內基梅隆大學的 Sphinx 小組開源了幾個語音識別組件，包括 Sphinx 2，並在2001年開源了 Sphinx 3。這些語音解碼器附帶數個聲學模型以及應用程式，可用的資源也包括聲學模型訓練軟件、語言模型編譯軟件和一個公有的的發音詞典 cmudict。

Sphinx 包括若干軟件系統，具體描述如下。

Sphinx

Sphinx 是一個連續語音、說話人獨立的識別系統，使用隱藏式馬可夫聲學模型(HMMS)和 N-gram。該系統由李開復開發。Sphinx 的特色是能夠分辨具有連續語音、識別說話者大詞彙量的可行性，而在當時（1986 年），這種可能性還存在爭議。Sphinx 現在僅具有歷史意義，因為其性能已被後續版本所超越。一篇存檔文章[2] 詳細描述了這個系統。

Sphinx 2

一個以性能與速度為導向的識別器，最初由黃學東在卡內基梅隆大學開發，並於2000年由Kevin Lenzo在LinuxWorld上以BSD風格許可證在SourceForge上發佈為開源軟件。Sphinx 2專注於適合語音應用的實時識別。因此，它包含了端點檢測、部分假設生成、動態語言模型切換等功能。它被用於對話系統和語言學習系統中，也可以用於基於計算機的PBX系統，如Asterisk。Sphinx 2的代碼也被整合到許多商業產品中。目前它已不再積極開發（除例行維護外）。目前的實時解碼器開發正在Pocket Sphinx項目中進行。一篇存檔文章詳細描述了這個系統。

Sphinx 3

Sphinx 2 使用半連續表示法進行聲學建模（即，所有模型使用同一組高斯分佈，個別模型以這些高斯分佈上的權重向量表示）。Sphinx 3 採用了流行的連續隱馬爾可夫模型（HMM）表示法，主要用於高精度、非實時的識別。最近的算法和硬件發展使得 Sphinx 3 能力接近實時傳輸，儘管尚不適合關鍵的互動應用。Sphinx 3 正在積極開發中，並且與 SphinxTrain 一起提供了多種現代建模技術，如 LDA/MLLT、MLLR 和 VTLN，這些技術提高了識別精度（有關這些技術的描述，請參見語音識別文章）。

Sphinx 4

Sphinx 4 是對 Sphinx 引擎的全面重寫，目的是提供一個更加靈活的框架以便進行語音識別研究，完全使用 Java 程式語言編寫。Sun Microsystems 支持了 Sphinx 4 的開發，並為該項目貢獻了軟件工程專業知識。參與者包括來自 MERL、MIT 和 CMU 的個人。（目前支持的程式語言有 C、C++、C#、Python、Ruby、Java 和 JavaScript。）

PocketSphinx

PocketSphinx 是 Sphinx 的一個版本，可以用於嵌入式系統（例如，基於 ARM 處理器）。PocketSphinx 正在積極開發中，並且包含了固定點運算和高效的 GMM 計算算法等特性。

References

^ http://www.speech.cs.cmu.edu/sphinx

External links

Sphinx developers recommend Vosk now
CMU Sphinx homepage
Sphinx' repository on GitHub should be considered the definitive source for code
SourceForge hosts older releases and files
NeXT on Campus Fall 1990 (This document is postscript format compressed with gzip.) Carnegie Mellon University - Breakthroughs in speech recognition and document management, pgs. 12-13

Category:自由軟件文化和文件 Category:語音技術 Category:語音處理

[1] ttp://www.speech.cs.cmu.edu/sphinx

[1]