CMU発音辞書( CMUdictとも呼ばれる) は、カーネギーメロン大学(CMU)の音声グループが音声認識研究で使用するために最初に作成したオープンソースの発音辞書です。
CMUdictは、英語の単語を北米発音にマッピングする綴り字法と音声表記を提供します。これは、 CMU Sphinxシステムなどの音声認識(ASR)やFestivalシステムなどの音声合成(TTS)のための表現を生成するために一般的に使用されています。CMUdictは、辞書にまだ収録されていない単語の発音を生成する統計的書記素音素変換(g2p)モデル[ 1 ]を構築するための学習コーパスとして使用できます。
最新リリースは0.7bで、134,000件以上のエントリが含まれています。インタラクティブな検索バージョンも利用可能です。[ 2 ]
データベースは、1行に1つのエントリが「 」形式で記述されたプレーンテキストファイルとして配布されますWORD <pronunciation>。各エントリは2つのスペースで区切られます。単語に複数の発音がある場合は、番号付きバージョン(例:WORD(1))を使用して発音のバリエーションが識別されます。発音は、 ARPABETシステムの修正版を使用してエンコードされ、レベル0、1、2の母音に強勢記号が追加されています。行頭の;;;トークンはコメントを示します。音声認識エンジンに直接使用できる派生形式も配布物の一部として提供されています。この形式では強勢の区別が省略されます(通常、ASRでは使用されません)。
以下はCMU発音辞書で使用されている音素の表です。[ 2 ]
母音 | アルパベット | Rspl. | IPA | 例 |
|---|
AA | ああ | ɑ | 奇数 |
AE | 1つの | æ | で |
AH0 | ə | ə | について |
AH | えーと | ʌ | 小屋 |
AO | ああ | ɔ | べき、物語 |
AW | わあ | あ | 牛 |
AY | 目 | aɪ | 隠れる |
EH | えー | ɛ | エド |
母音 | アルパベット | Rspl. | IPA | 例 |
|---|
ER | ur、ər | ɝ、 ɚ | 傷つく |
EY | ああ | eɪ | 食べた |
IH | 私、私 | ɪ | それ |
IY | ee | 私 | 食べる |
OW | おお | お | オート麦 |
OY | おい | ɔɪ | トイ |
UH | うう | ʊ | フード |
UW | うーん | あなた | 二 |
子音 | アルパベット | Rspl. | IPA | 例 |
|---|
B | b | b | なれ |
CH | ch、tch | tʃ | チーズ |
D | d | d | ディー |
DH | dh | ð | 3つ |
F | f | f | 手数料 |
G | グラム | ɡ | 緑 |
HH | h | h | 彼 |
JH | j | dʒ | g ee |
子音 | アルパベット | Rspl. | IPA | 例 |
|---|
SH | シュ | ʃ | 彼女 |
T | t | t | お茶 |
TH | 番目 | θ | エータ |
V | v | v | v ee |
W | w、wh | わ | 私たちは |
Y | y | j | 収率 |
Z | z | z | ジー |
ZH | zh | ʒ | 発作 |
歴史
| バージョン | 発売日[ 3 ] | ライセンス |
|---|
| 0.1 | 1993年9月16日 | パブリックドメイン |
| 0.2 | 1994年3月10日 | パブリックドメイン |
| 0.3 | 1994年9月28日 | パブリックドメイン |
| 0.4 | 1995年11月8日 | パブリックドメイン |
| 0.5 | 公開なし | パブリックドメイン |
| 0.6 | 1998年8月11日 | パブリックドメイン |
| 0.7 | 公開なし | パブリックドメイン |
| 0.7a | 2008年2月18日 | 2節BSD |
| 0.7b | 2014年11月19日[ 4 ] | 2節BSD |
| GitHub(バージョン管理なし) | 2021年5月26日 | 2節BSD |
アプリケーション
参照
参考文献
外部リンク