Kana-to-phone mapping in recognition dictionary

February 1, 2013

As described in the posted article “Adding recognition words”, a word pronunciation should be described as a sequence of phonemes in the recognition dictionary.  Here is the Japanese kana-to-phone mapping used in MMDAgent.

a i u e o
k a k i k u k e k o
s a sh i s u s e s o
t a ch i ts u t e t o
n a n i n u n e n o
h a h i f u h e h o
m a m i m u m e m o
y a y u y o
r a r i r u r e r o
w a o N
g a g i g u g e g o
z a z i z u z e z o
d a z i z u d e d o
b a b i b u b e b o
p a p i p u p e p o
キャ キュ キョ
ky a ky u ky o
シャ シュ シェ ショ
sh a sh u sh e sh o
チャ チュ チェ チョ
ch a ch u ch e ch o
ニャ ニュ ニョ
ny a ny u ny o
ヒャ ヒュ ヒョ
hy a hy u hy o
ミャ ミュ ミョ
my a my u my o
リャ リュ リョ
ry a ry u ry o
ギャ ギュ ギョ
gy a gy u gy o
ジャ ジュ ジェ ジョ
j a j u j e j o
ビャ ビュ ビョ
by a by u by o
ピャ ピュ ピョ
py a py u py o
ファ フィ フュ フェ フォ
f a f i hy u f e f o
ウィ ウェ ウォ
w i w e w o
ヴァ ヴィ ヴェ ヴォ
b a b i b e b o
ツァ ツィ ツェ ツォ
ts a ts i ts e ts o
ティ テュ
t i t u
ディ デュ
d i d u
ドゥ
d u

Please note that there are special rules for Japanese prolonged consonant “ッ” and long vowels, as shown bellow.

special phoneme

prolonged consonant(ッ) q example: ラッコ r a q k o
long vowels(ー) a: i: u: e: o: example: チーター ch i: t a:

You can also consult the system’s dictionary for reference.  It is located at “AppData\Julius\lang_m\web.60k.htkdic”. The actual pronunciations are written according to the same rules above.

=== Japanese ========================================

「Adding recognition words」の記事で説明したように,ユーザ用の辞書ファイルでは各単語の発音を音素列で記述します.カタカナ読みから音素列への変換は以下の規則に従います.

a i u e o
k a k i k u k e k o
s a sh i s u s e s o
t a ch i ts u t e t o
n a n i n u n e n o
h a h i f u h e h o
m a m i m u m e m o
y a y u y o
r a r i r u r e r o
w a o N
g a g i g u g e g o
z a z i z u z e z o
d a z i z u d e d o
b a b i b u b e b o
p a p i p u p e p o
キャ キュ キョ
ky a ky u ky o
シャ シュ シェ ショ
sh a sh u sh e sh o
チャ チュ チェ チョ
ch a ch u ch e ch o
ニャ ニュ ニョ
ny a ny u ny o
ヒャ ヒュ ヒョ
hy a hy u hy o
ミャ ミュ ミョ
my a my u my o
リャ リュ リョ
ry a ry u ry o
ギャ ギュ ギョ
gy a gy u gy o
ジャ ジュ ジェ ジョ
j a j u j e j o
ビャ ビュ ビョ
by a by u by o
ピャ ピュ ピョ
py a py u py o
ファ フィ フュ フェ フォ
f a f i hy u f e f o
ウィ ウェ ウォ
w i w e w o
ヴァ ヴィ ヴェ ヴォ
b a b i b e b o
ツァ ツィ ツェ ツォ
ts a ts i ts e ts o
ティ テュ
t i t u
ディ デュ
d i d u
ドゥ
d u

なお,促音・長音については以下のルールに従います.

特殊な音素

促音(ッ) q (例)ラッコ r a q k o
長音(ー) a: i: u: e: o: (例)チーター ch i: t a:

MMDAgentに付属のシステム用の辞書は,MMDAgentのフォルダにあるAppData\Julius\lang_m\web.60k.htkdicにあります.同じ形式で記述されていますので,そちらも参考にしてください.

Advertisements