The materials in the example other than the 3-D model of “mei”, including motions, panel models, voice models, and the waveforms generated from voices, are covered under the Creative Commons license (CC BY).

  • You are free to copy and distribute this model under the license terms.
  • You must attribute the work by showing the copyright notice, as shown in the example below.
  • You can only distribute the deliberative work (modified or remixed work of this model) under the same license.

You should also carefully consult the full description of the CC BY license at Creative Commons—Attribution 3.0 Unported—CC BY 3.0.

Example:
menu

CC-BY Copyright 2009-2013 Nagoya Institute of Technology (MMDAgent Accessory “NIT Menu”)

=== Japanese ========================================

Exampleに含まれる,メイちゃんの3Dモデル以外のファイル(モーション,パネル,ボイス)およびボイスから生成される音声波形のライセンスはクリエイティブ・コモンズ BYの元で配布されています.

  • 使用,配布はライセンスに従う限り無償です.
  • コピーライトを表示する必要があります(以下の例を参考に).
  • この作品を改変,変形または加工した場合,その結果生じた作品をこの作品と同一の許諾条件の下でのみ配布することができます.

クリエイティブ・コモンズ BYの要約はCreative Commons — 表示 – 3.0 非移植 — CC BY 3.0をご参照下さい.

例:
menu

CC-BY Copyright 2009-2013 Nagoya Institute of Technology (MMDAgent Accessory “NIT Menu”)

Advertisements

The 3-D model of “mei” in the example script is distributed under the Creative Commons license (CC BY-NC).

  • You may not use this model for commercial purposes. For non-commercial use, copy and distribution of this model is free under the license terms.
  • You must attribute the work by showing the copyright notice, as shown in the example below.
  • You can only distribute the deliberative work (modified or remixed work of this model) under the same license.

You should also carefully consult the full description of the CC BY-NC license at Creative Commons—Attribution-NonCommercial 3.0 Unported—CC BY-NC 3.0.

Example:
mei_bust_up

CC-BY-NC Copyright 2009-2013 Nagoya Institute of Technology (MMDAgent Model “Mei”)

=== Japanese ========================================

メイちゃんの3Dモデルはクリエイティブ・コモンズ BY-NCの元で配布されています.

  • 非商用での使用,配布はライセンスに従う限り無償です.商用利用はできません.
  • コピーライトを表示する必要があります(以下の例を参考に).
  • この作品を改変,変形または加工した場合,その結果生じた作品をこの作品と同一の許諾条件の下でのみ配布することができます.

クリエイティブ・コモンズ BY-NCの要約はCreative Commons — 表示 – 非営利 3.0 非移植 — CC BY-NC 3.0をご参照下さい.

例:
mei_bust_up

CC-BY-NC Copyright 2009-2013 Nagoya Institute of Technology (MMDAgent Model “Mei”)

Holding the scene

October 4, 2013

Pressing the “H” key will hold execution of all running motions in MMDAgent.  Since all motions will stop at the moment while allowing a change of the current view, you can check the whole scene at any moment within a dialog scenario.

hold

=== Japanese ========================================

「H」キーを押すと,MMDAgentの全てのモーション実行を一時停止することができます.キーを押した瞬間に全てのモーションが停止し,その中で視点を自由に変更することができるので,対話シナリオのある瞬間におけるシーン全体を確認することができます.

hold

CC-BY-NC Copyright 2009-2013 Nagoya Institute of Technology (MMDAgent Model “Mei”)
CC-BY Copyright 2009-2013 Nagoya Institute of Technology (MMDAgent Motion “Wait of Mei”, “Bye of Mei”)

Handling barge-in

September 20, 2013

It often occurs in speech interfaces that a user wants to barge in to the system utterance while the system is speakings. You can handle such a “barge-in” action from a user by creating a dialog script (.fst) as follows:

     1 10 RECOG_EVENT_STOP|こんにちは SYNTH_START|mei|mei_voice_normal|こんにちは。
    10 20 SYNTH_EVENT_STOP|mei SYNTH_START|mei|mei_voice_normal|私の名前はメイと言います。
    20 30 SYNTH_EVENT_STOP|mei SYNTH_START|mei|mei_voice_normal|私は情報案内ができます。
    30 50 SYNTH_EVENT_STOP|mei SYNTH_START|mei|mei_voice_normal|ご用件をおっしゃってください。
    10 40 RECOG_EVENT_START SYNTH_STOP|mei 
    20 40 RECOG_EVENT_START SYNTH_STOP|mei 
    30 40 RECOG_EVENT_START SYNTH_STOP|mei
    40 50 SYNTH_EVENT_STOP|mei SYNTH_START|mei|mei_voice_normal|はい。
    50  2 SYNTH_EVENT_STOP|mei <eps>

=== Japanese ========================================

音声インタフェースではシステムの発話中にユーザがその発話を遮って音声入力を行うことがあります.これをバージインといいます.以下のように音声対話スクリプト(.fst)を記述することでバージインを扱うことができます.

     1 10 RECOG_EVENT_STOP|こんにちは SYNTH_START|mei|mei_voice_normal|こんにちは。
    10 20 SYNTH_EVENT_STOP|mei SYNTH_START|mei|mei_voice_normal|私の名前はメイと言います。
    20 30 SYNTH_EVENT_STOP|mei SYNTH_START|mei|mei_voice_normal|私は情報案内ができます。
    30 50 SYNTH_EVENT_STOP|mei SYNTH_START|mei|mei_voice_normal|ご用件をおっしゃってください。
    10 40 RECOG_EVENT_START SYNTH_STOP|mei 
    20 40 RECOG_EVENT_START SYNTH_STOP|mei 
    30 40 RECOG_EVENT_START SYNTH_STOP|mei
    40 50 SYNTH_EVENT_STOP|mei SYNTH_START|mei|mei_voice_normal|はい。
    50  2 SYNTH_EVENT_STOP|mei <eps>

MMDAgent can speak any text sentence using the SYNTH_START command.It takes three arguments. The first is the alias of the model to perform lip synchronization with the text. The second is the choice of speaking style as described in the article “Definition of speaking style”.  The third is the text string to be uttered.

The SYNTH_STOP command terminates ongoing speech immediately. The first argument of the command is the model alias currently speaking.

At the end of speech output, a SYNTH_EVENT_STOP event will be issued.

=== Japanese ========================================

SYNTH_STARTコマンドで好きな文を喋らせることができます.第1引数にリップシンクを行うモデルのエイリアス名,第2引数に「Definition of speaking style」のように定義されている発話スタイル名,第3引数に喋らせたい文を記述します.

発話を途中で終了させるにはSYNTH_STOPコマンドを用います.第1引数にはモデルのエイリアス名を記述します.

発話終了時にはSYNTH_EVENT_STOPイベントが発行されます.

Speaking styles of speech synthesis in MMDAgent should be defined in the speaking style definition file (.ojt).  The speaking style definition file (.ojt) contains a list of speech synthesis parameters for each style such as voice mixture weights, duration, pitch, speaking rate, and so on.

The following is an example of speaking style definitions that define different styles using three voice models: “normal”, “angry” and “bashful”, located within the “Voice” folder. Note that texts preceded by “#” are comments.

    # number of voices
    3
    # voice names
    Voice\normal
    Voice\angry
    Voice\bashful
    # number of speaking styles
    7
    # speaking style names, interpolation weight, and synthesis parameter
    normal   1.0  0.0  0.0  1.0  0.0  0.0  1.0  0.0  0.0  1.0  0.0  0.55 1.0
    angry    0.0  1.0  0.0  0.0  1.0  0.0  0.0  1.0  0.0  1.1 -0.5  0.55 1.1
    bashful  0.0  0.0  1.0  0.0  0.0  1.0  0.0  0.0  1.0  1.0  0.5  0.55 0.9
    fast     1.0  0.0  0.0  1.0  0.0  0.0  1.0  0.0  0.0  2.0  1.0  0.55 1.0
    slow     1.0  0.0  0.0  1.0  0.0  0.0  1.0  0.0  0.0  0.5  1.0  0.55 1.0
    high     1.0  0.0  0.0  1.0  0.0  0.0  1.0  0.0  0.0  1.0  4.0  0.55 1.0
    low      1.0  0.0  0.0  1.0  0.0  0.0  1.0  0.0  0.0  1.0 -2.0  0.55 1.0

The first part is a list of voices to be used, and then speaking styles are written per line.  The parameters at each line begin with declaration of a speaking style name, followed by the interpolation weights (from 0.0 to 1.0) of the spectrum model, fundamental frequency, and duration of a voice.  The remaining four parameters are speaking rate (from 0.1 to 10.0, default is 1.0), pitch shift (from -12.0 to 12.0, default is 0.0), gender (from -0.9 to 0.9, default is 0.55), and volume (from 0.1 to 10.0, default is 1.0).

=== Japanese ========================================

MMDAgentの音声合成で指定できる発話スタイルは,発話スタイル設定ファイル(.ojt)で定義します.発話スタイル設定ファイル(.ojt)では,発話スタイルごとにボイスの混合重み,持続時間,音高などの音声合成用パラメータを指定します.

以下は,normal, angry, bashfulの3種類のボイスがフォルダVoice以下に存在するときのいくつかの発話スタイルの定義例です.なお,#以降はコメントです.

    # number of voices
    3
    # voice names
    Voice\normal
    Voice\angry
    Voice\bashful
    # number of speaking styles
    7
    # speaking style names, interpolation weight, and synthesis parameter
    normal   1.0  0.0  0.0  1.0  0.0  0.0  1.0  0.0  0.0  1.0  0.0  0.55 1.0
    angry    0.0  1.0  0.0  0.0  1.0  0.0  0.0  1.0  0.0  1.1 -0.5  0.55 1.1
    bashful  0.0  0.0  1.0  0.0  0.0  1.0  0.0  0.0  1.0  1.0  0.5  0.55 0.9
    fast     1.0  0.0  0.0  1.0  0.0  0.0  1.0  0.0  0.0  2.0  1.0  0.55 1.0
    slow     1.0  0.0  0.0  1.0  0.0  0.0  1.0  0.0  0.0  0.5  1.0  0.55 1.0
    high     1.0  0.0  0.0  1.0  0.0  0.0  1.0  0.0  0.0  1.0  4.0  0.55 1.0
    low      1.0  0.0  0.0  1.0  0.0  0.0  1.0  0.0  0.0  1.0 -2.0  0.55 1.0

最初の部分で使用するボイスを列挙し,次に発話スタイルを1行につき1つずつ定義します.それぞれ,各ボイスが持つ声質・音の高さ・話速の補間重み(0.0~1.0)をそれぞれボイスごとに指定したあと,全体の話速(0.1~10.0,標準1.0)・音高(-12.0~12.0,標準0.0)・ジェンダー(-0.9~0.9,標準0.55)・音量(0.1~10.0,標準1.0)の4つの調整パラメータを指定します.

By pointing a 3-D model and dragging with “Ctrl” key, the model can be moved forward, backward, left and right.

ctrl-moving
Also, with “Ctrl” and “Shift” key, the model can be moved up, down, left and right.

ctrl-shift-moving

=== Japanese ========================================

「Ctrl」キーを押しながらモデルをドラッグすることで,前後左右にモデルを移動できます.

ctrl-moving
また,「Ctrl」+「Shift」キーを押しながらドラッグすることで上下左右に移動できます.

ctrl-shift-moving

CC-BY-NC Copyright 2009-2011 Nagoya Institute of Technology (MMDAgent Model “Mei”)
CC-BY Copyright 2009-2011 Nagoya Institute of Technology (MMDAgent Accessory “NIT Menu”, MMDAgent Motion “Wait of Mei”)