音声合成コマンド設定機能

音声合成コマンド設定機能は、ドコモAIエージェントAPIの音声読み上げ機能をGUIエディタで設定できる機能です。

ポイント
ボットエディタでの音声合成コマンド設定機能は、発話毎に音声を設定できます。
エージェント全体の音声設定を行う場合は、AgentCarftのGUIエディタで設定可能です。
ご注意
音声合成コマンド設定機能につきましては、音声制御ライブラリまたはSpeak SDKを使用した場合のみ利用可能です。
※音声制御ライブラリ、Speak SDKについては、こちらをご覧ください。
音声制御ライブラリ、Speak SDKの利用を希望される場合は、ドコモAIエージェントAPIへのお申し込みをお願いいたします。
※ドコモAIエージェントAPIへのお申し込みは、法人の方のみが可能です。

設定手順

GUIエディタの使い方については、こちらをご覧ください。

音声読み上げを設定する

操作手順

  1. GUIエディタ編集画面を開き、音声読み上げを設定するシステム発話ボックスを配置します。
  2. 「音声合成」タブを選択し、「設定する」ボタンを押下してください。
  3. 「読み上げテキスト」には、音声読み上げを行う文言を入力します。
  4. ドコモAIエージェントAPIのドキュメントサイトを参考に、「話者モデルID」以降の設定を入力してください。
    ※「(リストはこちら)」のリンクからドキュメントサイトを表示できます。
    ご注意
    • 「読み上げテキスト」、「話者モデルID」、「口調モデルID」は入力必須です。
    • 「話者モデルID」には、speaker_idの値を入力してください。
    • 「口調モデルID」には、style_idの値を入力してください。
    • 入力内容が誤っている場合、音声読み上げが正常に行われません。

  5. 各項目設定後、「OK」ボタンを押下してください。
    システム発話に音声合成が設定されます。
  6. 「保存して公開」ボタンを押下してください。AIMLが生成されます。
    ポイント
    任意項目(声質、音量、話速、抑揚、声の高さ)に値を入力していない場合、AIMLには記載されずデフォルト値が設定されます。

ドコモAIエージェントAPIにアップロード

音声合成コマンドを設定したボットは、ドコモAIエージェントAPIの「メインエージェント(音声)」にアップロードすることで音声読み上げを実行できます。

アップロード方法については、こちらをご覧ください。

ご注意
音声合成を使用する場合は、「メインエージェント(音声)」にアップロードする必要があります。
上記のアップロード方法では、「メインエージェント(テキスト)」にアップロードしておりますのでご注意ください。
※「メインエージェント(音声)」については、こちらをご覧ください。