様々な状況に応じた対応をする音声応答装置

音声応答装置

WO 2013/190963

 

特許の概要

 音声応答装置として、入力された質問に対する回答を辞書から検索し、検索回答を音声で出力、また、使用者との対話の内容に基づいた質問に 対する回答えを生成する技術が知られています。入力された文字情報に対する応答を音声で行わせるもので、複数の異なる応答を異なる声色で出力させるものです。
 特許WO 2013/190963は、異なる答えを異なる声色で使用者にわかりやすくするために提案された特許です。

 

*当社では、本特許の実用化をご検討いただける企業様を募集しております。

 

 

特許のポイント

 

  • 複数の異なる応答をそれぞれ異なる声色で出力できる。
    → 使用者にとってより使い勝手をよくできる。
  • 音声で入力したものを文字情報に変換、文字情報に対する複数の異なる応答を端末装置に送信できる。
    → 音声応答装置の処理負荷を軽減できる。
  • 複数の文字情報に対し、文字情報に対する肯定的、否定的を含む複数の応答ができ、同時に異なった声色で応答できる。
    → 音声を聞く使用者に違和感を覚えさせにくくできる。
    → 使用者が直接言いにくいことを、代わりに伝えることができる。
  • 他の音声応答装置から取得できる。
  • 他の音声応答装置から要求された場合、要求を受けることができる。
  • 自身または他の音声応答装置で出された応答を文字情報として入力し、応答に対する反論を出してもよい。
    → 賛成、反対と両方の意見が聞け、使用者は最終判断ができる。

 

vrd.png

 

性格・嗜好・行動
 

  • 性格情報に応じて応答候補から出力させる応答を選択し、出力させることができる。
    → 性格に応じて異なる応答ができ、使用者にとって使い勝手がよい。
     
  • 複数の質問に対する回答に基づき生成し、性格情報を取得してもよい。
    → 企業等が採用試験に利用する適性検査の技術を利用してもよい。
     
  • 文字情報に含まれる文字列に基づいて性格情報を生成し、性格情報を取得してもよい。
    → 使用者が音声応答装置を利用する過程で性格情報を生成することができる。
     
  • 文字情報に含まれる文字列に基づき、関係者の嗜好の傾向情報を生成し、出力を選択できる。
    → 関係者の好みに応じた応答ができる。
     
  • 使用者の行動を学習し、会話の言葉足らずを補ってもよい。
    → 理由が伝わり、電話中に実施し、勝手に参加する様にしてもよい。



動作・癖

 

  • 使用者の動作を文字情報に変換できる。
    → 会話、文字の手書き、身ぶり手ぶり等も該当する。
     
  • 使用者の発音による音声を文字情報に変換し、発声時の癖を蓄積してもよい。
    → 文字情報の生成精度を向上できる。さらに、他の音声応答装置に転送もできる。
     
  • 使用者の行動、操作のうちいずれかを検出し、性格情報を生成してもよい。
    → 行動の改善補足、気分の抑制に利用ができる。




他装置

 

  • 応答候補をサーバ、インターネットから取得することもできる。
    → 任意の装置から取得できる。
     
  • 他の音声応答装置に記録されている情報を取得できる。
     
  • 文字情報が入力されていない場合、再生条件を検証、判定し合致する場合、メッセージを出力できる。
    → 文字情報が入力されない場合でも、音声を出力できる、自動車運転中の眠気抑制対策に利用ができる。
     
  • ニュース情報を、該ニュースに関するメッセージで使用者の回答を求める質問形式を出力できる。
    → いつも同じ会話ばかりを抑制できる。
     
  • 外部取得情報を付加できる。
    → 所定のメッセージと組み合わせた応答ができる。
     
  • 複数のメッセージを取得し、メッセージの再生頻度に応じ出力できる。
    → ランダム性を奏でたり、注意喚起や記憶の定着を促すことができる。
     
  • 応答やメッセージが得られない場合、使用者を特定する情報、回答が得られなかった旨を送信できる。
    → 回答が得られない場合でも、連絡先に通報できる。
     
  • 会話内容を記憶し、聞いた内容について同じ内容を得るための質問ができる(記憶確認処理)。
    → 記憶力の確認、記憶の定着ができる。



発音・アクセント・キーワード・感情

 

  • 使用者の発音、アクセントの正確度合いを図ることができる。
    → 外国語の練習に有効である。
     
  • 正確度合いが一定値以下の場合、最も近い単語を含む音声を出力できる。
    → 正確度の確認ができる。
     
  • 正確度合いが一定値以下の場合、同じ質問を出力できる。
    → 正確な回答が得られる。
     
  • 入力された文字情報によって、通信相手を特定し予め設定された通信先と接続することができる。
    → 受付業務や電話対応を補助できる。
    → 営業活動、来客を選別でき、業務に支障のある虜がある人に、自身が対応することなく排除できる。
     
  • キーワードで接続できる。
    → 電話の転送、受付への呼び出し等の業務を補助できる。
     
  • キーワードに基づき、相手が話す要件を認識、概要を使用者に伝えることができる。
    → 客先との取次業務の補助ができる。
     
  • 音声から感情を読み取り、通常、怒り、喜び、困惑、悲しみ高揚のうち少なくとも1つを含む感情を出力できる。
    → 使用者の感情に応じて応答できる。
     
  • 周囲の撮像画像に応じた応答を音声で出力できる。
    → 文字情報のみの構成から使い勝手が向上できる。



撮像画像

 

  • 撮像画像中から画像処理によって検索し、物体の位置を特定できる。
    → 撮像画像中の物体まで案内できる。
     
  • 使用者の口の形状を撮像することで、音声の不明確さを補正できる。
    → 音声を良好に推定できる。
     
  • 思いがけずに発する音声から、使用者の苛立ち、動揺を検出、抑制するためのメッセージを発生できる。
    → 使用者と周囲とのトラブルの発生を抑制できる。
     
  • 目的地までの案内を行う場合、経路情報を取得でき、音声で出力できる。
     
  • 使用者の視線を検知し、所定の位置に移動させる音声を発信できる。
    → 車両運転時の安全確認など確実に行うことができる。
     
  • 体の部位の位置や顔の表情を観察し、呼びかけ、要求音声をださせることができる。
    → 車両の運転時や身体検査等の際、利用できる。
     
  • 使用者が視聴する放送番組と同様の放送番組を取得することができる。
    → 放送番組を途切れないようにできる。
     
  • 歌詞を音声で出力できる。
     
  • 撮像画像中の文字の読み方がわからない場合、読み方を音声で出力できる。
     
  • 使用者の行動や周囲環境に応じて、メッセージを発生できる。
    → 危険な場所、立ち入り禁止の領域を報知できる。
     
  • 撮像画像で、健康状態を判定でき、健康状態に合わせメッセージを発生できる。
     
  • 健康状態が基準値を下回る場合、所定の連絡先に通報できる。
    → より早く異常を他者に通報できる。
     
  • 使用者以外の者からの問い合わせに対し、使用者に情報を出力できる。

 

知的財産ビジネス