図面 (/)

技術 音声情報処理システム、音声情報処理方法及びプログラム

出願人 株式会社東芝
発明者 永江尚義福永幸弘
出願日 2004年2月25日 (17年3ヶ月経過) 出願番号 2004-049749
公開日 2005年9月8日 (15年9ヶ月経過) 公開番号 2005-241829
状態 特許登録済
技術分野 音声認識
主要キーワード 道しるべ 訂正位置 操作箇所 訂正箇所 生成単位 音声認識単語 訂正手順 執筆者
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2005年9月8日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (14)

課題

ユーザが単語登録をせずとも同じ訂正を繰り返さなくてすむようにした音声認識システムを提供すること。

解決手段

音声入力部101は音声により文字列を入力する。音声認識部201はこれを仮名漢字混じり文に変換する。この仮名漢字混じり文は表示画面に表示されるとともに、ユーザによる訂正を受け付ける。訂正結果生成部102により訂正結果情報が生成され、訂正単語生成部103により入力音声と訂正結果情報とからなる訂正単語が生成され、この訂正単語が訂正単語辞書106に登録される。音声認識部201は、認識語彙辞書107と訂正単語辞書106とを併用して認識処理する。

概要

背景

近年、音声日本語文章を入力することができる日本語ディクテーションステムが実用化され、様々な分野で実用システムとして利用され始めている。システムが音声認識可能な語彙数も数万〜十数万語程度と相当大量になってきた。しかし、現実には固有名詞や個々のユーザ特有の単語、日々作られる造語事前にすべてシステムの辞書登録しておくことは不可能である。一方、これらの単語が辞書に未登録の状態のままでは、ユーザがどんなに丁寧に発声しても、音声認識システムはその単語を正しく認識することができない。現在のシステムでは、これらの未登録単語は、ユーザ単語という形で音声認識システムが参照する認識語彙辞書追加登録することで対処している。

ユーザ単語の辞書登録は、通常、「表記」「読み(あるいは発音)」「品詞」をユーザが入力・指定して辞書登録ボタンを押すという作業をすることで実現される。一般的には1つの単語ごとに上記3つ組の情報を入力して1語ずつユーザ単語を辞書登録していくことになる。

なお、従来の音声認識技術については、例えば非特許文献12に詳しく開示されている。
情報処理学会誌」、2000年4月号(Vol.41 No.04)、pp.436−439、特集名:道しるべ題目:ここまできた音声認識技術、執筆者:河原達也(京都大学 情報学研究科

概要

ユーザが単語登録をせずとも同じ訂正を繰り返さなくてすむようにした音声認識システムを提供すること。音声入力部101は音声により文字列を入力する。音声認識部201はこれを仮名漢字混じり文に変換する。この仮名漢字混じり文は表示画面に表示されるとともに、ユーザによる訂正を受け付ける。訂正結果生成部102により訂正結果情報が生成され、訂正単語生成部103により入力音声と訂正結果情報とからなる訂正単語が生成され、この訂正単語が訂正単語辞書106に登録される。音声認識部201は、認識語彙辞書107と訂正単語辞書106とを併用して認識処理する。

目的

本発明は、上記事情を考慮してなされたもので、ユーザが単語登録をせずとも同じ訂正を繰り返さなくてすむようにした音声情報処理システム音声情報処理方法及びプログラムを提供することを目的とする。

効果

実績

技術文献被引用数
5件
牽制数
5件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

処理対象となる語彙の仮名による読みに関する情報と仮名漢字による表記に関する情報とを含む第1の辞書データを複数登録した認識語彙辞書と、音声を入力する手段と、入力した前記音声をもとにして仮名文字列を生成する手段と、前記認識語彙辞書に基づいて、生成された前記仮名文字列に対する仮名漢字文字列を生成する仮名漢字文字列生成手段と、生成された前記仮名漢字文字列を表示画面に表示する表示手段と、表示された前記仮名漢字文字列に対する訂正受け付ける受付手段と、前記訂正に係る仮名漢字文字列のもととなった仮名文字列と前記訂正の内容に関する情報とを含む第2の辞書データを生成する辞書データ生成手段と、生成された前記第2の辞書データを、前記認識語彙辞書とは異なる特定の辞書に登録する登録手段とを備え、前記仮名漢字文字列生成手段は、前記特定の辞書にも基づいて前記生成を行うことを特徴とする音声情報処理システム

請求項2

前記辞書データ生成手段は、前記訂正の内容に関する情報として、少なくとも前記訂正に係る訂正後の仮名漢字文字列を、前記第2の辞書データに含めるものであることを特徴とする請求項1に記載の音声情報処理システム。

請求項3

前記特定の辞書は、所望の語彙に係る辞書データをユーザ登録可能なユーザ辞書であることを特徴とする請求項2に記載の音声情報処理システム。

請求項4

前記辞書データ生成手段は、前記訂正の内容に関する情報として、前記訂正に係る操作の手順を示す情報を、前記第2の辞書データに含めるものであることを特徴とする請求項1に記載の音声情報処理システム。

請求項5

生成された前記仮名漢字文字列及び該仮名漢字文字列に対する訂正に基づき、前記仮名漢字文字列生成手段による仮名漢字文字列の生成にあたって、当該訂正に係る前記第2の辞書データを適用するか否かを判断するための基準となる基準データを生成する基準データ生成手段と、生成された前記基準データを前記第2の辞書データに対応付けて記憶する記憶手段とを更に備え、前記仮名漢字文字列生成手段は、前記基準データにも基づいて前記生成を行うことを特徴とする請求項1ないし4のいずれか1項に記載の音声情報処理システム。

請求項6

前記基準データは、前記訂正に係る仮名文字列に対して特定の位置関係を持つ箇所に、特定の仮名漢字文字列が存在する場合にのみ、前記第2の辞書データを適用することを示すものであることを特徴とする請求項5に記載の音声情報処理システム。

請求項7

処理対象となる語彙の仮名による読みに関する情報と仮名漢字による表記に関する情報とを含む第1の辞書データを複数登録した認識語彙辞書を備えた言語処理装置における音声情報処理方法であって、音声を入力する音声入力ステップと、入力した前記音声をもとにして仮名文字列を生成する仮名文字列生成ステップと、前記認識語彙辞書に基づいて、生成された前記仮名文字列に対する仮名漢字文字列を生成する仮名漢字文字列生成ステップと、生成された前記仮名漢字文字列を表示画面に表示する表示ステップと、表示された前記仮名漢字文字列に対する訂正を受け付ける受付ステップと、前記訂正に係る仮名漢字文字列のもととなった仮名文字列と前記訂正の内容に関する情報とを含む第2の辞書データを生成する辞書データ生成ステップと、生成された前記第2の辞書データを、前記認識語彙辞書とは異なる特定の辞書に登録する登録ステップとを有し、前記仮名漢字文字列生成ステップでは、前記特定の辞書にも基づいて前記生成を行うことを特徴とする音声情報処理方法。

請求項8

処理対象となる語彙の仮名による読みに関する情報と仮名漢字による表記に関する情報とを含む第1の辞書データを複数登録した認識語彙辞書を備えた音声情報処理システムとしてコンピュータを機能させるためのプログラムにおいて、前記プログラムは、音声を入力する音声入力ステップと、入力した前記音声をもとにして仮名文字列を生成する仮名文字列生成ステップと、前記認識語彙辞書に基づいて、生成された前記仮名文字列に対する仮名漢字文字列を生成する仮名漢字文字列生成ステップと、生成された前記仮名漢字文字列を表示画面に表示する表示ステップと、表示された前記仮名漢字文字列に対する訂正を受け付ける受付ステップと、前記訂正に係る仮名漢字文字列のもととなった仮名文字列と前記訂正の内容に関する情報とを含む第2の辞書データを生成する辞書データ生成ステップと、生成された前記第2の辞書データを、前記認識語彙辞書とは異なる特定の辞書に登録する登録ステップとをコンピュータに実行させるとともに、前記仮名漢字文字列生成ステップでは、前記特定の辞書にも基づいて前記生成を行わせるものであることを特徴とするプログラム。

技術分野

0001

本発明は、音声文章の入力を行うことを目的とした音声情報処理システム音声情報処理方法及びプログラムに関する。

背景技術

0002

近年、音声で日本語の文章を入力することができる日本語ディクテーションステムが実用化され、様々な分野で実用システムとして利用され始めている。システムが音声認識可能な語彙数も数万〜十数万語程度と相当大量になってきた。しかし、現実には固有名詞や個々のユーザ特有の単語、日々作られる造語事前にすべてシステムの辞書登録しておくことは不可能である。一方、これらの単語が辞書に未登録の状態のままでは、ユーザがどんなに丁寧に発声しても、音声認識システムはその単語を正しく認識することができない。現在のシステムでは、これらの未登録単語は、ユーザ単語という形で音声認識システムが参照する認識語彙辞書追加登録することで対処している。

0003

ユーザ単語の辞書登録は、通常、「表記」「読み(あるいは発音)」「品詞」をユーザが入力・指定して辞書登録ボタンを押すという作業をすることで実現される。一般的には1つの単語ごとに上記3つ組の情報を入力して1語ずつユーザ単語を辞書登録していくことになる。

0004

なお、従来の音声認識技術については、例えば非特許文献12に詳しく開示されている。
情報処理学会誌」、2000年4月号(Vol.41 No.04)、pp.436−439、特集名:道しるべ題目:ここまできた音声認識技術、執筆者:河原達也(京都大学 情報学研究科

発明が解決しようとする課題

0005

年々音声認識システムの性能は向上してきているが認識率は100%ではない。そのため、システムが誤認識したときには、誤認識した箇所をユーザが再度発声し直したり、キーボード等の入力作業によって修正する必要がある。誤認識の主たる原因はユーザが入力した単語が認識語彙辞書に登録されていないためである。したがって、誤認識した単語をユーザ単語として辞書登録すればそれ以降は誤認識しないようにすることができる。しかし、文章を考えながらテキスト入力している最中に誤認識が発生する度にその入力作業や文章の推敲を中断してユーザ単語登録作業を実施することは非常に煩わしい。その結果、多くのユーザはユーザ単語登録作業を実施せずにキーボード等を使用して誤認識の訂正作業だけをその場で実施しているのが現状である。ただ、これではユーザが入力したかった単語は未登録のままなので、それ以降の文章入力時に同じ単語をユーザが発声すると音声認識システムはまた同じ誤認識をし、ユーザが同様の訂正作業を繰り返し行わなければならない。

0006

本発明は、上記事情を考慮してなされたもので、ユーザが単語登録をせずとも同じ訂正を繰り返さなくてすむようにした音声情報処理システム、音声情報処理方法及びプログラムを提供することを目的とする。

課題を解決するための手段

0007

本発明に係る音声情報処理システムは、認識対象となる語彙の仮名による読みに関する情報と仮名漢字による表記に関する情報とを含む第1の辞書データを複数登録した認識語彙辞書と、音声を入力する手段と、入力した前記音声をもとにして仮名文字列を生成する手段と、前記認識語彙辞書に基づいて、生成された前記仮名文字列に対する仮名漢字文字列を生成する仮名漢字文字列生成手段と、生成された前記仮名漢字文字列を表示画面に表示する表示手段と、表示された前記仮名漢字文字列に対する訂正を受け付ける受付手段と、前記訂正に係る仮名漢字文字列のもととなった仮名文字列と前記訂正の内容に関する情報とを含む第2の辞書データを生成する辞書データ生成手段と、生成された前記第2の辞書データを、前記認識語彙辞書とは異なる特定の辞書に登録する登録手段とを備え、前記仮名漢字文字列生成手段は、前記特定の辞書にも基づいて前記生成を行うことを特徴とする。

0008

本発明では、入力音声認識処理して生成された仮名漢字文字列に対してユーザが実施した訂正操作監視し、当該仮名文字列と当該訂正に関する情報とを含む辞書データとして特定の辞書へ辞書登録する。これによりユーザが単語登録作業をしなくても、次回以降の言語処理時に通常の認識語彙辞書に加えて当該辞書データが併用できるので、次回以降同じ仮名漢字文字列を入力した際にシステムが正しく認識できるようになるため、ユーザは同様の訂正操作を繰り返し実施しなくてすむようになる。

0009

なお、装置に係る本発明は方法に係る発明としても成立し、方法に係る本発明は装置に係る発明としても成立する。
また、装置または方法に係る本発明は、コンピュータに当該発明に相当する手段を実行させるための(あるいはコンピュータを当該発明に相当する手段として機能させるための、あるいはコンピュータに当該発明に相当する機能を実現させるための)プログラムとしても成立し、該プログラムを記録したコンピュータ読み取り可能な記録媒体としても成立する。

発明の効果

0010

本発明によれば、ユーザが単語登録をせずとも同じ訂正を繰り返さなくてすむようになる。

発明を実施するための最良の形態

0011

以下、図面を参照しながら本発明の実施形態について説明する。

0012

(第1の実施形態)
図1に、本発明の第1の実施形態に係る音声認識システム(自然言語処理システム)の構成例を示す。

0013

図1に示されるように、本音声認識システムは、音声入力部101、訂正結果生成部102、訂正単語生成部103、訂正単語辞書登録部104、訂正単語辞書併用型音声認識部105、訂正単語辞書106、認識語彙辞書107を備えている。

0014

認識語彙辞書107は、「表記」「読み」「品詞」などの情報の組からなる単語情報を複数登録したものである。

0015

音声入力部101は、ユーザ(100)からの入力音声データ(200)を受け付ける部分である。

0016

訂正単語辞書併用型音声認識部105は、後述するように、音声認識結果(201)を生成する。ここでは、音声認識結果は、仮名漢字混じり文である。

0017

生成された仮名漢字混じり文は、所定の表示装置(図示せず)の表示画面に表示される。また、表示された仮名漢字混じり文に対しては、所定の入力装置(図示せず)を介して、ユーザからの訂正操作を受け付けるとともに、訂正結果は、所定の表示装置の表示画面に表示される。

0018

訂正結果生成部102は、訂正単語辞書併用型音声認識部105が出力した音声認識結果(201)と、音声認識結果に対してユーザが実施した訂正操作202とから、訂正範囲を特定し、音声認識結果中における訂正位置と訂正結果文字列とで構成される訂正結果情報(203)を生成する。ここで、ユーザが実施できる訂正操作には、音声による再入力だけでなく、キーボード、マウスペン等の文字情報を入力するすべての入力デバイスを使用することができる。また、訂正操作の際にこれらのデバイス複数組み合わせても構わない。

0019

訂正単語生成部103は、音声入力部101が受け取った入力音声(200)の発音列と訂正結果生成部102が生成した訂正結果情報(203)とを組にした訂正単語(204)を生成する。なお、ここでは、生成単位を単語と呼んでいるが、登録する文字列は短文でも構わない。また、登録文字列に関して、制限は無い。

0020

訂正単語辞書登録部104は、訂正単語生成部103が生成した訂正単語(204)を訂正単語辞書106に登録する。

0021

訂正単語辞書併用型音声認識部105は、訂正単語辞書106と認識語彙辞書107とを併用して音声認識する(入力音声200を音声認識して仮名文字列を生成し、該仮名文字列をもとに仮名漢字混じり文字列201を生成する)。なお、訂正単語の読み(入力音声の発音列)が認識語彙辞書の単語と重複するものについては、例えば、訂正単語を優先する、両方の単語を提示してユーザに選択させるなど、既存の方法を採用して構わない。

0022

図2に、本実施形態の音声認識システムにおける認識処理及び訂正処理に係る概略的な手順の一例を示す。

0023

ユーザからの入力を受け付け(ステップS1)、これが認識対象の入力ならば(ステップS2)、認識処理を行い(ステップS3)、認識結果を出力する(ステップS4)。他方、入力が訂正のためのものであるならば(ステップS2)、訂正情報(本実施形態では、訂正結果情報)を生成し(ステップS5)、訂正情報に基づいて辞書登録(本実施形態では、訂正単語の訂正単語辞書への登録)を行う(ステップS6)。

0024

従来の音声認識システムでは、未登録単語は、ユーザが認識語彙辞書に追加登録をしない限りは、その後も常に誤認識し続ける。しかし、本実施形態の音声認識システムでは、誤認識した際にユーザが訂正操作を行い、その操作結果が訂正単語として訂正単語辞書に自動登録されると、従来の認識語彙辞書だけを使用したときには、誤認識し続けた箇所でも、ユーザが以前実施した訂正操作が適用されて、正しく認識されるようになる。

0025

以下では、図3を参照しながら具体例を用いて本実施形態につき説明する。

0026

図3は、訂正結果生成部102、訂正単語生成部103、訂正単語辞書登録部104の動作とその過程で作成される訂正結果情報(203)、訂正単語(204)の具体例を示したものである。

0027

本具体例では、「粉骨砕身努力します。」という文章を入力するケースで考える。このとき、ユーザは「ふんこつさいしんどりょくします」と発声する。ここで、「砕身」という単語が認識語彙辞書107に登録されていなかったとする。

0028

なお、図3において(a)は「ふんこつさいしんどりょくします」と発声する1回目のケース(訂正・登録の前のケース)であり、(b)は「ふんこつさいしんどりょくします」と発声する2回目のケース(訂正・登録の後のケース)である。

0029

このとき、本音声認識システムは、次のような誤認識をすることになる(S11)。
入力音声:「ふんこつさいしんどりょくします」
認識結果:「粉骨最新努力します。」
この誤認識を訂正するために、ユーザは次のような訂正操作(A)を実施する。
訂正操作(A):
(i)カーソルを「最新」の右に移動
(ii)直前2文字「最新」を削除
(iii)「くだく しんたい」と発声
(iv)認識結果の「砕く身体」のうち「く」「体」を削除
(v)カーソルを文末に移動して次の発声の準備をする
なお、本実施形態では、訂正操作時に文字列を入力するために音声入力を使用しているが、これはキーボード等による文字入力であっても構わない。

0030

上記の操作による訂正結果は、次のようになる(S12)。
訂正結果:「粉骨砕身努力します。」
ユーザのこの訂正操作結果から訂正結果生成部102は、「最新」という認識結果の位置の文字列を「砕身」に訂正したことを検出し、訂正結果情報(203)として「訂正位置:認識結果中の『最新』、訂正結果文字列:砕身」を出力する。

0031

そして、訂正単語生成部103は、入力音声と訂正結果生成部102が生成した訂正結果情報(203)とから、「入力音声の訂正位置に該当する発声列:さいしん」と「訂正結果文字列:砕身」とを対応付けて、「表記:砕身、読み:さいしん」という訂正単語204を生成する。

0032

訂正単語辞書登録部104は、この訂正単語を訂正単語辞書106に登録する(S13)。

0033

以降、訂正単語辞書併用型音声認識部105は、この訂正単語が登録された訂正単語辞書106と認識語彙辞書107とを併用して音声認識する。この結果、ユーザが次回「ふんこつさいしん」と入力したときに、「さいしん」の入力部分で訂正単語辞書が参照されることにより、「砕身」という表記が表示される(S14)。

0034

従来の方法では、ユーザが「砕身:さいしん」という単語を辞書登録しない限り、何度でも「粉骨最新」と誤認識を繰り返すが、本実施形態によれば、1回だけユーザが訂正作業を実施すると、それ以降は同様の誤認識しないようになる。なお、訂正作業は本音声認識システムが誤認識したときにユーザが自然に行っている作業であるため、ユーザに対して新たな手間や負荷を与えることはない。

0035

(第2の実施形態)
図4に、本発明の第2の実施形態に係る音声認識システム(自然言語処理システム)の構成例を示す。

0036

図4に示されるように、本音声認識システムは、音声入力部101、認識語彙辞書107、訂正手順生成部108、訂正マクロ生成部109、訂正マクロ辞書登録部110、訂正マクロ辞書併用型音声認識部111、訂正マクロ辞書112を備えている。なお、図1と同様の部分には同じ符号を付してある。

0037

本実施形態の音声認識システムにおける認識処理及び訂正処理に係る概略的な手順の一例は図2と同様である。

0038

以下では、第1の実施形態と相違する点を中心に説明する。

0039

訂正マクロ辞書併用型音声認識部111は、後述するように、音声認識結果(201)を生成する。ここでは、音声認識結果は、仮名漢字混じり文である。

0040

生成された仮名漢字混じり文は、所定の表示装置(図示せず)の表示画面に表示される。また、表示された仮名漢字混じり文に対しては、所定の入力装置(図示せず)を介して、ユーザからの訂正操作を受け付けるとともに、訂正結果は、所定の表示装置の表示画面に表示される。

0041

訂正手順生成部108は、訂正マクロ辞書併用型音声認識部111が出力した音声認識結果(201)と、音声認識結果に対してユーザが実施した訂正操作(202)とから、訂正範囲を特定し、訂正操作手順を表す訂正手順(206)を生成する。

0042

訂正マクロ生成部109は、音声入力部101が受け取った入力音声(200)の発音列と訂正手順生成部108が生成した訂正手順(206)とを組にした訂正マクロ(207)を生成する。

0043

訂正マクロ辞書登録部110は、訂正マクロ生成部109が生成した訂正マクロ(207)を訂正マクロ辞書112に登録する。

0044

訂正マクロ辞書併用型音声認識部111は、訂正マクロ辞書112と認識語彙辞書107とを併用して音声認識する(入力音声200を音声認識して仮名文字列を生成し、該仮名文字列をもとに仮名漢字混じり文字列201を生成する)。なお、訂正マクロの読み(入力音声の発音列)が認識語彙辞書の単語と重複するものについては、例えば、訂正マクロを優先する、訂正マクロに係る単語と認識語彙辞書に係る単語との両方を提示してユーザに選択させるなど、既存の方法を採用して構わない。

0045

以下では、図5を参照しながら具体例を用いて本実施形態につき説明する。

0046

図5は、訂正手順生成部108、訂正マクロ生成部109、訂正マクロ辞書登録部110の動作とその過程で作成される訂正手順(206)、訂正マクロ(207)の具体例を示したものである。

0047

本具体例では、「粉骨砕身努力します。」という文章を入力するケースで考える。このとき、ユーザは「ふんこつさいしんどりょくします」と発声する。ここで、「砕身」という単語が認識語彙辞書に登録されていなかったとする。

0048

なお、図5において(a)は「ふんこつさいしんどりょくします」と発声する1回目のケース(訂正・登録の前のケース)であり、(b)は「ふんこつさいしんどりょくします」と発声する2回目のケース(訂正・登録の後のケース)である。

0049

このとき、本音声認識システムは、次のような誤認識をすることになる(S21)。
入力音声:「ふんこつさいしんどりょくします」
認識結果:「粉骨最新努力します。」
この誤認識を訂正するために、ユーザは訂正操作(A)を実施する(第1の実施形態参照)。

0050

この操作による訂正結果は、次のようになる(S22)。
訂正結果:「粉骨砕身努力します。」
ユーザのこの訂正操作結果から、訂正手順生成部108は、「最新」という認識結果の位置の文字列に対して訂正操作(A)を実施したことを検出し、訂正手順206として「訂正位置:認識結果中の『最新』、訂正操作:「最新」を削除→「くだくしんたい」と発声→「く」「体」を削除」を出力する。

0051

そして、訂正マクロ生成部109は、入力音声と訂正手順生成部108が生成した訂正手順206とから、「入力音声の訂正位置に該当する発声列:さいしん」と「訂正操作:「最新」を削除→「くだく しんたい」と発声→「く」「体」を削除」とを対応付けて、「操作:「最新」を削除→「くだく しんたい」と発声→「く」「体」を削除、読み:さいしん」という訂正マクロ207を生成する。

0052

訂正マクロ辞書登録部110は、この訂正マクロを訂正マクロ辞書112に登録する(S23)。

0053

以降、訂正マクロ辞書併用型音声認識部111は、この訂正マクロが登録された訂正マクロ辞書112と認識語彙辞書107とを併用して音声認識する。この結果、ユーザが次回「ふんこつさいしん」と入力したときに、「さいしん」の入力部分で訂正マクロ辞書が参照されることにより、『「最新」を削除→「くだく しんたい」と発声→「く」「体」を削除』という訂正操作が自動実行され、最終的に「砕身」という表記が表示される。

0054

なお、訂正マクロに割り当てる「読み」は、訂正前の入力音声の訂正箇所の発声列でなくてもよい。例えば、訂正操作時に入力した発声列を「読み」として割り当ててもよい。上例で説明すると、「くだくしんたい」という訂正操作時の発声列を割り当てることを考える。このとき、「ふんこつさいしんどりょくします」と入力すると、「粉骨最新努力します。」と誤認識することになるが、ここで、「くだく しんたい」と発声すると、訂正マクロが実行され、直前の認識結果中の「最新」という文字列を「砕身」に置き換える。従来であればカーソル移動や余分な文字列の削除が必要であったが、本実施形態によりユーザのこれらの手間を排除することが可能になる。

0055

また、上記の例では訂正マクロと通常の音声認識単語とを区別しないで扱っているが、訂正マクロの前あるいは後ろ予約語(例えば「訂正マクロ」という語)を発声する規則にしてもよい。例えば、上記の例で説明すると「訂正マクロ くだくしんたい」と発声したときのみ、直前の認識結果中の「最新」という文字列を「砕身」に置き換える。これにより、通常の音声入力時に誤って訂正マクロが実行されるのを避けることができる。

0056

(第3の実施形態)
図6に、本発明の第3の実施形態に係る音声認識システム(自然言語処理システム)の構成例を示す。

0057

図6に示されるように、本音声認識システムは、音声入力部101、訂正結果生成部102、訂正単語生成部103、認識語彙辞書107、ユーザ単語辞書登録自動起動部113、ユーザ単語辞書併用型音声認識部114、ユーザ辞書115を備えている。なお、図1と同様の部分には同じ符号を付してある。

0058

本実施形態の音声認識システムにおける認識処理及び訂正処理に係る概略的な手順の一例は図2と同様である。

0059

以下では、第1の実施形態と相違する点を中心に説明する。

0060

ユーザ辞書115は、認識語彙辞書107と同様、「表記」「読み」「品詞」などの情報の組からなる単語情報を複数登録したものである。従来と同様、認識語彙辞書107は、一般的な辞書であるのに対して、ユーザ辞書115は、当該ユーザがユーザ単語(108)を適宜辞書登録するものである。

0061

ユーザ単語辞書併用型音声認識部114は、後述するように、音声認識結果(201)を生成する。ここでは、音声認識結果は、仮名漢字混じり文である。

0062

生成された仮名漢字混じり文は、所定の表示装置(図示せず)の表示画面に表示される。また、表示された仮名漢字混じり文に対しては、所定の入力装置(図示せず)を介して、ユーザからの訂正操作を受け付けるとともに、訂正結果は、所定の表示装置の表示画面に表示される。

0063

ユーザ単語辞書登録自動起動部113は、訂正単語成部103が生成した訂正単語(204)を、ユーザ単語(108)としてユーザ辞書115に登録するための作業を実行する。例えば、ユーザ単語登録画面を表示し、登録に必要な「表記」「読み」「品詞」の情報を訂正単語(204)から生成して代入しておく。なお、このユーザ単語に代入する「品詞」については、例えば、訂正対象となったもとの単語の品詞と同じ品詞としておく方法や、画一的に「名詞」としておく方法など、種々の方法がある。ここで、ユーザは登録内容を確認できる。登録内容に問題が無ければ登録ボタンを押すだけでよい。もし、修正が必要なら適宜修正を行ってからユーザ単語を辞書に登録する。

0064

ユーザ単語辞書併用型音声認識部114は、ユーザ辞書115と認識語彙辞書107とを併用して音声認識する(入力音声200を音声認識して仮名文字列を生成し、該仮名文字列をもとに仮名漢字混じり文字列201を生成する)。なお、ユーザ単語の読み(入力音声の発音列)が認識語彙辞書の単語と重複するものについては、例えば、ユーザ単語を優先する、両方の単語を提示してユーザに選択させるなど、既存の方法を採用して構わない。

0065

以下では、図7を参照しながら具体例を用いて本実施形態につき説明する。

0066

図7は、訂正結果生成部102、訂正単語生成部103、ユーザ単語辞書登録自動起動部113の動作とその過程で作成される訂正結果情報(203)、訂正単語(204)の具体例を示したものである。

0067

本具体例では、「粉骨砕身努力します。」という文章を入力するケースで考える。このとき、ユーザは「ふんこつさいしんどりょくします」と発声する。ここで、「砕身」という単語が認識語彙辞書に登録されていなかったとする。

0068

なお、図7において(a)は「ふんこつさいしんどりょくします」と発声する1回目のケース(訂正・登録の前のケース)であり、(b)は「ふんこつさいしんどりょくします」と発声する2回目のケース(訂正・登録の後のケース)である。

0069

このとき、本音声認識システムは、次のような誤認識をすることになる(S31)。
入力音声:「ふんこつさいしんどりょくします」
認識結果:「粉骨最新努力します。」
この誤認識を訂正するために、ユーザは訂正操作(A)を実施する(第1の実施形態参照)。

0070

この操作による訂正結果は、次のようになる(S32)。
訂正結果:「粉骨砕身努力します。」
ユーザのこの訂正操作結果から、訂正結果生成部102は、「最新」という認識結果の位置の文字列を「砕身」に訂正したことを検出し、訂正結果情報203として「訂正位置:認識結果中の『最新』、訂正結果文字列:砕身」を出力する。

0071

そして、訂正単語生成部103は、入力音声と訂正結果生成部102が生成した訂正結果情報203から、「入力音声の訂正位置に該当する発声列:さいしん」と「訂正結果文字列:砕身」とを対応付けて、「表記:砕身、読み:さいしん」という訂正単語204を生成する。

0072

ユーザ単語辞書登録自動起動部113は、この訂正単語をユーザ単語208としてユーザ単語辞書115に登録する(S34)。ここで、ユーザ単語辞書に登録する前にユーザに確認画面を出し、登録内容を修正できるようにすることも可能である(S33)。

0073

ユーザ単語辞書併用型音声認識部114は、このユーザ単語が登録されたユーザ単語辞書106と認識語彙辞書107とを併用して音声認識する。この結果、ユーザが次回「ふんこつさいしん」と入力したときに「さいしん」の入力部分でユーザ単語辞書が参照されることにより、「砕身」という表記が表示される。

0074

従来の方法では、ユーザが「砕身:さいしん」というユーザ単語を辞書登録するためには、「表記:砕身」「読み:さいしん」「品詞:名詞」をすべて指定しなければならなかった。本実施形態によれば、ユーザの訂正操作の内容からユーザ単語登録に必要な情報を自動的に抽出することができるため、簡便にユーザ単語を登録することが可能になる。これにより、ユーザは「表記」「読み」「品詞」をすべて1から入力し直す手間から開放され、通常のユーザ単語登録を実施する場合と比較して、ユーザ単語登録の煩わしさが大幅に低減される。

0075

(第4の実施形態)
図8に、本発明の第4の実施形態に係る音声認識システム(自然言語処理システム)の構成例を示す。

0076

図8に示されるように、本音声認識システムは、音声入力部101、訂正結果生成部102、訂正単語生成部103、訂正単語辞書登録部104、訂正単語辞書106、認識語彙辞書107、前後関係抽出部120、訂正単語前後関係表登録部121、訂正単語辞書及び前後関係表併用型音声認識部122、訂正単語前後関係表123を備えている。なお、図1と同様の部分には同じ符号を付してある。

0077

本実施形態の音声認識システムにおける認識処理及び訂正処理に係る概略的な手順の一例は図2と同様である。

0078

以下では、第1の実施形態と相違する点を中心に説明する。

0079

訂正単語辞書及び前後関係表併用型音声認識部122は、後述するように、音声認識結果(201)を生成する。ここでは、音声認識結果は、仮名漢字混じり文である。

0080

生成された仮名漢字混じり文は、所定の表示装置(図示せず)の表示画面に表示される。また、表示された仮名漢字混じり文に対しては、所定の入力装置(図示せず)を介して、ユーザからの訂正操作を受け付けるとともに、訂正結果は、所定の表示装置の表示画面に表示される。

0081

前後関係抽出部120は、訂正単語辞書及び前後関係表併用型音声認識部122が出力した音声認識結果(201)と、音声認識結果に対してユーザが実施した訂正操作(202)とから、訂正範囲を特定し、訂正箇所の前後関係の情報(220)を抽出する。

0082

訂正単語前後関係表登録部121は、訂正単語辞書登録部104が登録した訂正単語204と前後関係抽出部120が生成した訂正箇所の前後関係の情報(220)とを組にして訂正単語の前後関係の情報(221)を生成し、訂正単語前後関係表123に登録する。

0083

訂正単語辞書及び前後関係表併用型音声認識部122は、訂正単語辞書106及び訂正単語前後関係表123と認識語彙辞書107とを併用して音声認識する(入力音声200を音声認識して仮名文字列を生成し、該仮名文字列をもとに仮名漢字混じり文字列201を生成する)。

0084

第1の実施形態では、訂正単語の読みが認識語彙辞書の単語と重複する場合がある。例えば、この場合に常に訂正単語を優先させる方法を採用すると、一例として「最新の部署では粉骨砕身努力します。」という文章を入力するために、「さいしんのぶしょではふんこつさいしんどりょくします」と発声したとき、「さいしん」のところで必ず訂正単語が採用され、「砕身の部署では粉骨砕身努力します。」と誤認識してしまう、というようなケースが生じ得る。

0085

そこで、本実施形態では、訂正単語の辞書登録時に訂正単語の前後関係を抽出し、訂正単語前後関係表として管理する。そして、入力音声が訂正単語と認識語彙との双方の読みと一致したときは、訂正単語の前後の単語と訂正単語前後関係表とを比較して訂正単語、認識語彙のいずれか適切な方を選択する。

0086

以下では、図9を参照しながら具体例を用いて本実施形態につき説明する。

0087

図9は、前後関係抽出部120、訂正単語前後関係表登録部121、訂正単語及び前後関係表併用型音声認識部122の動作とその過程で作成される訂正箇所の前後関係の情報(220)、訂正単語の前後関係の情報(221)の具体例を示したものである。

0088

本具体例では、「粉骨砕身努力します。」という文章を入力するケースで考える。このとき、ユーザは「ふんこつさいしんどりょくします」と発声する。ここで、「砕身」という単語が認識語彙辞書に登録されていなかったとする。

0089

なお、図9において(a)は「ふんこつさいしんどりょくします」と発声する1回目のケース(訂正・登録の前のケース)であり、(b)は「ふんこつさいしんどりょくします」と発声する2回目のケース(訂正・登録の後のケース)である。

0090

このとき、本音声認識システムは、次のような誤認識をすることになる(S41)。
入力音声:「ふんこつさいしんどりょくします」
認識結果:「粉骨最新努力します。」
この誤認識を訂正するために、ユーザは訂正操作(A)を実施する(第1の実施形態参照)。

0091

この操作による訂正結果は、次のようになる(S42)。
訂正結果:「粉骨砕身努力します。」
ユーザのこの訂正操作結果から、訂正結果生成部102は「最新」という認識結果の位置の文字列を「砕身」に訂正したことを検出し、訂正結果情報203として「訂正位置:認識結果中の『最新』、訂正結果文字列:砕身」を出力する。

0092

これと同時に、ユーザの訂正操作202と音声認識結果201から、前後関係抽出部120は、「最新」という認識結果の位置の文字列に対して訂正操作(A)を実施したことを検出し、その操作箇所の前後の単語として「粉骨」「努力」を検出し、訂正箇所の前後関係220として「訂正位置:前=『粉骨』、後=『努力』」を出力する。

0093

そして、訂正単語生成部103は、入力音声と訂正結果生成部102が生成した訂正結果情報203から、「入力音声の訂正位置に該当する発声列:さいしん」と「訂正結果文字列:砕身」とを対応付けて、「表記:砕身、読み:さいしん」という訂正単語204を生成する。訂正単語辞書登録部104は、この訂正単語を訂正単語辞書106に登録する(S43)。

0094

一方、訂正単語前後関係表登録部121は、訂正単語辞書登録部104が登録した訂正単語204の「表記:砕身、読み:さいしん」と訂正箇所の前後関係220の「訂正位置:前=『粉骨』、後=『努力』」から、「表記:砕身、読み:さいしん」:前=『粉骨』、後=『努力』という訂正単語前後関係221を生成し、訂正単語前後関係表123に登録する(S44)。

0095

訂正単語辞書及び前後関係表併用型音声認識部122は、この訂正単語辞書106と訂正単語前後関係表123と認識語彙辞書107とを併用して音声認識する。この結果、ユーザが次回「さいしんのぶしょではふんこつさいしんどりょくします」と入力したとき、1番目の「さいしん」の部分では、前後関係が訂正単語登録時と異なるために、訂正単語辞書ではなく従来通り認識語彙辞書が参照されることになり、「最新」という表記が表示される(S45,S46)。一方、2番目の「さいしん」の部分では、前後の単語が訂正単語前後関係表の単語と一致しているため、訂正単語辞書の方が参照されることになり、「砕身」という表記が表示される(S45,S46)。この結果、「最新の部署では粉骨砕身努力します。」と正しく認識される(S47)。

0096

このように、訂正単語辞書を使用する場合に登録時の訂正単語の前後関係を考慮することにより、適切な箇所にだけ訂正単語を当てはめることができるようになる。

0097

なお、本実施形態では、前後関係として訂正単語の前、後ろを使用したが、どちらか一方だけを使用するようにしても構わない。また、本実施形態では、前後関係として使用する範囲が前、後ろともに1単語であったが、これも2単語以上のより長い単語列を使用しても構わない。また、本実施形態では、前後関係として保持する対象が単語になっているが、単語の代わりに品詞等の単語に付随した情報を使用しても構わない。また、前後関係表との一致度を判定する方法として、前後関係表中に訂正単語の前後の単語が存在するか否かだけでなく、確率値を使用する判定法でも構わない。

0098

(第5の実施形態)
本発明の第5の実施形態は、第4の実施形態の前後関係の情報を考慮する構成を、第2の実施形態に適用したものである。第4の実施形態で示した、前後関係の情報を考慮する構成に関する効果やバリエーションは、本実施形態にも妥当する。

0099

図10に、本発明の第5の実施形態に係る音声認識システム(自然言語処理システム)の構成例を示す。

0100

図10に示されるように、本音声認識システムは、音声入力部101、認識語彙辞書107、訂正手順生成部108、訂正マクロ生成部109、訂正マクロ辞書登録部110、訂正マクロ辞書112、前後関係抽出部120、訂正マクロ前後関係表登録部124、訂正マクロ辞書及び前後関係表併用型音声認識部125、訂正マクロ前後関係表126を備えている。なお、図4と同様の部分には同じ符号を付してある。

0101

本実施形態の音声認識システムにおける認識処理及び訂正処理に係る概略的な手順の一例は図2と同様である。

0102

以下では、第2の実施形態と相違する点を中心に説明する。

0103

訂正マクロ辞書及び前後関係表併用型音声認識部125は、後述するように、音声認識結果(201)を生成する。ここでは、音声認識結果は、仮名漢字混じり文である。

0104

生成された仮名漢字混じり文は、所定の表示装置(図示せず)の表示画面に表示される。また、表示された仮名漢字混じり文に対しては、所定の入力装置(図示せず)を介して、ユーザからの訂正操作を受け付けるとともに、訂正結果は、所定の表示装置の表示画面に表示される。

0105

前後関係抽出部120は、訂正マクロ辞書及び前後関係表併用型音声認識部125が出力した音声認識結果(201)と、音声認識結果に対してユーザが実施した訂正操作(202)とから、訂正範囲を特定し、訂正箇所の前後関係の情報(220)を抽出する。

0106

訂正マクロ前後関係表登録部124は、訂正マクロ辞書登録部110が登録した訂正マクロ(207)と前後関係抽出部120が生成した訂正箇所の前後関係の情報(220)とを組にして訂正マクロの前後関係の情報(222)を生成し、訂正マクロ前後関係表126に登録する。

0107

訂正マクロ辞書及び前後関係表併用型音声認識部125は、訂正マクロ辞書112及び訂正マクロ前後関係表126と認識語彙辞書107とを併用して音声認識する(入力音声200を音声認識して仮名文字列を生成し、該仮名文字列をもとに仮名漢字混じり文字列201を生成する)。

0108

以下では、図11を参照しながら具体例を用いて本実施形態につき説明する。

0109

図11は、前後関係抽出部120、訂正マクロ前後関係表登録部124、訂正マクロ及び前後関係表併用型音声認識部125の動作とその過程で作成される訂正箇所の前後関係の情報(220)、訂正マクロの前後関係の情報(222)の具体例を示したものである。

0110

本具体例では、「粉骨砕身努力します。」という文章を入力するケースで考える。このとき、ユーザは「ふんこつさいしんどりょくします」と発声する。ここで、「砕身」という単語が認識語彙辞書に登録されていなかったとする。

0111

なお、図11において(a)は「ふんこつさいしんどりょくします」と発声する1回目のケース(訂正・登録の前のケース)であり、(b)は「ふんこつさいしんどりょくします」と発声する2回目のケース(訂正・登録の後のケース)である。

0112

このとき、本音声認識システムは、次のような誤認識をすることになる(S51)。
入力音声:「ふんこつさいしんどりょくします」
認識結果:「粉骨最新努力します。」
この誤認識を訂正するために、ユーザは訂正操作(A)を実施する(第1の実施形態参照)。

0113

この操作による訂正結果は次のようになる(S52)。
訂正結果:「粉骨砕身努力します。」
ユーザのこの訂正操作結果から、訂正手順生成部108は「最新」という認識結果の位置の文字列に対して訂正操作(A)を実施したことを検出し、訂正手順206として「訂正位置:認識結果中の『最新』、訂正操作:「最新」を削除→「くだくしんたい」と発声→「く」「体」を削除」を出力する。

0114

これと同時に、ユーザの訂正操作202と音声認識結果201とから前後関係抽出部120は、「最新」という認識結果の位置の文字列に対して訂正操作(A)を実施したことを検出し、その操作箇所の前後の単語として「粉骨」「努力」を検出し、訂正箇所の前後関係220として「訂正位置:前=『粉骨』、後=『努力』」を出力する。

0115

そして、訂正マクロ生成部109は、入力音声と訂正手順生成部108が生成した訂正手順206から、「入力音声の訂正位置に該当する発声列:さいしん」と「訂正操作:「最新」を削除→「くだく しんたい」と発声→「く」「体」を削除」とを対応付けて、「操作:「最新」を削除→「くだく しんたい」と発声→「く」「体」を削除、読み:さいしん」という訂正マクロ207を生成する。訂正マクロ辞書登録部110は、この訂正マクロを訂正マクロ辞書112に登録する(S53)。

0116

一方、訂正マクロ前後関係表登録部124は、訂正マクロ辞書登録部110が登録した訂正マクロ207の「操作:「最新」を削除→「くだくしんたい」と発声→「く」「体」を削除、読み:さいしん」と訂正箇所の前後関係220の「訂正位置:前=『粉骨』、後=『努力』」から、「操作:「最新」を削除→「くだく しんたい」と発声→「く」「体」を削除、読み:さいしん」:前=『粉骨』、後=『努力』という訂正マクロ前後関係222を生成し、訂正マクロ前後関係表126に登録する(S54)。

0117

訂正マクロ辞書及び前後関係表併用型音声認識部125は、この訂正マクロ辞書112と訂正マクロ前後関係表126と認識語彙辞書107を併用して音声認識する。その結果、次回、ユーザが「さいしんのぶしょではふんこつさいしんどりょくします」と入力したとき、1番目の「さいしん」の部分では、前後関係が訂正マクロ登録時と異なるために、訂正マクロ辞書ではなく従来通り認識語彙辞書が参照されることになり、「最新」という表記が表示される(S55,S56)。一方、2番目の「さいしん」の部分では、前後の単語が訂正マクロ前後関係表の単語と一致しているため、訂正マクロ辞書の方が参照されることになり、『「最新」を削除→「くだく しんたい」と発声→「く」「体」を削除』という訂正操作が自動実行され、最終的に「砕身」という表記が表示される(S55,S56)。この結果、「最新の部署では粉骨砕身努力します。」と正しく認識される(S57)。

0118

このように、訂正マクロ辞書を使用する場合に登録時の訂正マクロの前後関係を考慮することにより、適切な箇所にだけ訂正マクロを当てはめることができるようになる。

0119

(第6の実施形態)
本発明の第6の実施形態は、第4の実施形態の前後関係の情報を考慮する構成を、第3の実施形態に適用したものである。第4の実施形態で示した、前後関係の情報を考慮する構成に関する効果やバリエーションは、本実施形態にも妥当する。

0120

図12に、本発明の第6の実施形態に係る音声認識システム(自然言語処理システム)の構成例を示す。

0121

図12に示されるように、本音声認識システムは、音声入力部101、訂正結果生成部102、訂正単語生成部103、認識語彙辞書107、ユーザ単語辞書登録自動起動部113、ユーザ辞書115、前後関係抽出部120、ユーザ単語前後関係表登録部127、ユーザ単語辞書及び前後関係表併用型音声認識部128、ユーザ単語前後関係表129を備えている。なお、図6と同様の部分には同じ符号を付してある。

0122

本実施形態の音声認識システムにおける認識処理及び訂正処理に係る概略的な手順の一例は図2と同様である。

0123

以下では、第3の実施形態と相違する点を中心に説明する。

0124

ユーザ単語辞書及び前後関係表併用型音声認識部128は、後述するように、音声認識結果(201)を生成する。ここでは、音声認識結果は、仮名漢字混じり文である。

0125

生成された仮名漢字混じり文は、所定の表示装置(図示せず)の表示画面に表示される。また、表示された仮名漢字混じり文に対しては、所定の入力装置(図示せず)を介して、ユーザからの訂正操作を受け付けるとともに、訂正結果は、所定の表示装置の表示画面に表示される。

0126

前後関係抽出部120は、ユーザ単語辞書及び前後関係表併用型音声認識部128が出力した音声認識結果(201)と、音声認識結果に対してユーザが実施した訂正操作(202)とから、訂正範囲を特定し、訂正箇所の前後関係の情報(220)を抽出する。

0127

ユーザ単語前後関係表登録部127は、ユーザ単語辞書登録部113が登録したユーザ単語(208)と前後関係抽出部120が生成した訂正箇所の前後関係の情報(220)とを組にしてユーザ単語の前後関係の情報(223)を生成し、ユーザ単語前後関係表129に登録する。

0128

ユーザ単語辞書及び前後関係表併用型音声認識部128は、ユーザ単語辞書115及びユーザ単語前後関係表129と認識語彙辞書107と併用して音声認識する(入力音声200を音声認識して仮名文字列を生成し、該仮名文字列をもとに仮名漢字混じり文字列201を生成する)。

0129

以下では、図13を参照しながら具体例を用いて本実施形態につき説明する。

0130

図13は、前後関係抽出部120、ユーザ単語前後関係表登録部127、ユーザ単語及び前後関係表併用型音声認識部128の動作とその過程で作成される訂正箇所の前後関係(220)、ユーザ単語の前後関係の情報(223)の具体例を示したものである。

0131

本具体例では、「粉骨砕身努力します。」という文章を入力するケースで考える。このとき、ユーザは「ふんこつさいしんどりょくします」と発声する。ここで、「砕身」という単語が認識語彙辞書に登録されていなかったとする。

0132

なお、図13において(a)は「ふんこつさいしんどりょくします」と発声する1回目のケース(訂正・登録の前のケース)であり、(b)は「ふんこつさいしんどりょくします」と発声する2回目のケース(訂正・登録の後のケース)である。

0133

このとき、本音声認識システムは、次のような誤認識をすることになる(S61)。

0134

入力音声:「ふんこつさいしんどりょくします」
認識結果:「粉骨最新努力します。」
この誤認識を訂正するために、ユーザは訂正操作(A)を実施する(第1の実施形態参照)。

0135

この操作による訂正結果は次のようになる(S62)。
訂正結果:「粉骨砕身努力します。」
ユーザのこの訂正操作結果から、訂正結果生成部102は、「最新」という認識結果の位置の文字列を「砕身」に訂正したことを検出し、訂正結果情報203として「訂正位置:認識結果中の『最新』、訂正結果文字列:砕身」を出力する。

0136

これと同時に、ユーザの訂正操作202と音声認識結果201から、前後関係抽出部120は「最新」という認識結果の位置の文字列に対して訂正操作(A)を実施したことを検出し、その操作箇所の前後の単語として「粉骨」「努力」を検出し、訂正箇所の前後関係220として「訂正位置:前=『粉骨』、後=『努力』」を出力する。

0137

そして、訂正単語生成部103は、入力音声と訂正結果生成部102が生成した訂正結果情報203から、「入力音声の訂正位置に該当する発声列:さいしん」と「訂正結果文字列:砕身」とを対応付けて、「表記:砕身、読み:さいしん」という訂正単語204を生成する。ユーザ単語辞書登録自動起動部113は、この訂正単語をユーザ単語208としてユーザ単語辞書115に登録する(S64)。ここで、ユーザ単語辞書に登録する前にユーザに確認画面を出し、登録内容を修正できるようにすることも可能である(S63)。

0138

一方、ユーザ単語前後関係表登録部127は、ユーザ単語辞書登録自動起動部113が登録したユーザ単語208の「表記:砕身、読み:さいしん」と訂正箇所の前後関係220の「訂正位置:前=『粉骨』、後=『努力』」とから、「表記:砕身、読み:さいしん」:前=『粉骨』、後=『努力』というユーザ単語前後関係223を生成し、ユーザ単語前後関係表129に登録する(S65)。

0139

ユーザ単語辞書及び前後関係表併用型音声認識部128は、このユーザ単語辞書115とユーザ単語前後関係表129と認識語彙辞書107とを併用して音声認識する。その結果、次回、ユーザが「さいしんのぶしょではふんこつさいしんどりょくします」と入力したとき、1番目の「さいしん」の部分では、前後関係がユーザ単語登録時と異なるために、ユーザ単語辞書ではなく従来通り認識語彙辞書が参照されることになり、「最新」という表記が表示される(S66,S67)。一方、2番目の「さいしん」の部分では、前後の単語がユーザ単語前後関係表の単語と一致しているため、ユーザ単語辞書の方が参照されることになり、「砕身」という表記が表示される(S66,S67)。この結果、「最新の部署では粉骨砕身努力します。」と正しく認識される(S68)。

0140

このように、ユーザ単語辞書を使用する場合に登録時のユーザ単語の前後関係を考慮することにより、適切な箇所にだけユーザ単語を当てはめることができるようになる。

0141

ところで、第1〜第6の実施形態では、音声入力部が、ユーザからの入力音声データを認識処理して、仮名文字列を出力し、各認識部が、該仮名文字列をもとに、仮名漢字混じり文字列を生成するものであったが、その代わりに、入力部が、キーボード装置あるいはいわゆるソフトキー等の仮名文字入力デバイスによりユーザからの仮名文字列を入力し、各認識部が、該仮名文字列をもとに、仮名漢字混じり文字列を生成する場合にも、本発明は適用可能である。また、音声入力と仮名文字とを併用する場合も可能である。

0142

なお、以上の各機能は、ソフトウェアとして記述し適当な機構をもったコンピュータに処理させても実現可能である。
また、本実施形態は、コンピュータに所定の手段を実行させるための、あるいはコンピュータを所定の手段として機能させるための、あるいはコンピュータに所定の機能を実現させるためのプログラムとして実施することもできる。加えて該プログラムを記録したコンピュータ読取り可能な記録媒体として実施することもできる。

0143

なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。

図面の簡単な説明

0144

本発明の第1の実施形態に係る音声認識システムの構成例を示す図
本発明の第1〜第6の実施形態における処理手順の一例を示すフローチャート
本発明の第1の実施形態に係る音声認識システムの訂正結果生成部、訂正単語生成部、訂正単語辞書登録部の動作を説明するための図
本発明の第2の実施形態に係る音声認識システムの構成例を示す図
同音声認識システムの訂正手順生成部、訂正マクロ生成部、訂正マクロ辞書登録部の動作を説明するための図
本発明の第3の実施形態に係る音声認識システムの構成例を示す図
同音声認識システムの訂正結果生成部、訂正単語生成部、ユーザ単語辞書登録自動起動部の動作を説明するための図
本発明の第4の実施形態に係る音声認識システムの構成例を示す図
同音声認識システムの前後関係抽出部、訂正単語前後関係表登録部、訂正単語及び前後関係表併用型音声認識部の動作を説明するための図
本発明の第5の実施形態に係る音声認識システムの構成例を示す図
同音声認識システムの前後関係抽出部、訂正マクロ前後関係表登録部、訂正マクロ及び前後関係表併用型音声認識部の動作を説明するための図
本発明の第6の実施形態に係る音声認識システムの構成例を示す図
同音声認識システムの前後関係抽出部、ユーザ単語前後関係表登録部、ユーザ単語及び前後関係表併用型音声認識部の動作を説明するための図

符号の説明

0145

101…音声入力部、102…訂正結果生成部、103…訂正単語生成部、104…訂正単語辞書登録部、105…訂正単語辞書併用型音声認識部、106…訂正単語辞書、107…認識語彙辞書、108…訂正手順生成部、109…訂正マクロ生成部、110…訂正マクロ辞書登録部、111…訂正マクロ辞書併用型音声認識部、112…訂正マクロ辞書、113…ユーザ単語辞書登録自動起動部、114…ユーザ単語辞書併用型音声認識部、115…ユーザ辞書、120…前後関係抽出部、121…訂正単語前後関係表登録部、122…訂正単語辞書及び前後関係表併用型音声認識部、123…訂正単語前後関係表、124…訂正マクロ前後関係表登録部、125…訂正マクロ辞書及び前後関係表併用型音声認識部、126…訂正マクロ前後関係表、127…ユーザ単語前後関係表登録部、128…ユーザ単語前後関係表、129…ユーザ単語辞書及び前後関係表併用型音声認識部

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

該当するデータがありません

関連する公募課題

該当するデータがありません

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

該当するデータがありません

この 技術と関連する公募課題

該当するデータがありません

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ