図面 (/)

技術 有限状態ネットワーク自動作成方式

出願人 ケイディディ株式会社旭化成株式会社
発明者 井ノ上直己庄境誠尾和邦彦
出願日 1992年12月11日 (27年6ヶ月経過) 出願番号 1992-352443
公開日 1994年6月28日 (25年11ヶ月経過) 公開番号 1994-180592
状態 拒絶査定
技術分野 文書処理装置 機械翻訳 文書処理装置 音声認識
主要キーワード 属性パターン 記述記号 記述パターン ルール数 正規文法 自動作成処理 分類カテゴリ 連続音声認識システム
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(1994年6月28日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (9)

目的

従来、連続音声認識システムでは、システム受理できる文をあらかじめ有限状態ネットワークの形でシステム内部に保持している。しかし、このネットワークは、人手で作成されており、ネットワークの修正および追加等の際に誤りが生じたり、手間がかかるという問題があった。そのため、少数パターンからネットワークを自動的に作成する方法を確立するのが目的である。

構成

1つの単語と他の単語との接続関係記述する有限状態ネットワークを自動的に作成する方式において、単語の分類カテゴリと単語の持つ属性をパターンで記述した文法ルールを用い各単語を分類したカテゴリと、種々の属性に対して各単語の持つ属性値が記述されている辞書とを用い、各ルールを単語の分類カテゴリと単語の持つ属性をパターンで記述した雛型を用い、辞書を参照しながらルールを詳細化し、有限状態ネットワークと等価な正規文法を作成する。

概要

背景

従来より、連続音声認識システムでは受理可能な文を有限状態ネットワークとしてシステム内部に保持しておく方法がとられてきた。

例えば「総務部庶務課主任の山下さん」、「総務部庶務課主任の小田さん」、「総務部文書課主任の高橋さん」、「総務部文書課主任の太田さん」の例文を受理するためには図1(a) または(b) のいずれかの有限状態ネットワークをシステム内部に保持しておく。

しかし、図1(b) のネットワークでは実際に入力されない文「総務部文書課主任の小田さん」も受理可能であり、そのために、「総務部文書課主任の太田さん」が入力された場合、「総務部文書課主任の小田さん」と誤認識する可能性がある。そのために、システム内部に保持する有限状態ネットワークは、できるだけ図1(a) のように制限を厳しくすることが望まれるが、ネットワーク内に出現した単語数にほぼ比例して処理時間がかかる。

そのため、図1(a) の方が「主任の」が2箇所に出現しており、処理に時間を要する。つまり、システムを作成する際、受理できる文の曖昧さとシステムの処理時間とにトレードオフがあり、両者を考慮して有限状態ネットワークを作成する必要がある。

上記のトレードオフに対し、最適な有限状態ネットワークを求めるため種々の修正が行なわれる。しかし、通常この修正は人手で行なわれ、有限状態ネットワークが大きく複雑になれば、誤りが生じたり修正に手間が掛かるという問題がある。

そこで、有限状態ネットワークを自動的に作成できる方式の確立が望まれる。

概要

従来、連続音声認識システムでは、システムが受理できる文をあらかじめ有限状態ネットワークの形でシステム内部に保持している。しかし、このネットワークは、人手で作成されており、ネットワークの修正および追加等の際に誤りが生じたり、手間がかかるという問題があった。そのため、少数パターンからネットワークを自動的に作成する方法を確立するのが目的である。

1つの単語と他の単語との接続関係記述する有限状態ネットワークを自動的に作成する方式において、単語の分類カテゴリと単語の持つ属性をパターンで記述した文法ルールを用い各単語を分類したカテゴリと、種々の属性に対して各単語の持つ属性値が記述されている辞書とを用い、各ルールを単語の分類カテゴリと単語の持つ属性をパターンで記述した雛型を用い、辞書を参照しながらルールを詳細化し、有限状態ネットワークと等価な正規文法を作成する。

目的

それゆえに、この発明の目的は、有限状態ネットワークをわずかな量の文法ルールを用いて記述し、辞書を参照しながら有限状態ネットワークを詳細化し、自動的に有限状態ネットワークを作成できる方法を提供することである。

効果

実績

技術文献被引用数
0件
牽制数
1件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

1つの単語と他の単語との接続関係記述する有限状態ネットワークを自動的に作成する方式において、単語の分類カテゴリと単語の持つ属性パターンで記述した文法ルールを用い各単語を分類したカテゴリと、種々の属性に対して各単語の持つ属性値が記述されている辞書とを用い、各ルールを単語の分類カテゴリと単語の持つ属性をパターンで記述した雛型を用い、辞書を参照しながらルールを詳細化し、有限状態ネットワークと等価な正規文法を作成することを特徴とする、有限状態ネットワーク自動作成方式。

技術分野

0001

この発明は文法作成方式に関し、連続発生された音声を認識する場合を含め、言語的制約として正規文法を用いるあらゆる分野に適応可能な正規文法自動作成方式に関する。

背景技術

0002

従来より、連続音声認識システムでは受理可能な文を有限状態ネットワークとしてシステム内部に保持しておく方法がとられてきた。

0003

例えば「総務部庶務課主任の山下さん」、「総務部庶務課主任の小田さん」、「総務部文書課主任の高橋さん」、「総務部文書課主任の太田さん」の例文を受理するためには図1(a) または(b) のいずれかの有限状態ネットワークをシステム内部に保持しておく。

0004

しかし、図1(b) のネットワークでは実際に入力されない文「総務部文書課主任の小田さん」も受理可能であり、そのために、「総務部文書課主任の太田さん」が入力された場合、「総務部文書課主任の小田さん」と誤認識する可能性がある。そのために、システム内部に保持する有限状態ネットワークは、できるだけ図1(a) のように制限を厳しくすることが望まれるが、ネットワーク内に出現した単語数にほぼ比例して処理時間がかかる。

0005

そのため、図1(a) の方が「主任の」が2箇所に出現しており、処理に時間を要する。つまり、システムを作成する際、受理できる文の曖昧さとシステムの処理時間とにトレードオフがあり、両者を考慮して有限状態ネットワークを作成する必要がある。

0006

上記のトレードオフに対し、最適な有限状態ネットワークを求めるため種々の修正が行なわれる。しかし、通常この修正は人手で行なわれ、有限状態ネットワークが大きく複雑になれば、誤りが生じたり修正に手間が掛かるという問題がある。

0007

そこで、有限状態ネットワークを自動的に作成できる方式の確立が望まれる。

発明が解決しようとする課題

0008

従来より、連続音声認識システムではシステムが受理できる文をあらかじめ有限状態ネットワークの形でシステム内部に保持しており、この有限状態ネットワークは人手で作成されてきた。そのため、受理できる文を追加したり、有限状態ネットワークを修正する際にも人手に依存するため誤りが生じたり、修正に時間が掛かる原因になる。

0009

それゆえに、この発明の目的は、有限状態ネットワークをわずかな量の文法ルールを用いて記述し、辞書を参照しながら有限状態ネットワークを詳細化し、自動的に有限状態ネットワークを作成できる方法を提供することである。

課題を解決するための手段

0010

図5は、本発明のブロック図である。図において、正規文法自動作成部1がシステムが受理できる文に対応して保持する有限状態ネットワークを自動的に作成し前記課題を解決する手段である。より具体的には正規文法パターン化部9で単語の分類されたカテゴリ属性パターンを用いて表した正規文法と、辞書3を参照しながら正規文法作成部10で有限状態ネットワークと等価なルールに詳細化する。

0011

正規文法は、有限状態ネットワークのアークに相当する終端記号ノードに相当する非終端記号を用いて記述されるが、文法ルールに用いる終端記号は、単語の分類カテゴリと属性のパターンを用いて記述される。さらに、非終端記号にも属性のパターンを用いて記述する。

0012

辞書3には、単語毎に単語の分類カテゴリと種々の属性に対する属性値が記述されており、正規文法作成部10は、この辞書3を参照しながら正規文法ルールの終端記号と非終端記号は記述された属性パターンから属性値パターンを求める。

0013

さらに、終端記号および非終端記号の属性パターンと同じパターンの属性値パターンを求める。次に、終端記号については、カテゴリと属性値パターンからそのパターンに一致する単語を求め、非終端記号については属性パターンに応じて非終端記号シンボルを求めて正規文法を作成する。

0014

図4は本発明の有限状態ネットワーク自動作成部1を取り入れた構成例を示す連続音声認識システムのブロック図である。

0015

図において、入力された音声は音響分析部7でAD変換等の音響分析され、音声認識部8であらかじめ保持されている有限状態ネットワークに沿って処理され、認識結果が出力される。

0016

また、システムが受理できる文をあらかじめ有限状態ネットワーク6に保持されているが、ネットワークの修正および追加等のときには、辞書3を参照して新たな正規文法を人手で作成し、ネットワークコンパイラ5はHMM4と作成された正規文法を用いて等価な有限状態ネットワーク6に保持することは公知で、正規文法自動作成部1が本発明である。

0017

実施例について説明する前に本実施例での一構成である正規文法ルール2および辞書3の作用について説明する。

0018

一般に正規文法は図2に示す2通りの記述記号でルールが表現される文法であり、非終端記号1と終端記号2とが図2(a) に示した順に出現する。例えば、図2(a) は「総務部庶務課主任の小田さん」と「総務部文書課主任の太田さん」の2文を表す正規文法である。また、正規文法と有限状態ネットワークとは等価であり、図2(a) は図2(b) のネットワークと等しく、図2(b) から非終端記号1はネットワークのノード3に終端記号2はアーク4に対応している。

0019

次に、ネットワーク内のノード3は先頭のノードからそのノードに至るまでに通過したアークの属性を継承していると考えられる。例えば、図2(b) のノードD は先頭のノードS からノードD までに通過したアーク、総務部、庶務課、主任の持つ属性を持っていると考えられる。

0020

図3は、本発明で用いる辞書の記述例であり、各単語にはカテゴリと属性値が記述されている。例えば、単語「山下」はnameというカテゴリに分類され、属性dep に対する属性値が総務部、属性sec に対する属性値が庶務課、属性tit に対する属性値が主任である。

0021

図6は、本発明で用いる正規文法ルールの記述パターンの例であり、終端記号はカテゴリと属性の組み合わせパターンとの対で記述され、非終端記号は属性の組み合わせパターンを非終端記号シンボルに続けて記述される。図6では<>内に記述してあり、属性のパターンを+記号で表している。

0022

図5は、本発明の構成を示すブロック図である。

0023

図7は、本発明のフロー処理図である。

0024

本発明の一実施例を図面を用いて具体的に説明する。なお正規文法パターン化部9において、図7のステップSP1 からステップSP5 まで処理を行う。正規文法作成部10において、図7のステップSP6 からステップSP8 まで処理を行う。

0025

SP1 において、パターンで記述された正規文法ルールを1つ読み込む。

0026

そしてステップSP2 において、ステップSP1 で読み込んだルールの終端記号のカテゴリを得る。例えば、図6(a) のルールをステップSP1 で読み込んだ場合は、カテゴリsection を得る。

0027

ステップSP3 において、ステップSP1 で読み込んだルールの属性パターンを得る。この際、左側の非終端記号から終端記号、右側の非終端記号の順に属性パターンを求める。つまり、図6(a) に対しては、左側の非終端記号の属性パターンは<dep> 、終端記号の属性パターンは<sec> 、右側の非終端記号の属性パターンは<dep+sec> である。

0028

ステップSP4 では、図3の辞書を参照しながら、ステップSP3 で得た各属性パターンに対し異なりの属性値の集合を求め、構造体として保存する。図8(a) には図6(a) に対して求めた構造体の例を示す。ここで、左側の非終端記号、終端記号、右側の非終端記号の構造体の組み合わせ数は1×2×2の4通り考えられる。

0029

ステップSP5 ではステップSP4 で求めた左側の非終端記号の構造体、終端記号の構造体および右側の非終端記号の構造体で文法ルールの属性パターンと同一の構造体の組み合わせを求める。例えば、図8の文法ルールの属性パターンについては、左側の非終端記号および右側の非終端記号の属性パターンにはいずれも属性dep が、また終端記号と右側の非終端記号の属性パターンには属性sec が記述されている。そのため、図8(b) には図8(a) の構造体で属性パターンと同じ構造体の組み合わせ、つまり右側の非終端記号の属性dep に対する属性値と右側の非終端記号の属性dep に対する属性値が同じであり、かつ、終端記号の属性secに対する属性値と右側の非終端記号の属性sec に対する属性値が同じ構造体の組み合わせを示す。

0030

ステップSP6 においてはステップSP2 で求めたカテゴリに属する単語のなかで、ステップSP5 で求めた終端記号の構造体を表し得る単語を求める。例えば、図8(b) の2つの構造体の組み合わせに対し、辞書を参照し属性sec に庶務課、文書課という属性値を持つカテゴリsection に分類された単語を求め、それぞれ「庶務課」と「文書課」を得る。

0031

ステップSP7 ではステップSP5 で求めた構造体の属性値を非終端記号シンボルに付加して新たに作成した非終端記号シンボルとステップSP6 で求めた単語とを用いて正規文法を作成する。図8(c) に図6(a) から作成された正規文法の例を示す。ステップSP8 においては、すべてのルールを読み込んだかがチェックされる。すべてのルールが読み込まれていなければステップSP1 から処理を繰り返し、すべてのルールが読み込まれた場合は処理を終了する。

0032

音声認識システムなど受理可能な文を有限状態ネットワークを用いて記述する場合、以上の実施例と同様に処理することにより、単語の分類カテゴリと属性のパターンを用いて記述したルールから、すべての受理可能な文を表現できる正規文法を自動的に作成できる。

発明の効果

0033

以上のように、この発明によれば単語のカテゴリと属性値を記述した辞書を用いるのであるが、属性パターンとカテゴリを用いて正規文法ルールを記述すれば、少ないルール数からすべての受理可能な文に対応する正規文法が自動的に作成できる。

0034

この正規文法は有限状態ネットワークと等価であり、有限状態ネットワークをシステム内部に持ち処理を行なうシステムに利用できる。

図面の簡単な説明

0035

図1音声認識システム等で用いられている有限状態ネットワークの例である。
図2正規文法の一例とその正規文法と等価な有限状態ネットワークの例である。
図3この発明で用いられる辞書の一例である。
図4正規文法自動作成部を取り入れた構成例を示すブロック図である。
図5正規文法自動作成部を示すブロック図である。
図6この発明で用いられるパターン化して記述した正規文法の例である。
図7この発明の正規文法の自動作成処理フローである。
図8図7処理フローにそって処理が進む際に作成されるデータおよび作成される正規文法の例である。

--

0036

1正規文法自動作成部
2 正規文法ルール
3辞書
4 HMM確率モデルヒドンマルコフモデル
5ネットワークコンパイラ
6有限状態ネットワーク
7音響分析部
8音声認識部
9 正規文法パターン化部
10 正規文法作成部

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ