図面 (/)

技術 外国語文作成支援装置、方法及びプログラム

出願人 株式会社東芝東芝デジタルソリューションズ株式会社
発明者 祖国威加納敏行
出願日 2014年11月4日 (6年1ヶ月経過) 出願番号 2014-224518
公開日 2016年5月23日 (4年7ヶ月経過) 公開番号 2016-091269
状態 特許登録済
技術分野 機械翻訳 文書処理装置 検索装置
主要キーワード オフショア 特徴抽出機 拡張項目 パブリッククラウド 言語種 終点側 処理実行装置 始点側
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2016年5月23日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (20)

課題

外国語の文を作成する際の負担を軽減する。

解決手段

実施形態の記憶手段は、外国語の例文及び前記外国語の例文に対応する母国語の例文を含む例文の組を含む例文集と、前記母国との例文に対応する索引とを含む例文コーパスを記憶する。入力手段は、第1の文に対応する母国語の第2の文である入力文の入力を受け付ける。言語解析実施手段は、前記入力を受け付けた入力文に対して、形態素解析及び構文解析を含む言語解析を実施する。文法特徴抽出手段は、前記実施された言語解析の結果に基づき、前記入力文の文法特徴を抽出する。検索クエリ生成手段は、前記抽出された文法特徴に基づき、検索クエリを生成する。出力手段は、前記生成した検索クエリに基づいて前記索引を検索し、前記検索クエリに該当する索引に対応する母国語の例文及びこの母国語の例文に対応する外国語の例文を含む例文の組を出力する。

概要

背景

オフショア開発等の開発現場では、外国語文を作成することがしばしば要求される。外国語文法知識が不十分な書き手が外国語文を作成する場合、大きく2通りの状況がある。1つ目は、書き手の母国語文を作成し、これを元に所望の外国語文を作成する状況であり、2つ目は、書き手が文法上不完全な外国語文を作成し、これを元に所望の外国語文を作成する状況である。いずれの状況においても、書き手の負担を低減し、効率的に外国語文を作成するために、外国語文の作成を支援する方法が必要とされている。

この種の外国語文作成支援方法としては、例えば、機械翻訳単語帳対訳例文データベース又は類似度を用いた手法が知られている。

ここで、機械翻訳を用いた手法は、書き手の母国語で入力した母国語文を機械翻訳により外国語に翻訳することで、外国語文を生成可能となっている。

単語帳を用いた手法は、外国語単語が分からない場合、母国語の単語帳を検索して訳語を出力することによって外国語単語を得ることが可能となっている。

対訳例文データベースを用いた手法は、母国語の単語を入力すると対訳辞書及び類似語辞書を用いた対訳例文データベースを検索し、対応する訳語、及び訳語が含まれる例文出力可能となっている。

類似度を用いた手法は、入力文検索対象の例文との単語間の類似度を比較し、類似度が高い例文を出力可能となっている。

概要

外国語の文を作成する際の負担を軽減する。 実施形態の記憶手段は、外国語の例文及び前記外国語の例文に対応する母国語の例文を含む例文の組を含む例文集と、前記母国との例文に対応する索引とを含む例文コーパスを記憶する。入力手段は、第1の文に対応する母国語の第2の文である入力文の入力を受け付ける。言語解析実施手段は、前記入力を受け付けた入力文に対して、形態素解析及び構文解析を含む言語解析を実施する。文法特徴抽出手段は、前記実施された言語解析の結果に基づき、前記入力文の文法特徴を抽出する。検索クエリ生成手段は、前記抽出された文法特徴に基づき、検索クエリを生成する。出力手段は、前記生成した検索クエリに基づいて前記索引を検索し、前記検索クエリに該当する索引に対応する母国語の例文及びこの母国語の例文に対応する外国語の例文を含む例文の組を出力する。

目的

本発明が解決しようとする課題は、外国語の文を作成する際の負担を軽減し得る外国語文作成支援装置、方法及びプログラムを提供する

効果

実績

技術文献被引用数
0件
牽制数
1件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

少なくとも自立語を含む複数の文節からなる文である外国語の第1の文の作成を支援する外国語文作成支援装置であって、前記外国語の例文及び前記外国語の例文に対応する母国語の例文を含む例文の組を含む例文集と、前記母国語の例文に対応する索引とを含む例文コーパスを記憶する記憶手段と、前記第1の文に対応する母国語の第2の文である入力文の入力を受け付け入力手段と、前記入力を受け付けた入力文に対して、形態素解析及び構文解析を含む言語解析を実施する言語解析実施手段と、前記実施された言語解析の結果に基づき、前記入力文の文法特徴を抽出する文法特徴抽出手段と、前記抽出された文法特徴に基づき、検索クエリを生成する検索クエリ生成手段と、前記生成した検索クエリに基づいて前記索引を検索し、前記検索クエリに該当する索引に対応する母国語の例文及びこの母国語の例文に対応する外国語の例文を含む例文の組を出力する出力手段と、を備えることを特徴とする外国語文作成支援装置。

請求項2

少なくとも自立語を含む複数の文節からなる文である外国語の第1の文の作成を支援する外国語文作成支援装置であって、前記外国語の例文を含む例文集と、前記外国語の例文に対応する索引とを含む例文コーパスを記憶する記憶手段と、外国語の第3の文である入力文の入力を受け付ける入力手段と、前記入力を受け付けた入力文に対して、形態素解析を含む言語解析を実施する言語解析実施手段と、前記実施された言語解析の結果に基づき、前記入力文の文法特徴を抽出する文法特徴抽出手段と、前記抽出された文法特徴に基づき、検索クエリを生成する検索クエリ生成手段と、前記生成した検索クエリに基づいて前記索引を検索し、前記検索クエリに該当する索引に対応する外国語の例文を出力する出力手段と、を備えることを特徴とする外国語文作成支援装置。

請求項3

前記記憶手段は、前記外国語の例文に対応する母国語の例文を更に含む例文集を含む例文コーパスを記憶し、前記出力手段は、前記検索クエリに該当する索引に対応する外国語の例文に対応する母国語の例文を更に出力することを特徴とする請求項2に記載の外国語文作成支援装置。

請求項4

前記検索クエリ生成手段は、前記文法特徴に基づき、検索クエリを作成し、前記作成した検索クエリを拡張することにより、最終的に検索クエリを生成することを特徴とする請求項1乃至請求項3のいずれか1項に記載の外国語文作成支援装置。

請求項5

前記検索クエリを拡張することは、当該検索クエリに対し、体言抽象化同義語拡張助詞拡張、または自他動詞拡張の少なくともいずれか1つを適用することを含むことを特徴とする請求項4に記載の外国語文作成支援装置。

請求項6

前記文法特徴抽出手段は、前記実施された言語解析の結果に基づき、前記入力文の意味属性解析を実施する意味属性解析実施部と、前記実施された意味属性解析の結果に基づき、前記入力文の文法特徴を抽出する抽出部とを更に備えたことを特徴とする請求項1乃至請求項5のいずれか1項に記載の外国語文作成支援装置。

請求項7

前記意味属性解析の結果は、前記入力文の自立語の意味属性を階層レベル毎に含んでおり、前記抽出部は、前記階層レベル毎の意味属性を含む文法特徴を抽出し、前記検索クエリ生成手段は、前記検索クエリに適用する意味属性の階層レベルを選択して前記検索クエリを生成することを特徴とする請求項6に記載の外国語文作成支援装置。

請求項8

少なくとも自立語を含む複数の文節からなる文である外国語の第1の文の作成を支援する外国語文作成支援装置における外国語文作成支援方法であって、前記外国語の例文及び前記外国語の例文に対応する母国語の例文を含む例文の組を含む例文集と、前記母国語の例文に対応する索引とを含む例文コーパスを記憶する記憶工程と、前記第1の文に対応する母国語の第2の文である入力文の入力を受け付ける入力工程と、前記入力を受け付けた入力文に対して、形態素解析及び構文解析を含む言語解析を実施する言語解析実施工程と、前記実施された言語解析の結果に基づき、前記入力文の文法特徴を抽出する文法特徴抽出工程と、前記抽出された文法特徴に基づき、検索クエリを生成する検索クエリ生成工程と、前記生成した検索クエリに基づいて前記索引を検索し、前記検索クエリに該当する索引に対応する母国語の例文及びこの母国語の例文に対応する外国語の例文を含む例文の組を出力する出力工程と、を備えることを特徴とする外国語文作成支援方法。

請求項9

少なくとも自立語を含む複数の文節からなる文である外国語の第1の文の作成を支援する外国語文作成支援装置における外国語文作成支援方法であって、前記外国語の例文を含む例文集と、前記外国語の例文に対応する索引とを含む例文コーパスを記憶する記憶工程と、外国語の第3の文である入力文の入力を受け付ける入力工程と、前記入力を受け付けた入力文に対して、形態素解析を含む言語解析を実施する言語解析実施工程と、前記実施された言語解析の結果に基づき、前記入力文の文法特徴を抽出する文法特徴抽出工程と、前記抽出された文法特徴に基づき、検索クエリを生成する検索クエリ生成工程と、前記生成した検索クエリに基づいて前記索引を検索し、前記検索クエリに該当する索引に対応する外国語の例文を出力する出力工程と、を備えることを特徴とする外国語文作成支援方法。

請求項10

少なくとも自立語を含む複数の文節からなる文である外国語の第1の文の作成を支援する外国語文作成支援装置に用いられるプログラムであって、前記外国語文作成支援装置を、前記外国語の例文及び前記外国語の例文に対応する母国語の例文を含む例文の組を含む例文集と、前記母国語の例文に対応する索引とを含む例文コーパスを記憶する記憶手段、前記第1の文に対応する母国語の第2の文である入力文の入力を受け付ける入力手段、前記入力を受け付けた入力文に対して、形態素解析及び構文解析を含む言語解析を実施する言語解析実施手段、前記実施された言語解析の結果に基づき、前記入力文の文法特徴を抽出する文法特徴抽出手段、前記抽出された文法特徴に基づき、検索クエリを生成する検索クエリ生成手段、前記生成した検索クエリに基づいて前記索引を検索し、前記検索クエリに該当する索引に対応する母国語の例文及びこの母国語の例文に対応する外国語の例文を含む例文の組を出力する出力手段、として機能させるためのプログラム。

請求項11

少なくとも自立語を含む複数の文節からなる文である外国語の第1の文の作成を支援する外国語文作成支援装置に用いられるプログラムであって、前記外国語文作成支援装置を、前記外国語の例文を含む例文集と、前記外国語の例文に対応する索引とを含む例文コーパスを記憶する記憶手段、外国語の第3の文である入力文の入力を受け付ける入力手段、前記入力を受け付けた入力文に対して、形態素解析を含む言語解析を実施する言語解析実施手段、前記実施された言語解析の結果に基づき、前記入力文の文法特徴を抽出する文法特徴抽出手段、前記抽出された文法特徴に基づき、検索クエリを生成する検索クエリ生成手段、前記生成した検索クエリに基づいて前記索引を検索し、前記検索クエリに該当する索引に対応する外国語の例文を出力する出力手段、として機能させるためのプログラム。

技術分野

0001

本発明の実施形態は、外国語文作成支援装置、方法及びプログラムに関する。

背景技術

0002

オフショア開発等の開発現場では、外国語文を作成することがしばしば要求される。外国語文法知識が不十分な書き手が外国語文を作成する場合、大きく2通りの状況がある。1つ目は、書き手の母国語文を作成し、これを元に所望の外国語文を作成する状況であり、2つ目は、書き手が文法上不完全な外国語文を作成し、これを元に所望の外国語文を作成する状況である。いずれの状況においても、書き手の負担を低減し、効率的に外国語文を作成するために、外国語文の作成を支援する方法が必要とされている。

0003

この種の外国語文作成支援方法としては、例えば、機械翻訳単語帳対訳例文データベース又は類似度を用いた手法が知られている。

0004

ここで、機械翻訳を用いた手法は、書き手の母国語で入力した母国語文を機械翻訳により外国語に翻訳することで、外国語文を生成可能となっている。

0005

単語帳を用いた手法は、外国語単語が分からない場合、母国語の単語帳を検索して訳語を出力することによって外国語単語を得ることが可能となっている。

0006

対訳例文データベースを用いた手法は、母国語の単語を入力すると対訳辞書及び類似語辞書を用いた対訳例文データベースを検索し、対応する訳語、及び訳語が含まれる例文出力可能となっている。

0007

類似度を用いた手法は、入力文検索対象の例文との単語間の類似度を比較し、類似度が高い例文を出力可能となっている。

先行技術

0008

特開平7−141382号公報
特開2014−109791号公報
特開2003−6191号公報
特開2000−259627号公報

発明が解決しようとする課題

0009

しかしながら、従来の外国語文作成支援方法は、いずれの手法も書き手の負担が大きいという不都合がある。

0010

例えば、機械翻訳を用いた手法は、機械翻訳結果が必ずしも書き手が意図した文章であるとは限らないので、所望の外国語文を作成するまでに多くの修正操作を要する可能性がある。

0011

単語帳を用いた手法は、得られた外国語単語から外国語文を作成できないか、又は外国語文を作成するための負担が大きい。

0012

対訳例文データベースを用いた手法は、意図しない文法表現を用いた例文まで検索されてしまい、意図した文法表現を用いた例文を絞り込むのに負担がかかる。また、対訳例文データベースを用いた手法は、文法上不完全な外国語文を入力として、完全な外国語文を作成するような場合に適用できない。

0013

類似度を用いた手法は、単語間の類似度によって例文を検索するので、意図しない例文が含まれる可能性があり、意図した例文を絞り込むのに負担がかかる。

0014

即ち、従来の外国語文作成支援方法では、書き手が意図した外国語文を作成する際の負担が大きい。

0015

本発明が解決しようとする課題は、外国語の文を作成する際の負担を軽減し得る外国語文作成支援装置、方法及びプログラムを提供することである。

課題を解決するための手段

0016

実施形態の外国語文作成支援装置は、少なくとも自立語を含む複数の文節からなる文である外国語の第1の文の作成を支援する。

0017

前記外国語文作成支援装置は、記憶手段と、入力手段と、言語解析実施手段と、文法特徴抽出手段と、検索クエリ作成手段と、出力手段とを備えている。

0018

前記記憶手段は、前記外国語の例部の予備前記外国語の例文に対応する母国語の例文を含む例文の組を含む例文集と、前記母国語の例文に対応する索引とを含む例文コーパスを記憶する。

0019

記入力手段は、前記第1の文に対応する母国語の第2の文である入力文の入力を受け付ける。

0020

前記言語解析実施手段は、前記入力を受け付けた入力文に対して、形態素解析及び構文解析を含む言語解析を実施する。

0021

記文法特徴抽出手段は、前記実施された言語解析の結果に基づき、前記入力文の文法特徴を抽出する。

0022

前記検索クエリ生成手段は、前記抽出された文法特徴に基づき、検索クエリを生成する。

0023

前記出力手段は、前記生成された検索クエリに基づいて前記索引を検索し、前記検索クエリに該当する索引に対応する母国語の例文及びこの母国語の例文に対応する外国語の例文を含む例文の組を出力する。

図面の簡単な説明

0024

第1の実施形態に係る外国語文作成支援装置のハードウェア構成を示すブロック図である。
同実施形態における外国語文作成支援装置の構成例を示すブロック図である。
同実施形態における文法特徴情報の一例を示す模式図である。
同実施形態における文法特徴情報の一例を示す模式図である。
同実施形態における例文コーパスの一例を示す模式図である。
同実施形態における動作を説明するためのフローチャートである。
同実施形態における形態素解析結果の一例を示す模式図である。
同実施形態における構文解析結果の一例を示す模式図である。
同実施形態における文法特徴の一例を示す模式図である。
同実施形態における検索クエリの一例を示す模式図である。
同実施形態における出力文の一例を示す模式図である。
同実施形態における形態素解析結果の一例を示す模式図である。
同実施形態における文法特徴の一例を示す模式図である。
同実施形態における検索クエリの一例を示す模式図である。
同実施形態における出力文の一例を示す模式図である。
第2の実施形態に係る外国語文作成支援装置の構成例を示す模式図である。
同実施形態における意味属性情報の一例を示す模式図である。
同実施形態における例文コーパスの一例を示す模式図である。
同実施形態における動作を説明するためのフローチャートである。
同実施形態における形態素解析結果の一例を示す模式図である。
同実施形態における文法特徴の一例を示す模式図である。
同実施形態における検索クエリの一例を示す模式図である。
同実施形態における検索クエリの一例を示す模式図である。
同実施形態における出力文の一例を示す模式図である。

実施例

0025

以下、いくつかの実施形態について図面を参照して説明する。なお、各実施形態の外国語文作成支援装置は、スタンドアロンユーザ端末として実施してもよく、クライアントサーバシステムにおけるサーバ装置として実施してもよい。また、各実施形態の外国語文作成支援装置は、プライベートクラウド又はパブリッククラウド等のクラウドコンピューティングシステムにおいて、低負荷時に選択される複数台処理実行装置の各々として実施してもよい。

0026

(第1の実施形態)
図1は、第1の実施形態に係る外国語文作成支援装置のハードウェア構成の一例を示す模式図である。この外国語文作成支援装置1は、コンピュータ10と、外部記憶装置20とを備えている。コンピュータ10は、例えばハードディスクドライブ(HDD:Hard Disk Drive)のような外部記憶装置20と接続されている。外部記憶装置20は、コンピュータ10によって実行されるプログラム21を記憶する。

0027

第1の実施形態に係る外国語文作成支援装置1は、少なくとも自立語を含む複数の文節からなる文である外国語の第1の文の作成を支援する機能を有する。なお、各実施形態の外国語文作成支援装置1のユーザとしては、例文を用いずに文法上完全な外国語文を作成する作文能力には至らないものの、適切な例文を選択して文法上完全な外国語文を作成できる作文能力を有する者を主なユーザとして想定する。但し、各実施形態の外国語文作成支援装置1は、当該主なユーザに限らず、不完全な外国語文を作成できる程度の作文能力を有する任意のユーザに対して適用可能となっている。

0028

外国語文作成支援装置1は、具体的には図2に示すように、文法特徴情報記憶部31と、例文コーパス記憶部32と、入力部33と、言語解析部34と、文法特徴抽出部35と、検索クエリ生成部36と、例文検索部37と、出力部38とを備えている。各部31〜38は、コンピュータ10が外部記憶装置20に記憶されているプログラム(外国語文作成支援プログラム)21を実行することにより実現されるものとする。プログラム21は、コンピュータ読取可能な記憶媒体に予め記憶された形態で頒布可能となっている。また、プログラム21は、例えばネットワークを介してコンピュータ10にダウンロードされても構わない。また、文法特徴情報記憶部31及び例文コーパス記憶部32は、例えば外部記憶装置20内に実装されているが、コンピュータ10のメモリ(図示せず)内に書込んで実装されてもよい。

0029

文法特徴情報記憶部31は、読出し/書込み可能なメモリであり、図3及び図4に示す如き、見出し単語に対して、品詞文法属性文法パターン同義語、及び自他動詞ペア等を含む文法特徴が関連付けられた文法特徴情報31a,31bが予め記憶されている。文法特徴情報31aは、中国語に対する文法特徴情報の一例であり、文法特徴情報31bは、日本語に対する文法特徴情報の一例である。なお、文法特徴情報記憶部31は、中国語と日本語とに限らず、任意の言語種に対する文法特徴情報が記憶されていてもよい。また、文法特徴情報記憶部31は、文法特徴抽出部35及び検索クエリ生成部36からの読出しに応じて、指定された言語種の文法特徴情報31a,31bを文法特徴抽出部35及び検索クエリ生成部36に送信する。

0030

ここで、見出し単語は、動詞や形容詞等の用言と、助詞助動詞等の機能語とを含む単語の総称である。品詞は、見出し単語の品詞を表す情報である。文法属性は、見出し単語の文法用法を表す情報であり、例えば、見出し単語の品詞が動詞の場合、自動詞であるか、又は他動詞であるかを表す。また、文法属性は、見出し単語の品詞が機能語の場合、その機能語が用いられる文型(使役型、受動型又は仮定形等)を表す。文法パターンは、見出し単語が文法用途を果たす場合の典型的な文法のフォーマットを示す情報である。また、同義語は、見出し単語の意味と同じ又は類似する意味を有する単語を表す情報である。自他動詞ペアは、見出し単語の文法属性が自動詞又は他動詞の場合、見出し単語の動詞に対して対になる他動詞又は自動詞を表す情報である。

0031

例えば、図4に示すように、見出し単語が「増える」の場合、品詞には「動詞」が記憶され、文法属性には「自動詞」が記憶され、文法パターンには「増える」が典型的に使用される用法として、「名詞−が−増える」といった情報が記憶される。また、同義語には「増える」と類似する意味を有する「増加する」が記憶され、自他動詞ペアには「増える」に対応する他動詞として「増やす」が記憶される。

0032

なお、文法特徴情報31a,31bは、記憶される言語種特有項目を含んでいてもよい。例えば、中国語と日本語とに着目した場合、文法特徴情報31bに含まれる自他動詞ペアの項目は、日本語に特有の項目である。

0033

例文コーパス記憶部32は、読出し/書込み可能なメモリであり、図5に示す如き、例文コーパス32aが記憶されている。例文コーパス32aは、中国語の例文及び当該例文に対応する日本語の例文を含む例文集と、当該中国語及び日本語の例文に対応する索引とを含む。例文コーパス32aは、任意の数の言語種に対応する対訳例文の組を含む例文集と、当該例文の組の言語種のそれぞれに対応する索引とを含んでもよい。索引としては、例えば、例文の文法パターンを示す情報が使用可能となっている。例文の文法パターンを示す情報としては、例えば、例文の対象単語と、例文の助詞と、例文の対象単語及び助詞以外の単語の文法用語(品詞、文法役割等)とを組み合わせて例文の構成を表す情報が使用可能となっている。

0034

この種の索引としては、対象単語が動詞の場合、例えば、例文の形態素解析結果に基づき、例文に含まれる体言を品詞に置換した情報が使用可能となっている。補足すると、当該置換した情報としては、例文の具体的な体言(具体的な名詞、代名詞等)に代えて、当該体言の品詞(名詞、名詞節又は代名詞等)を記述した情報が使用可能となっている。なお、例文の形態素解析結果に基づく情報は、例文内の名詞節にまとめられる部分を1つの名詞節として表してもよい。

0035

また、索引としては、対象単語が動詞の場合、例えば、例文の構文解析結果に基づき、例文に含まれる体言を文法役割に置換した情報が使用可能となっている。補足すると、当該置換した情報としては、例文の具体的な体言(具体的に名詞、代名詞等)に代えて、当該体言の文法役割(目的語対象語等)を記述した情報が使用可能となっている。なお、例文の構文解析結果に基づく情報は、例文内の名詞節にまとめられる部分を1つの文法役割として表してもよい。

0036

例文コーパス記憶部32は、例文検索部37からの読出しに応じて、例文コーパス32aを例文検索部37に送信する。

0037

入力部33は、例えばキーボード又はマウス(図示せず)等に対するユーザの操作に応じて、当該ユーザからの指示又は文の入力を受け付ける。例えば、入力部33は、第1の文に対応する母国語の第2の文である入力文の入力、又は外国語の第3の文である入力文の入力を受け付ける機能を持っている。なお、外国語の第3の文は、例えばユーザによって指定された評価対象となる文である。なお、外国語の第3の文は、文法上完全な文であってもよく、文法上不完全な文であってもよい。また、入力部33は、入力を受け付けた入力文に対して出力部38から出力される文(以下、出力文と言う。)の言語種を指定する入力を更に受け付ける。入力部33は、入力文と、出力文の言語種とを言語解析部34に送信する。また、入力部33は、出力文の言語種を例文検索部37に送信する。

0038

ここで、入力文は、少なくとも自立語(例えば、名詞や動詞等)を含む複数の文節から構成される。なお、当該入力文を構成する文節には、自立語以外に付属語(例えば、助詞や助動詞等)が含まれていてもよい。また、入力文の言語種は、ユーザにとっての母国語であっても、外国語であってもよい。なお、以下の説明では、ユーザにとっての母国語が、例えば外国語文作成支援装置1に予め設定されている場合を例に挙げて述べる。しかしながら、当該母国語の言語種の設定は、任意に変更可能であってもよい。

0039

言語解析部34は、入力部33により入力を受け付けた入力文に対して、形態素解析及び構文解析を含む言語解析を実施する言語解析実施機能を持っている。具体的には例えば、言語解析部34は、入力文と、出力文の言語種とを入力部33から受信し、当該入力文の言語種を判定する。言語解析部34は、判定した入力文の言語種に基づき、当該入力文に対して言語解析を実施する。言語解析部34は、判定した入力文の言語種が母国語の場合、入力文に対して、形態素解析及び構文解析を含む言語解析を実施し、判定した入力文の言語種が外国語だった場合、入力文に対して、形態素解析を含む言語解析を実施する。言語解析部34は、言語解析結果を文法特徴抽出部35に送信する。

0040

なお、言語解析部34は、言語種の判定に際し、入力文に使用される文字種解析してもよい。文字種に基づく言語種の判定方法の例としては、英文字アルファベットを主に含む文の言語種を英語と判定する方法や、片仮名や平仮名を含む文の言語種を日本語と判定する方法等が挙げられる。また、全て漢字で構成される文の言語種を中国語と判定する方法が挙げられる。なお、言語種の判定方法は、上記の方法に限らず、任意の判定方法を適用可能であり、これらの判定方法は、言語解析部34に予め設定されていてもよい。

0041

なお、言語解析部34は、形態素解析を実施した場合、形態素解析結果を得る。具体的には、言語解析部34は、入力文を単語毎区切り、各単語に対応する品詞を付記することで、入力文における具体的な文の組み合わせ方を得る。

0042

また、言語解析部34は、構文解析を実施した場合、構文解析結果を得る。具体的には、言語解析部34は、入力文を構成する文節間の係り受け関係を示した文の構造を得る。構文解析結果に含まれる文節間の係り受け関係には、例えば、主語、目的語等の文法役割として、どの語が主格及び目的格等の格に相当するか等の情報、及び機能語の役割として、どの語がどの語と連関しているか等の情報を含む。なお、構文解析結果は、文の構造をノード及びアークによって構成されるツリー構造構文木)で表してもよい。ここで、ノードは、文を構成する各文節を示し、構文木において楕円形で表現されていてもよい。ノードには、当該ノードによって示される文節の表層文字列と、当該文節の自立語又は語幹の品詞が付記される。また、アークは、文を構成する各文節間の係り受け関係を示し、ノード間を結ぶ矢印によって表現されていてもよい。アークには、当該アークによって示される文節間の係り受け関係の種類が付記される。

0043

なお、以下の説明では、アークの始点側のノードは、「親ノード」又は「係り受け先のノード」と読み替えてもよく、アークの終点側のノードは、「子ノード」又は「係り受け元のノード」と読み替えてもよい。

0044

文法特徴抽出部35は、言語解析部34により実施された言語解析の結果に基づき、入力文の文法特徴を抽出する文法特徴抽出機能を持っている。具体的には例えば、文法特徴抽出部35は、言語解析結果を言語解析部34から受信し、文法特徴情報記憶部31から文法特徴情報31a,31bを読み出す。文法特徴抽出部35は、当該言語解析の結果に基づき、読み出した文法特徴情報31a,31bを参照しながら、入力文の文法特徴を抽出する。文法特徴抽出部35は、抽出された入力文の文法特徴を、検索クエリ生成部36に送信する。

0045

なお、抽出される入力文の文法特徴は、言語種、主動詞、文型、機能語、文構成等の情報を含む。文構成は、形態素解析結果としての具体的な文の組み合わせ方、及び構文解析結果としての文節間の係り受け関係を含む。なお、受信した言語解析結果が構文解析結果を含まない場合、文節間の係り受け関係は、文構成に含まれない。

0046

検索クエリ生成部36は、文法特徴抽出部35により抽出された文法特徴に基づき、検索クエリを生成する検索クエリ生成機能を持っている。具体的には例えば、検索クエリ生成部36は、入力文の文法特徴を文法特徴抽出部35から受信し、文法特徴情報記憶部31から文法特徴情報31a,31bを読出す。検索クエリ生成部36は、当該入力文の文法特徴に基づき、読み出した文法特徴情報31a,31bを参照しながら、入力文の検索クエリを生成する。検索クエリ生成部36は、入力文の文法特徴に含まれる文構成を検索クエリとしてもよい。検索クエリ生成部36は、生成した検索クエリを例文検索部37に送信する。

0047

また、検索クエリ生成部36は、文法特徴に基づき、検索クエリを作成し、作成した検索クエリを拡張することにより、最終的に検索クエリを生成してもよい。(検索クエリの検索範囲を拡張してもよい。)当該検索クエリを拡張することは、当該検索クエリに対し、体言抽象化同義語拡張、助詞拡張、又は自他動詞拡張の少なくともいずれか一つを適用することを含んでもよい。

0048

ここで、体言抽象化とは、検索クエリ内の体言に対して、入力された具体的な言葉を使用する代わりに、品詞(名詞、代名詞等)や文法役割(目的語、対象語等)といった抽象的概念を使用することである。また、検索クエリ生成部36は、検索クエリ内の名詞節にまとめられる部分を1つの名詞節として扱うこともできる。これにより、検索クエリ生成部36は、検索クエリ内の具体的な体言を、上位概念で抽象化したものに拡張することができる。

0049

また、同義語拡張とは、検索クエリ内の主動詞及び機能語等に対して、同じ又は類似する意味を有する同義語についても同時に検索されるよう、当該同義語を検索クエリ内に含めることである。これにより、検索クエリ生成部36は、検索クエリ内の具体的な語句を、同義語を含む一群の語句に拡張することができる。

0050

また、助詞拡張は、検索クエリ内の助詞に対して、その他の助詞についても同時に検索されるよう、当該その他の助詞を検索クエリ内に含めることである。これにより、検索クエリ生成部36は、検索クエリ内の助詞を、その他の助詞を含む一群の助詞に拡張することができる。

0051

また、自他動詞拡張は、検索クエリ内の自動詞又は他動詞に対して、対応する他動詞又は自動詞についても同時に検索されるよう、当該対応する他動詞又は自動詞を検索クエリに内に含めることである。これにより、検索クエリ生成部36は、検索クエリ内の自動詞又は他動詞を、当該動詞の対となる他動詞又は自動詞を含む一群の動詞に拡張することができる。

0052

なお、検索クエリ生成部36は、これらのいずれの拡張項目を適用するか否かを、入力文の言語種に対応して選択してもよい。例えば、外国語文として日本語文が入力された場合、当該日本語の入力文は、自動詞及び他動詞が誤用された、又は助詞が誤用された日本語文である可能性がある。したがって、当該日本語の入力文に対しては、検索クエリ生成部36は、生成した検索クエリの検索範囲の拡張項目として、特に自他動詞拡張、及び助詞拡張を適用してもよい。なお、中国語文の入力に対しては、検索クエリ生成部36は、自他動詞拡張、及び助詞拡張を適用しなくてもよい。

0053

例文検索部37は、生成された検索クエリを検索クエリ生成部36から受信し、出力文の出力言語種を入力部33から受信し、例文コーパス32aを例文コーパス記憶部32から読出す。例文検索部37は、当該検索クエリ及び出力言語種に基づいて例文コーパス32a内の索引を検索し、検索クエリに該当する索引に対応する例文と、当該例文に対応する出力言語種の例文との組を抽出し、出力部38に送信する。なお、入力文の言語種と、出力文の言語種とが同一の場合、抽出される例文は単言語のみでもよい。

0054

また、例文検索部37は、当該例文の組に加え、当該例文の組に対応する索引を更に抽出し、出力部38に送信してもよい。また、例文検索部37は、索引が検索クエリに該当するか否かを判定する際に、索引と検索クエリとの類似度を計算してもよく、当該類似度の計算方法は、既存の統計的な手法を用いてもよい。この場合、例文検索部37は、当該類似度を例文の組と共に出力部38に送信してもよい。

0055

また、例文検索部37は、例文コーパス32a内に索引が存在しない場合、当該例文コーパス32a内の例文をそれぞれ言語解析部34、文法特徴抽出部35、及び検索クエリ生成部36に送信し、言語解析を実施させ、文法特徴を抽出させ、及び検索クエリを生成させてもよい。例文検索部37は、例文コーパス32a内の各例文に対する検索クエリを検索クエリ生成部36から受信し、当該各例文に対する検索クエリを索引として利用してもよい。また、例文検索部37は、以後の利用時において当該索引を使用するために、当該索引を例文コーパス32a内に含める形で例文コーパス記憶部32に記憶させてもよい。

0056

出力部38は、検索クエリが該当する索引に対応する例文又は例文の組を例文検索部37から受信し、検索結果としてユーザに出力する。ここで、出力部38による検索結果の出力形態としては、例えば液晶ディスプレイ表示出力する形態等が適宜、使用可能となっている。なお、出力部38は、索引と検索クエリとの類似度を例文検索部37から受信してもよい。出力部38は、検索結果を出力する際にユーザが確認しやすいように、受信した検索の類似度に応じて例文をソートしてもよく、検索クエリに該当した文字列を認識しやすいように、当該文字列を色付きや下線で明示してもよい。このような例文検索部37及び出力部38は、入力文が母国語の文の場合、生成した検索クエリに基づいて索引を検索し、検索クエリに該当する索引に対応する母国語の例文及びこの母国語の例文に対応する外国語の例文を含む例文の組を出力する出力手段を構成している。また、例文検索部37及び出力部38は、入力文が外国語の文の場合、生成した検索クエリに基づいて索引を検索し、検索クエリに該当する索引に対応する外国語の例文を出力する出力手段を構成している。後者の出力手段は、検索クエリに該当する索引に対応する外国語の例文に対応する母国語の例文を更に出力してもよい。

0057

次に、以上のように構成された外国語文作成支援装置1の動作について、図6のフローチャートを用いて説明する。なお、以下の説明において、外国語文作成支援装置1は、母国語として中国語が設定されているものとし、日本語を出力文として出力する場合を想定する。なお、説明を簡単にするために、外国語の情報としては日本語のみが記憶されているものとする。即ち、文法特徴情報記憶部31は、文法特徴情報31a,31bを予め記憶しているものとする。

0058

始めに、入力文として、母国語が入力される場合における動作について説明する。ここでは、一例として、

0059

0060

という文法上完全な母国語文が入力された場合について説明する。

0061

始めに、例文コーパス記憶部32は、例文コーパス32aを記憶する(ST1)。

0062

次に、入力部33は、入力文Aと、出力文の言語種「日本語」との入力を受付け(ST2)、入力文Aと、出力文の言語種「日本語」とを言語解析部34へ送信する。

0063

言語解析部34は、入力文Aと、出力文の言語種「日本語」とを受信し、当該入力文Aの言語種を判定する(ST3)。言語解析部34は、入力文Aが全て漢字で構成されていること等に基づいて、入力文Aが中国語であると判定する。

0064

言語解析部34は、入力文Aの言語解析を実施する(ST4〜ST6)。

0065

具体的には、言語解析部34は、入力文Aに対して形態素解析を実施し(ST4)、形態素解析結果を得る。言語解析部34は、具体的には、図7(a)に示す如き入力文Aを

0066

0067

のように語単位で分割し、図7(b)に示すように、それぞれの語に品詞を付与する。

0068

言語解析部34は、入力文Aが出力文の言語種と同一であるか否かを判定する(ST5)。言語解析部34は、入力文Aが出力文の言語種と同一でないと判定し(ST5:no)、入力文Aに対して、得られた形態素解析結果に基づき、構文解析を実施する(ST6)。

0069

言語解析部34は、具体的には、図8に示すように、入力文Aの構造としてノード101,102,105,107及び109と、アーク103,104,106及び108からなる構文木を得る。例として、ノード101,102、及びアーク103の関係について説明する。

0070

0071

また、アーク103には「目的語」が付与され、ノード101とノード102とが、ノード101を親ノードとして、ノード102を子ノードとして関係づけられることを示している。つまり、アーク103は、ノード102がノード101の目的語であることを示している。

0072

言語解析部34は、得られた形態素解析結果及び構文解析結果を含む言語解析結果を文法特徴抽出部35に送信する。

0073

文法特徴抽出部35は、言語解析結果を受信し、文法特徴情報記憶部31から文法特徴情報31aを読み出す。文法特徴抽出部35は、言語解析結果及び文法特徴情報31aに基づき、入力文Aの文法特徴を抽出する(ST7)。

0074

0075

また、文法特徴抽出部35は、入力文Aの形態素解析結果としての具体的な文の組み合わせ方、及び構文解析結果としての文節間の係り受け関係を含む文構成を得る。文法特徴抽出部35は、抽出した入力文Aの文法特徴を検索クエリ生成部36に送信する。

0076

検索クエリ生成部36は、入力文Aの文法特徴を受信し、文法特徴情報記憶部31から文法特徴情報31aを読み出す。検索クエリ生成部36は、入力文Aの文法特徴及び文法特徴情報31aに基づき、検索クエリを生成する(ST8)。検索クエリ生成部36は、具体的には、入力文Aの文法特徴内の文構成を検索クエリとして用いる。

0077

また、検索クエリ生成部36は、文法特徴情報31aに基づき、図10に示すように、生成した検索クエリを拡張する。具体的には、検索クエリ生成部36は、生成した検索クエリの検索範囲として、体言抽象化及び同義語拡張を適用する。

0078

0079

検索クエリ生成部36は、生成した検索クエリを例文検索部37に送信する。

0080

例文検索部37は、検索クエリを受信し、出力文の出力言語種として「日本語」を入力部33から受信し、例文コーパス32aを例文コーパス記憶部32から読出す。例文検索部37は、検索クエリ及び出力言語種に基づいて例文コーパス32a内の索引を検索し、検索クエリに該当する索引に対応する中国語の例文、及びこの中国語の例文に対応する日本語の例文の組を取得する(ST9)。例文検索部37は、具体的には、例文コーパス32a内の中国語索引を参照し、検索クエリに該当する以下の中国語例文1〜3を抽出する。

0081

0082

例文検索部37は、抽出した中国語例文1〜3に対応する日本語例文1〜3を更に抽出し、これら例文の組をそれぞれ取得し、出力部38に送信する。

0083

出力部38は、取得された例文の組を受信する(ST10)。出力部38は、図11に示すように、例文の組として出力文A−1〜A−3を出力することにより、ユーザに提示する。なお、出力部38は、取得した例文の組について、検索クエリと合致した文字列に、色付きや下線で明示してもよい。

0084

これにより、外国語文作成支援装置1は、入力を受け付けた母国語の入力文Aに基づいて、その文法特徴と類似する例文を出力することができる。ユーザは、出力文を参照し、正しい外国語文を作成するための参考にすることができる。具体的には、ユーザは、出力文A−1,A−2の「読ませる」という動詞の使い方等を参照して、「日本語が分からない人に日本語の教科書を読ませる。」という日本語文を作成することができる。また、ユーザは、出力文A−3の「読んでもらう」という動詞の使い方等を参照して、「日本語が分からない人に日本語の教科書を読んでもらう。」という日本語文を作成することができる。

0085

次に、入力文として、外国語が入力される場合における動作について説明する。ここでは、一例として、
(入力文B)「管理者はデータを増えた。」
という文法上不完全な外国語文が入力された場合について説明する。

0086

始めに、例文コーパス記憶部32は、例文コーパス32aを記憶する(ST1)。

0087

次に、入力部33は、入力文Bと、出力文の言語種「日本語」との入力を受付け(ST2)、入力文Bと、出力文の言語種「日本語」とを言語解析部34へ送信する。

0088

言語解析部34は、入力文Bと、出力文の言語種「日本語」とを受信し、当該入力文Bの言語種を判定する(ST3)。言語解析部34は、入力文Bが「は、データ、が、や、す」等の平仮名及び片仮名を有すること等を考慮して、入力文Bが日本語であると判定する。

0089

言語解析部34は、入力文Bの言語解析を実施する(ST4〜ST5)。

0090

具体的には、言語解析部34は、入力文Bに対して形態素解析を実施し(ST4)、形態素解析結果を得る。言語解析部34は、具体的には、図12(a)に示す如き入力文Bを
「管理者/は/データ/を/増えた/。」
のように語単位で分割し、図12(b)に示すように、それぞれの語に対して品詞を付与する。

0091

言語解析部34は、入力文Bが出力文の言語種と同一であるか否かを判定する(ST5)。言語解析部34は、入力文Bが出力文の言語種と同一であると判定し(ST5:yes)、入力文Bに対して、得られた形態素解析結果に基づき、構文解析を実施せずに、得られた形態素解析結果を含む言語解析結果を文法特徴抽出部35に送信する。

0092

文法特徴抽出部35は、言語解析結果を受信し、文法特徴情報記憶部31から文法特徴情報31bを読み出す。文法特徴抽出部35は、言語解析結果及び文法特徴情報31bに基づき、入力文Bの文法特徴を抽出する(ST7)。

0093

文法特徴抽出部35は、具体的には、図13に示すように、入力文Bの文法特徴として、機能語として「は」や「を」を用いる、主動詞が「増える」の「過去形」文の「日本語」であることを抽出する。また、文法特徴抽出部35は、入力文Bの形態素解析結果としての具体的な文の組み合わせ方を含むが、構文解析結果としての文節間の係り受け関係を含まない文構成を抽出する。文法特徴抽出部35は、抽出した入力文Bの文法特徴を検索クエリ生成部36に送信する。

0094

検索クエリ生成部36は、入力文Bの文法特徴を受信し、文法特徴情報記憶部31から文法特徴情報31bを読み出す。検索クエリ生成部36は、入力文Bの文法特徴及び文法特徴情報31bに基づき、検索クエリを生成する(ST8)。検索クエリ生成部36は、具体的には、入力文Bの文法特徴内の文構成を検索クエリとして用いる。

0095

また、検索クエリ生成部36は、文法特徴情報31bに基づき、図14に示すように、生成した検索クエリを拡張する。具体的には、検索クエリ生成部36は、生成した検索クエリの検索範囲として、体言抽象化、助詞拡張及び自他動詞拡張を適用する。つまり、文法特徴抽出部35は、検索クエリに体言拡張化を適用し、「管理者」及び「データ」の検索範囲を「名詞節」に拡張する。また、文法特徴抽出部35は、検索クエリに助詞拡張を適用し、助詞「は」及び助詞「を」に対して、助詞「が」を検索クエリに含めることで、検索範囲を拡張する。また、文法特徴抽出部35は、検索クエリに自他動詞拡張を適用し、自動詞である「増やす」の対となる他動詞である「増やす」を検索クエリに含めることで、検索範囲を拡張する。

0096

検索クエリ生成部36は、生成した検索クエリを例文検索部37に送信する。

0097

例文検索部37は、検索クエリを受信し、例文コーパス32aを例文コーパス記憶部32から読出す。例文検索部37は、検索クエリに基づいて例文コーパス32a内の索引を検索し、検索クエリに該当する索引に対応する日本語の例文、及びこの日本語の例文に対応する中国語の例文の組を取得する(ST9)。例文検索部37は、具体的には、例文コーパス32a内の日本語索引を参照し、検索クエリに該当する以下の日本語例文1〜3を抽出する。
(日本語例文1):「会社は社員給料を増やした。」
(日本語例文2):「企業が採用数を増やす理由。」
(日本語例文3):「最近はお客さんが増えた。」
例文検索部37は、抽出した日本語例文1〜3に対応する中国語例文1〜3を更に抽出し、これら例文の組をそれぞれ取得し、出力部38に送信する。なお、例文検索部37は、入力文Bの言語種と、出力文の言語種とが同一の場合、日本語例文1〜3のみを取得し、出力部38に送信してもよい。

0098

出力部38は、取得された例文の組を例文検索部37から受信する(ST10)。出力部38は、図15に示すように、例文の組として出力文B−1〜B−3をユーザに出力する。なお、出力部38は、取得した例文の組について、検索クエリと合致した文字列に、色付きや下線で明示してもよい。

0099

これにより、外国語文作成支援装置1は、入力した外国語の入力文Bに基づいて、その文法特徴と類似する例文を出力することができ、ユーザは、出力文を参照し、正しい外国語文を作成するための参考にすることができる。具体的には、ユーザは、「管理者はデータを増えた。」という文法上不完全な外国語文を入力することで、出力文B−1,B−2を得ることができ、出力文B−1,B−2を参照して、「管理者はデータを増やした。」という日本語文を作成することができる。

0100

上述したように、本実施形態によれば、母国語の入力文に対して言語解析を実施し、言語解析の結果に基づき、入力文の文法特徴を抽出し、当該抽出された文法特徴に基づき、検索クエリを生成する。また、当該生成した検索クエリに基づいて索引を検索し、検索クエリに該当する索引に対応する母国語の例文及びこの母国語の例文に対応する外国語の例文を含む例文の組を出力する。これにより、外国語文を作成する際の負担を軽減することができる。

0101

補足すると、母国語の入力文の文法特徴に基づき、母国語の例文と外国語の例文との組を出力する構成により、外国語文を作成困難なユーザに対し、外国語文の作成を支援することができる。

0102

また、外国語の入力文の場合、同様に、入力文の言語解析を実施し、言語解析の結果に基づき、入力文の文法特徴を抽出し、当該抽出された文法特徴に基づき、検索クエリを生成する。また、当該生成した検索クエリに基づいて索引を検索し、検索クエリに該当する索引に対応する外国語の例文を出力する。従って、この場合も外国語文を作成する際の負担を軽減することができる。

0103

補足すると、外国語の入力文の文法特徴に基づき、外国語の例文を出力する構成により、文法上不完全な外国語の文を作成できるユーザに対し、自ら作成した外国語文と文法特徴が類似した外国語の例文を提示できる。これにより、ユーザが入力した外国文の文法が不完全だった場合、ユーザは、提示された外国語の例文を参照して文法上正しい外国語文を作成できる。また、ユーザが入力した外国語文が結果的に正しかった場合においても、提示された外国語の例文を参照して、自身が作成した外国語文が文法上正しいことを確認できる。したがって、外国語文を作成する際の負担を軽減できる。

0104

また、ユーザが外国語文を入力した場合、外国語の例文に対応する母国語の例文を更に出力できる構成により、文法上不完全な外国語の文を作成できるユーザに対し、外国語の例文に対応する母国語の対訳例文を更に提示できるので、より一層、外国語文を作成する際の負担を軽減できる。

0105

また、文法特徴に基づき、作成した検索クエリを拡張して最終的に検索クエリを生成することで、自ら作成した外国語文の文法特徴に類似した例文を効率よく抽出できる。具体的には、体言抽象化、同義語拡張、助詞拡張及び自他動詞拡張等を適用することができる。したがって、外国語文を作成する際の負担を軽減できる。

0106

(第2の実施形態)
図16は、第2の実施形態に係る外国語文作成支援装置のハードウェア構成の一例を示す模式図である。以下では、図1と同一部分には同一符号を付してその詳しい説明を省略し、異なる部分について主に述べる。

0107

第2の実施形態は、第1の実施形態の変形例であり、より適切な例文を出力し得る構成となっている。具体的には、この外国語文作成支援装置1は、第1の実施形態に加え、意味属性情報記憶部39及び意味属性解析部40を更に備える。

0108

ここで、意味属性情報記憶部39は、読出し/書込み可能なメモリであり、図17に示す如き、見出し単語と、当該見出し単語の意味属性とが関連付けられた意味属性情報39aが予め記憶されている。意味属性情報39aは、日本語の見出し単語に対する意味属性を示す情報の一例である。なお、意味属性情報記憶部39は、日本語に限らず、任意の言語種の見出し単語に対する意味属性情報39aが記憶されていてもよい。また、意味属性情報記憶部39は、意味属性解析部40からの読出しに応じて、指定された言語種の意味属性情報39aを意味属性解析部40に送信する。

0109

ここで、意味属性とは、単語を語句の意味に基づいて分類するものである。意味属性は、例えば単語の上位概念と下位概念とを関連付ける分類であってもよい。例えば、「リンゴ」の意味属性としては、「リンゴ」の上位概念である「果物」が挙げられ、「月曜日」の意味属性としては、「月曜日」の上位概念である「時間」が挙げられる。また、意味属性は、複数の階層レベルに分類されて設定されてもよい。例えば、「管理者」の意味属性としては、「名詞:主体:人」のように、3つの階層レベルに分類されて設定されてもよい。意味属性の階層レベルは、レベル数値が大きくなるほど、より下位概念に限定されるように構成されていてもよい。この場合、「管理者」の意味属性は、階層レベル1では「名詞」であり、より下位概念に限定した階層レベル2では「主体」であり、更に下位概念に限定した階層レベル3では「人」、となる。上記の例において、「果物」や「時間」、「名詞:主体:人」以外の意味属性及び分類の仕方も任意に取り得る。このように、意味属性情報39a内の意味属性は、見出し単語毎に、任意に設定可能である。

0110

なお、意味属性が定義される対象としては、名詞や代名詞、及び形容動詞の語幹等の体言が主として想定されるが、体言に限らず、形容詞や動詞等の用言を含む自立語に対して定義可能である。

0111

意味属性解析部40は、言語解析部34により実施された言語解析の結果に基づき、入力文の意味属性解析を実施する意味属性解析実施機能を持っている。具体的には、意味属性解析部40は、言語解析結果を言語解析部34から受信し、意味属性情報記憶部39から意味属性情報39aを読出す。意味属性解析部40は、言語解析結果に基づき、意味属性情報39aを参照しながら、入力文に使用される自立語に対して意味属性を付与し、意味属性解析結果を取得する。なお、意味属性解析部40は、当該付与される意味属性を1又は複数の階層レベルに分類してもよい。この場合、意味属性解析の結果は、入力文の自立語の意味属性を階層レベル毎に含んでいる。意味属性解析部40は、取得された意味属性解析の結果を文法特徴抽出部35に送信する。

0112

例文コーパス記憶部32は、図18に示す如き、索引に意味属性を更に付与した例文コーパス32bを記憶する。

0113

言語解析部34は、言語解析結果を意味属性解析部40に送信する。

0114

文法特徴抽出部35は、意味属性解析部40により実施された意味属性解析の結果に基づき、入力文の文法特徴を抽出する抽出機能を持っている。具体的には、文法特徴抽出部35は、意味属性解析結果を意味属性解析部40から受信し、文法特徴情報記憶部31から文法特徴情報31a,31bを読み出す。文法特徴抽出部35は、意味属性解析結果に基づき、読み出した文法特徴情報31a,31bを参照しながら、入力文の文法特徴を抽出する。抽出された文法特徴は、言語解析結果に基づく情報に加え、意味属性が付与された文構成を含んでいる。当該付与された意味属性は、複数の階層レベルに分類されていてもよい。この場合、文法特徴抽出部35は、階層レベル毎の意味属性を含む文法特徴を抽出する。文法特徴抽出部35は、抽出された入力文の文法特徴を、検索クエリ生成部36に送信する。

0115

検索クエリ生成部36は、言語解析結果に基づく情報に加え、意味属性が付与された文構成を含む文法特徴を文法特徴抽出部から受信し、当該文法特徴に基づき、検索クエリを生成する。なお、検索クエリ生成部36は、意味属性が複数の階層レベルに分類されている場合、検索クエリに適用する意味属性の階層レベルを選択して検索クエリを生成してもよい。また、検索クエリ生成部36は、意味属性が体言について付与されている場合、検索クエリ生成に体言抽象化を適用する代わりに、意味属性を付与してもよい。なお、選択される意味属性の階層レベルは、検索クエリ生成部36に対して予め設定されていてもよく、ユーザの要求により適宜変更可能であってもよい。検索クエリ生成部36は、生成した検索クエリを例文検索部37に送信する。

0116

例文検索部37は、検索クエリを検索クエリ生成部36から受信し、出力文の言語種を入力部33から受信し、意味属性が付与された索引を含む例文コーパス32bを例文コーパス記憶部32から読み出す。例文検索部37は、当該検索クエリに基づいて、例文コーパス32b内の索引を検索し、検索クエリに該当する索引に対応する例文を抽出し、出力部38に送信する。なお、例文検索部37は、検索クエリに選択された意味属性の階層レベルと同じか、当該意味属性の下位概念の階層レベルに分類されている索引を検索対象として検索を実施してもよい。即ち、選択された意味属性の階層レベルが大きいほど、検索範囲は限定されてもよい。

0117

なお、例文検索部37は、例文コーパス32b内に索引が存在しない場合、当該例文コーパス32b内の例文をそれぞれ言語解析部34、意味属性解析部40、文法特徴抽出部35、及び検索クエリ生成部36に送信し、言語解析を実施させ、意味属性解析を実施させ、文法特徴を抽出させ、及び検索クエリを生成させてもよい。例文検索部37は、例文コーパス32b内の各例文に対する検索クエリを検索クエリ生成部36から受信し、当該各例文に対する検索クエリを索引として利用してもよい。また、例文検索部37は、以後の利用時において当該索引を使用するために、当該索引を例文コーパス32b内に含める形で例文コーパス記憶部32に記憶させてもよい。

0118

次に、以上のように構成された外国語文作成支援装置1の動作について、図19のフローチャートを用いて説明する。なお、以下の説明において、外国語文作成支援装置1は、第1の実施形態と同様、母国語として中国語が設定されているものとし、日本語を出力文として出力する場合を想定する。なお、理解を容易にするために、外国語の情報としては日本語のみが記憶されているものとする。即ち、文法特徴情報記憶部31は、文法特徴情報31a,31bを予め記憶しているものとする。

0119

また、入力文として、外国語が入力される場合における動作について説明する。ここでは、一例として、
(入力文B)「管理者はデータを増えた。」
という文法上不完全な外国語文が入力された場合について説明する。

0120

テップST1〜ステップST5までは第1の実施形態と同様に実行される。

0121

言語解析部34は、入力文Bが出力文の言語種と同一であると判定し(ST5:yes)、入力文Bに対して、得られた形態素解析結果に基づき、構文解析を実施せずに、得られた形態素解析結果を含む言語解析結果を意味属性解析部40に送信する。

0122

意味属性解析部40は、言語解析結果を受信し、意味属性情報記憶部39から意味属性情報39aを読出す。意味属性解析部40は、言語解析結果に基づき、入力文Bに対して意味属性解析を実施し(ST7’)、意味属性解析結果を得る。意味属性解析部40は、具体的には、図20(a)に示す如き入力文B内の自立語に対して、図20(b)に示すように、意味属性情報39aに基づき、意味属性を付与する。

0123

意味属性解析部40は、意味属性解析結果を文法特徴抽出部35に送信する。

0124

文法特徴抽出部35は、意味属性解析結果を受信し、文法特徴情報記憶部31から文法特徴情報31bを読み出す。文法特徴抽出部35は、意味属性解析結果及び文法特徴情報31bに基づき、入力文Bの文法特徴を抽出する(ST7)。文法特徴抽出部35は、具体的には、図21に示すように、文法特徴の文構成として、入力文Bの言語解析結果を含むと共に、意味属性解析結果を含む文構成を得る。文法特徴抽出部35は、抽出した入力文Bの文法特徴を検索クエリ生成部36に送信する。

0125

検索クエリ生成部36は、入力文Bの文法特徴を受信し、文法特徴情報記憶部31から文法特徴情報31bを読み出す。検索クエリ生成部36は、入力文Bの文法特徴及び文法特徴情報31bに基づき、検索クエリを生成する(ST8)。検索クエリ生成部36は、具体的には、入力文Bの文法特徴内の文構成を検索クエリとして用いる。

0126

また、検索クエリ生成部36は、文法特徴情報31bに基づき、生成した検索クエリを拡張し、意味属性が複数の階層レベルに分類されている場合、検索クエリに適用する意味属性の階層レベルを選択して検索クエリを生成する。検索クエリ生成部36は、具体的には、図22に示すように、意味属性の階層レベルが“2”に設定されている場合、「管理者」に対する意味属性として、「名詞:主体」を適用し、検索クエリを生成する。また、検索クエリ生成部36は、図23に示すように、意味属性の階層レベルが3に設定されている場合、「管理者」に対する意味属性として、「名詞:主体:人」を適用し、検索クエリを生成する。なお、以下の説明では、意味属性の階層レベルは“2”に設定されているものとする。

0127

検索クエリ生成部36は、生成した検索クエリを例文検索部37に送信する。

0128

例文検索部37は、検索クエリを受信し、例文コーパス32bを例文コーパス記憶部32から読出す。例文検索部37は、検索クエリに基づいて例文コーパス32b内の索引を検索し、検索クエリに該当する索引に対応する日本語の例文、及びこの日本語の例文を取得する(ST9)。ここで、例文検索部37は、選択された意味属性と同じ階層レベルか、当該意味属性の下位概念の階層レベルの索引を検索対象とする。具体的には、例文検索部37は、階層レベルが“2”に選択されている場合、例文コーパス32b内の日本語索引を参照し、入力文Bの検索クエリに該当する以下の日本語例文1,2を抽出する。
(日本語例文1):「会社は社員の給料を増やした。」
(日本語例文2):「企業が採用数を増やす理由。」
なお、例文検索部37は、階層レベルが“3”に選択されている場合、上記の日本語例文のうち、日本語例文1のみを抽出する。

0129

例文検索部37は、抽出した日本語例文1,2に対応する中国語例文1,2を更に抽出し、これら例文の組をそれぞれ取得し、出力部38に送信してもよい。なお、例文検索部37は、入力文Bの言語種と、出力文の言語種とが同一の場合、日本語例文1,2のみを取得し、出力部38に送信してもよい。

0130

出力部38は、取得された例文の組を例文検索部37から受信する(ST10)。出力部38は、図24に示すように、例文の組として出力文B−1,B−2をユーザに出力する。なお、出力部38は、取得した例文の組について、検索クエリと合致した文字列に、色付きや下線で明示してもよい。

0131

これにより、外国語文作成支援装置1は、入力した外国語の入力文Bに基づいて、その文法特徴と類似する例文のうち、意味属性が更に限定された例文を出力することができる。これにより、ユーザは、より効率的に例文を参照し、正しい外国語文を作成するための参考にすることができる。具体的には、外国語文作成支援装置1は、文法特徴が類似するものの、入力文Bにおける階層レベル2の意味属性「主体」とは異なる意味属性「抽象」が付与された例文「最近はお客さんが増えた。」を除外することができる。したがって、ユーザは、出力文B−1,B−2のみを参照して、「管理者はデータを増やした。」という日本語文を作成することができる。

0132

上述したように第2の実施形態によれば、外国語の文を作成する際の負担を軽減することができる。補足すると、言語解析結果に基づいて、意味属性解析を更に実施し、得られた意味属性解析結果に基づいて、文法特徴を抽出する。これにより、文法特徴は類似するものの、意味属性が異なるために入力文と類似しない例文を除外することができる。したがって、外国語文を作成する際の負担をより軽減することができる。

0133

また、意味属性解析によって付与される意味属性は、入力文の自立語の意味属性を複数の階層レベルに分類し、当該意味属性の階層レベルを選択して検索クエリを生成する。これにより、意味属性の階層レベルを変更することで、出力される例文の検索範囲を調整できるため、適切な検索範囲による例文検索ができる。したがって、外国語文を作成する際の負担を、より一層、軽減することができる。

0134

なお、上記の実施形態に記載した手法は、コンピュータに実行させることのできるプログラムとして、磁気ディスクフロッピー登録商標ディスクハードディスク等)、光ディスクCD−ROM、DVD等)、光磁気ディスク(MO)、半導体メモリ等の記憶媒体に格納して頒布することができる。

0135

また、この記憶媒体としては、プログラムを記憶でき、かつコンピュータが読み取り可能な記憶媒体であれば、その記憶形式は何れの形態であってもよい。

0136

また、記憶媒体からコンピュータにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワークソフト等のMW(ミドルウェア)等が上記実施形態を実現するための各処理の一部を実行してもよい。

0137

さらに、実施形態における記憶媒体は、コンピュータと独立した媒体に限らず、LANやインターネット等により伝送されたプログラムをダウンロードして記憶又は一時記憶した記憶媒体も含まれる。

0138

また、実施形態における記憶媒体は1つに限らず、複数の媒体から上記の実施形態における処理が実行される場合も本発明における記憶媒体に含まれ、媒体構成は何れの構成であってもよい。

0139

なお、実施形態におけるコンピュータは、記憶媒体に記憶されたプログラムに基づき、上記の実施形態における各処理を実行するものであって、パソコン等の1つからなる装置、複数の装置がネットワーク接続されたシステム等の何れの構成であってもよい。

0140

また、実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置マイコン等も含み、プログラムによって本発明の機能を実現することが可能な機器、装置を総称している。

0141

なお、本発明の実施形態を説明したが、この実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。この実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。この実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれる。

0142

1…外国語文作成支援装置、10…コンピュータ、20…外部記憶装置、21…プログラム、31…文法特徴情報記憶部、31a,31b…文法特徴情報、32…例文コーパス記憶部、32a,32b…例文コーパス、33…入力部、34…言語解析部、35…文法特徴抽出部、36…検索クエリ生成部、37…例文検索部、38…出力部、39…意味属性情報記憶部、39a…意味属性情報、40…意味属性解析部。

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ