図面 (/)

技術 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体

出願人 株式会社東芝
発明者 中里茂美雷海涛
出願日 1998年2月4日 (21年10ヶ月経過) 出願番号 1998-023280
公開日 1999年8月17日 (20年4ヶ月経過) 公開番号 1999-224248
状態 未査定
技術分野 文書処理装置 文書処理装置 機械翻訳
主要キーワード 日本語読み 区別表示 ピンイン 表記情報 打消し 入力変換 付加位置 二重母音
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(1999年8月17日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (13)

課題

動詞などのように活用する単語の場合に、助動詞などの付属語も含めた日本語の読みの入力と中国語への変換を可能とする。

解決手段

入力部21を通じて日本語の読みが入力されると、制御部22は変換部23を通じて日中変換処理を実行する。変換部23では、日中辞書24および付属語辞書25を参照して上記入力された日本語の読みを語幹と付属語に分け、その語幹に対応する中国語の表記と付属語に対応する中国語の表記を得、この語幹の中国語表記に付属語の中国語表記を付加して上記日本語の読みに対応する中国語を生成する。制御部22は変換部23によって得られた中国語を出力部26を通じて変換結果として出力する。

概要

背景

従来、中国語ワードプロセッサ等の中国語入力変換処理装置では、中国語の漢字とその読みを表す表音記号(以下、ピンインと称す)とを対応付け辞書を用い、中国語の読みをピンインで入力し、これを漢字に変換して出力する機能を備えている。これをピンイン漢字変換機能日本語ワードプロセッサのかな漢字変換機能に相当)と呼ぶ。

ところで、中国語の読みをピンインで入力する場合には、中国語の知識を必要とする。すなわち、中国語では、1つの漢字の発音は必ず1音節になっている。1つの音節はさらに「声母」と呼ばれる先頭子音(音節の先頭にくる子音)と、「韻母」と呼ばれる「声母」を除いた部分(母音二重母音音化母音などがある)とで構成されている。また、音節の抑揚を表わす「四声」と呼ばれる声調日本語アクセントに似たようなもの)がある。

ピンイン入力では、このような声母と韻母をアルファベットで入力し、さらに、四声を示す声調記号を付す必要がある。このため、中国語の知識に乏しいユーザにとっては非常に困難を要する問題がある。

そこで、従来、日本語の読みを入力とし、その入力された日本語読みを中国語に変換するものがある。これによれば、日本語で読みを入力することができるため、ピンインを知らないユーザでも中国語への変換が可能となる。

概要

動詞などのように活用する単語の場合に、助動詞などの付属語も含めた日本語の読みの入力と中国語への変換を可能とする。

入力部21を通じて日本語の読みが入力されると、制御部22は変換部23を通じて日中変換処理を実行する。変換部23では、日中辞書24および付属語辞書25を参照して上記入力された日本語の読みを語幹と付属語に分け、その語幹に対応する中国語の表記と付属語に対応する中国語の表記を得、この語幹の中国語表記に付属語の中国語表記を付加して上記日本語の読みに対応する中国語を生成する。制御部22は変換部23によって得られた中国語を出力部26を通じて変換結果として出力する。

目的

本発明は上記のような点に鑑みなされたもので、動詞などのように活用する単語の場合に、助動詞などの付属語も含めた日本語の読みの入力と中国語への変換を可能とし、中国語が得意でないユーザでも、中国語の文書を作成することのできる中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体を提供することを目的とする。

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

単語の読みを日本語で入力する入力手段と、各単語毎に日本語の読みとそれに対応する中国語表記とを対応付けた日中辞書と、日本語の付属語の読みとそれに対応する中国語の表記とを対応付けた付属語辞書と、上記日中辞書および上記付属語辞書を参照して、上記入力手段によって入力された日本語の読みを語幹と付属語に分け、上記語幹に対応する中国語の表記と上記付属語に対応する中国語の表記を得る解析手段と、この解析手段によって得られた上記語幹の中国語表記に上記付属語の中国語表記を付加して上記日本語の読みに対応する中国語を生成する中国語生成手段と、この中国語生成手段によって得られた中国語を変換結果として出力する出力手段とを具備したことを特徴とする中国語入力変換処理装置

請求項2

上記日中辞書および上記付属語辞書は1つのファイルとして構成され、上記入力された読みに基づいて検索されることを特徴とする請求項1記載の中国語入力変換処理装置。

請求項3

上記出力手段は、上記語幹の中国語表記と上記付属語の中国語表記とを区別して変換結果を出力することを特徴とする請求項1記載の中国語入力変換処理装置。

請求項4

単語の読みが日本語で入力された際に、各単語毎に日本語の読みとそれに対応する中国語の表記とを対応付けた日中辞書と、日本語の付属語の読みとそれに対応する中国語の表記とを対応付けた付属語辞書とを参照して、上記入力された日本語の読みを語幹と付属語に分け、その語幹に対応する中国語の表記と付属語に対応する中国語の表記を得、上記語幹の中国語表記に上記付属語の中国語表記を付加して上記日本語の読みに対応する中国語を生成し、この中国語を変換結果として出力することを特徴とする中国語入力変換処理方法

請求項5

中国語入力変換処理を実現するためのプログラムを記録した記録媒体であって、単語の読みが日本語で入力された際に、各単語毎に日本語の読みとそれに対応する中国語の表記とを対応付けた日中辞書と、日本語の付属語の読みとそれに対応する中国語の表記とを対応付けた付属語辞書とを参照して、上記入力された日本語の読みを語幹と付属語に分け、その語幹に対応する中国語の表記と付属語に対応する中国語の表記を取得させる手順と、上記語幹の中国語表記に上記付属語の中国語表記を付加して上記日本語の読みに対応する中国語を生成させる手順と、この中国語を変換結果として出力させる手順とをコンピュータに実行させるためのプログラムを記録したコンピュータ読取り可能な記録媒体。

技術分野

0001

本発明は、中国語文書の作成に用いられる中国語ワードプロセッサ等の中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体に関する。

背景技術

0002

従来、中国語ワードプロセッサ等の中国語入力変換処理装置では、中国語の漢字とその読みを表す表音記号(以下、ピンインと称す)とを対応付け辞書を用い、中国語の読みをピンインで入力し、これを漢字に変換して出力する機能を備えている。これをピンイン漢字変換機能日本語ワードプロセッサのかな漢字変換機能に相当)と呼ぶ。

0003

ところで、中国語の読みをピンインで入力する場合には、中国語の知識を必要とする。すなわち、中国語では、1つの漢字の発音は必ず1音節になっている。1つの音節はさらに「声母」と呼ばれる先頭子音(音節の先頭にくる子音)と、「韻母」と呼ばれる「声母」を除いた部分(母音二重母音音化母音などがある)とで構成されている。また、音節の抑揚を表わす「四声」と呼ばれる声調日本語アクセントに似たようなもの)がある。

0004

ピンイン入力では、このような声母と韻母をアルファベットで入力し、さらに、四声を示す声調記号を付す必要がある。このため、中国語の知識に乏しいユーザにとっては非常に困難を要する問題がある。

0005

そこで、従来、日本語の読みを入力とし、その入力された日本語読みを中国語に変換するものがある。これによれば、日本語で読みを入力することができるため、ピンインを知らないユーザでも中国語への変換が可能となる。

発明が解決しようとする課題

0006

しかしながら、従来の装置では、日本語の読みで入力できても、動詞などのように活用する単語の場合には、常に終止形表記でしか中国語に変換することはできなかった。

0007

例えば、「みる」といった動詞の読みを入力した場合には、図12(a)に示すように、終止形の表記で中国語漢字が表示され、その中からユーザの意図する漢字を選択することができる。ところが、「みない」といった入力では、終止形の表記でしか変換できないため、同図(b)に示すような変換結果となってしまう。この場合、望む結果は「不看」である。

0008

なお、従来方式で「不看」を入力する場合には、「不」と「看」に分けて読みを入力すれば良いが、このような入力方法には、ある程度の中国語の知識を必要とするため、中国語が不得意なユーザには無理がある。

0009

また、例えば「みない」に対して「不看」といったように、予め付属語を含めた形で日本語の読みと中国語の表記とを対応付けた日中辞書を用いれば上記のような問題を解消することができるが、辞書の容量が増大してしまうため、あまり有効な方法とは言えない。

0010

本発明は上記のような点に鑑みなされたもので、動詞などのように活用する単語の場合に、助動詞などの付属語も含めた日本語の読みの入力と中国語への変換を可能とし、中国語が得意でないユーザでも、中国語の文書を作成することのできる中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体を提供することを目的とする。

課題を解決するための手段

0011

本発明の中国語入力変換処理装置は、単語の読みを日本語で入力する入力手段と、各単語毎に日本語の読みとそれに対応する中国語の表記とを対応付けた日中辞書と、日本語の付属語の読みとそれに対応する中国語の表記とを対応付けた付属語辞書と、上記日中辞書および上記付属語辞書を参照して、上記入力手段によって入力された日本語の読みを語幹と付属語に分け、上記語幹に対応する中国語の表記と上記付属語に対応する中国語の表記を得る解析手段と、この解析手段によって得られた上記語幹の中国語表記に上記付属語の中国語表記を付加して上記日本語の読みに対応する中国語を生成する中国語生成手段と、この中国語生成手段によって得られた中国語を変換結果として出力する出力手段とを具備したことを特徴とする。

0012

このような構成によれば、付属語を含めて日本語で読みを入力した場合に、その入力読み文字列の中の語幹に対応する中国語の表記と付属語に対応する中国語の表記とを得て、上記語幹の中国語表記に上記付属語の中国語表記を付加して上記日本語の読みに対応する中国語を生成する。これにより、動詞などのように活用する単語の場合に、助動詞などの付属語も含めた日本語の読みの入力と中国語への変換が可能となる。

発明を実施するための最良の形態

0013

以下、図面を参照して本発明の一実施形態を説明する。図1は本発明の一実施形態に係る中国語入力変換処理装置のシステム構成を示すブロック図である。なお、本実施形態における中国語入力変換処理装置は、例えば磁気ディスク等の記録媒体に記録されたプログラムを読み込み、このプログラムによって動作が制御されるコンピュータによって実現される。

0014

図1に示すように、本実施形態における中国語入力変換処理装置は、CPU11、メモリ12、入力装置13、表示装置14、外部記憶装置15、印刷装置16、通信装置17によって構成される。

0015

CPU11は、本装置の動作全体を制御するものであり、メモリ12に格納されたプログラムの起動で動作する。なお、メモリ12に格納されたプログラムに基づいて実現される機能としては、アプリケーションプログラムによるワードプロセッサ等がある。

0016

メモリ12は、例えばROMやRAMからなり、本装置で使用される各種プログラムやフォント(中国語フォントを含む)等のデータを格納する。このメモリ12には、ワードプロセッサを実現するアプリケーションプログラムなどのプログラムデータを格納するためのプログラム領域12aの他、入力バッファ12b、候補バッファ12c、文書バッファ12dなどが設けられている。

0017

入力バッファ12bは、文書作成のために日本語で入力された読み文字列を格納する。候補バッファ12cは、日中変換によって得られた変換候補を格納する。文書バッファ12dは、中国語漢字からなる文書データを格納する。

0018

入力装置13は、キーボードからなり、本装置に対する指示やデータの入力を行うものであり、日本語による読み文字列の入力や、その入力された読み文字列に対する変換指示(「変換」キーの操作による指示)などを行うためのものである。

0019

表示装置14は、例えばCRT(Cathode Ray Tube) やLCD (Liquid Crystal Display) からなり、入力装置13を通じて入力された読み文字列やその読み文字列に対する変換結果の表示などを行う。

0020

外部記憶装置15は、例えばHDD(Hard Disk Drive) やCD−ROM(Compact Disc Read Only Memory) からなり、各種プログラムや文書などのデータを保存する。この外部記憶装置15には、ワードプロセッサを実現するためのアプリケーションプログラムの他、日中変換処理で使用する日中辞書および付属語辞書などのデータも含まれる。

0021

印刷装置16は、文書の印刷等を行うために用いられる。この印刷装置16としては、本装置に内蔵されたものでも、外付けにて接続されるものでも良い。また、通信装置17は、例えば構内LAN (Local Area Network) や通信ネットワーク等を介して外部装置とのデータの送受信制御を行う。

0022

次に、図1に示すシステム構成によって実現される中国語入力変換処理装置の機能構成について説明する。図2図1のシステム構成によって実現される中国語入力変換処理装置の機能構成を示すブロック図である。図2に示すように、本実施形態における中国語入力変換処理装置は、入力部21、制御部22、変換部23、日中辞書24、付属語辞書25、出力部26を有する。

0023

入力部21は、入力装置13から入力される変換対象となる読み文字列や変換指示等の入力処理を行う。制御部22は、システム全体の制御を行うものであり、キー入力に応じて各部を制御する。

0024

変換部23は、日本語で読み文字列が入力された場合に日中辞書24および付属語辞書25を参照して日中変換処理を行い、その変換結果を制御部22に返す。この場合、日本語による入力読み文字列を解析して、その中で語幹に対応する中国語の表記と付属語に対応する中国語の表記を得、その語幹の中国語表記に付属語の中国語表記を付加して当該読み文字列に対応する中国語を生成し、これを変換結果としている。

0025

日中辞書24は、各単語毎に日本語の読みとそれに対応する中国語の表記(中国語見出し)など、日本語の読みから中国語に変換するための日中変換処理に必要な情報を記憶している(図3参照)。付属語辞書25は、日本語の付属語の読みとそれに対応する中国語の表記(中国語見出し)などの付属語情報を記憶している(図4参照)。

0026

出力部26は、文字列を表示装置14に表示したり、アプリケーションへの出力データを作成する。この場合、変換部23によって得られた変換結果を語幹と付属語とを区別して出力する。

0027

図3は日中辞書24の構成を示す図である。この日中辞書24には、各単語毎に日本語の読み(語幹)、品詞、中国語の表記(中国語見出し)が格納されている。この例では、「み」といった語幹の読みに対し、品詞が「上一段動詞」の場合に同図に示すような中国語表記が登録されている。

0028

図4は付属語辞書25の構成を示す図である。この付属語辞書25には、日本語の付属語の読み、その付属語の種類、付加位置、中国語の表記(中国語見出し)が格納されている。この例では、「ない」といった付属語の読みに対し、種類が「打消」、付加位置が「前方」、中国語表記が「不」といった付属語情報が登録されている。同様に、「なかっ」といった付属語の読みに対し、種類が「打消」、付加位置が「前方」、中国語表記が「不」、また、「た」といった付属語の読みに対し、種類が「過去」、付加位置が「前方」、中国語表記が「了」といった付属語情報が登録されている。

0029

次に、本装置の動作を説明する。図5は同実施形態における中国語入力変換処理の動作を示すフローチャートである。まず、入力装置13を通じて文字やファンクション等の入力があると、その入力情報は入力部21を介して制御部22に与えられる(ステップS11)。制御部22は入力された情報が変換指示であるか文字であるかを判定する(ステップS12)。その結果、文字の入力であった場合には(ステップS12のNo)、制御部22はその入力文字を読みとしてメモリ12の入力バッファ12bに順次格納した後(ステップS13)、出力部26を通じて表示装置14に表示する(ステップS14)。この場合、読みは日本語で入力されており、その日本語の読み文字列が画面上の入力位置カーソル位置)に表示される。

0030

ここで、変換キーの入力により中国語への変換指示があると(ステップS12のYes)、制御部22は入力バッファ12bに格納されている入力読み文字列を変換部23に渡して、以下のような日中変換処理を実行する(ステップS15)。

0031

すなわち、変換部23は、まず、日中辞書24および付属語辞書25を参照して入力読み文字列を解析し、その読み文字列を語幹と付属語に分け、語幹に対応する中国語の表記と付属語に対応する中国語の表記をそれぞれ得る(ステップS15a)。次に、変換部23は、この解析処理によって得られた語幹の前方あるいは後方に付属語を付加して当該読み文字列に対応する中国語を生成し、これを変換結果として制御部22に返す(ステップS15a)。

0032

なお、語幹に対して付属語をどの位置に付加するかといったことは付属語辞書25に付属語情報として予め付属語の種類毎に登録されており、変換部23はこの付属語情報に基づいて付属語を配置する。また、変換結果を制御部22に返す場合に、語幹と付属語とを区別するための付属情報を変換結果として得た各単語に付加する。

0033

制御部22は、変換部23によって得られた変換結果を受け取ると、これを候補バッファ12cに格納した後、出力部26を通じて表示装置14に表示する(ステップS16)。その際、制御部22は上記付属情報に基づいて当該変換結果の中で語幹と付属語とを判別し、例えば付属語に下線を付加するなどして語幹と付属語とを区別して表示する。

0034

このようにして、付属語を含めて読みを日本語で入力した場合でも、その読みに対応する中国語が変換結果として正しく表示される。したがって、ユーザはこの変換結果の中から所望の中国語漢字を選択して中国語の文書を作成することができる。

0035

次に、具体例を用いて説明する。
(具体例1)例えば「みない」といった文字列が読みとして入力されたとする。上記ステップS15aの解析処理では、まず、その入力読み文字列に基づいて日中辞書24を検索し、図6(a)に示すような語幹の候補を得る。さらに、付属語辞書25を検索し、これらの候補と付属語との接続性チェックすることにより、最終的に同図(b)に示すような解析結果を得る。なお、図6(a)、(b)は変換部23の内部的な解析結果を示すものである。

0036

上記ステップS15bの中国語生成処理では、上記解析結果を用いて変換結果を作成する。この場合、中国語の表記は表記情報へのポインタに従って日中辞書24から取り出し、付加する単語があるかどうかを付属語辞書25の付属語情報(種類、付加位置、表記)をチェックすることで行う。この例では、打消しの助動詞の表記を語幹の表記の前に付加して図8に示すような中国語を作成する。

0037

また、語幹と付属語とを区別するため、図7に示すように、各変換候補毎に、属性情報を付しておく(ここでは1つだけ示す)。この属性情報が“1”のとき付属語であることを示す。これにより、変換結果を表示する際に、例えば図8に示すように付属語に下線を付すなどして、語幹と付属語との区別表示を実現する。

0038

(具体例2)例えば「みた」といった文字列が読みとして入力されたとする。上記ステップS15aの解析処理では、まず、その入力読み文字列に基づいて日中辞書24を検索し、図9(a)に示すような語幹の候補を得る。さらに、付属語辞書25を検索し、これらの候補と付属語との接続性をチェックすることにより、最終的に同図(b)に示すような解析結果を得る。なお、図9(a)、(b)は変換部23の内部的な解析結果を示すものである。

0039

上記ステップS15bの中国語生成処理では、上記解析結果を用いて変換結果を作成する。この場合、中国語の表記は表記情報へのポインタに従って日中辞書24から取り出し、付加する単語があるかどうかを付属語辞書25の付属語情報(種類、付加位置、表記)をチェックすることで行う。この例では、過去の助動詞の表記を語幹の表記の後に付加して図11に示すような中国語を作成する。

0040

また、語幹と付属語とを区別するため、図10に示すように、各変換候補毎に、属性情報を付しておく(ここでは1つだけ示す)。この属性情報が“1”のとき付属語であることを示す。これにより、変換結果を表示する際に、例えば図11に示すように付属語に下線を付すなどして、語幹と付属語との区別表示を実現する。

0041

このように、動詞などのように活用する単語の場合に、助動詞などの付属語も含めた日本語の読みの入力と中国語への変換が可能となる。したがって、中国語が得意でないユーザでも、付属語も含めた日本語の読みを入力して中国語の文書を効率的に作成することができる。

0042

また、付属語を含めて読みを入力した場合に、変換結果の中で語幹と付属語とが区別して表示される。したがって、付属語に対応する中国語はどのような表記でどこに付されるのかといったことを表示画面上で確認することができ、中国語の勉強にもなる。

0043

なお、上記実施形態では、日中辞書24と付属語辞書25とを別のファイルとして構成したが、この日中辞書24と付属語辞書25とを1つのファイルとして構成し、上記入力された読みに基づいて検索することを可能である。

0044

また、語幹と付属語との区別表示を下線により行うようにしたが、例えばカラー表示可能な装置であれば、語幹と付属語との表示色を変えることでも良い。また、上記実施形態で説明したような付属語を含めた変換方式と、今までの付属語を含ない変換方式とをモード設定等により任意選択的に切り換え可能とすることにより、ユーザのレベルにあったユーザインタフェースを実現でき、さらに操作性を向上させることができる。

0045

また、上述した実施形態において記載した手法は、コンピュータに実行させることのできるプログラムとして、例えば磁気ディスク(フロッピーディスクハードディスク等)、光ディスク(CD−ROM、DVD等)、半導体メモリなどの記録媒体に書き込んで各種装置に適用したり、通信媒体により伝送して各種装置に適用することも可能である。本装置を実現するコンピュータは、記録媒体に記録されたプログラムを読み込み、このプログラムによって動作が制御されることにより、上述した処理を実行する。

発明の効果

0046

以上のように本発明によれば、付属語を含めて日本語で読みを入力した場合に、その入力読み文字列の中の語幹に対応する中国語の表記と付属語に対応する中国語の表記とを得て、上記語幹の中国語表記に上記付属語の中国語表記を付加して上記日本語の読みに対応する中国語を生成するようにしたため、動詞などのように活用する単語の場合に、助動詞などの付属語も含めた日本語の読みの入力と中国語への変換が可能となる。したがって、中国語が得意でないユーザでも、付属語も含めた日本語の読みを入力して中国語の文書を効率的に作成することができる。

図面の簡単な説明

0047

図1本発明の一実施形態に係る中国語入力変換処理装置のシステム構成を示すブロック図。
図2上記図1のシステム構成によって実現される中国語入力変換処理装置の機能構成を示すブロック図。
図3上記図2の中国語入力変換処理装置に設けられた日中語辞書の構成を示す図。
図4上記図2の中国語入力変換処理装置に設けられた付属語辞書の構成を示す図。
図5同実施形態における中国語入力変換処理の動作を示すフローチャート。
図6上記中国語入力変換処理を説明するための具体例1として、「みない」といった読みを入力した場合での解析結果を示す図。
図7上記具体例1における付属語に付加する属性情報を示す図。
図8上記具体例1における変換結果を示す図。
図9上記中国語入力変換処理を説明するための具体例1として、「みた」といった読みを入力した場合での解析結果を示す図。
図10上記具体例2における付属語に付加する属性情報を示す図。
図11上記具体例2における変換結果を示す図。
図12従来の中国語変換を説明するための図。

--

0048

11…CPU
12…メモリ
12a…プログラム領域
12b…入力バッファ
12c…候補バッファ
12d…文書バッファ
13…入力装置
14…表示装置
15…外部記憶装置
16…印刷装置
17…通信装置
21…入力部
22…制御部
23…変換部
24…日中辞書
25…付属語辞書
26…出力部

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ