図面 (/)

技術 音声文書の送信装置、送信方法、受信装置、受信方法、送信送致受信装置の製造方法、中継装置、中継方法及び記録媒体

出願人 大前研一
発明者 大前研一
出願日 2000年4月17日 (20年10ヶ月経過) 出願番号 2000-115179
公開日 2001年11月2日 (19年3ヶ月経過) 公開番号 2001-306461
状態 拒絶査定
技術分野 計算機間の情報転送 音声認識 広域データ交換 小規模ネットワーク(3)ループ,バス以外 他装置と結合した電話通信 電話通信サービス
主要キーワード 音声プロファイル 作成機構 音声文書 シーケンスタグ 音声認識機 視覚的出力 インターネット装置 送信機構
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2001年11月2日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (15)

課題

解決手段

音声による文書を入力する音声入力装置101と;音声入力装置101で入力された音声を認識してテキストファイルに変換する音声認識機構107と;音声認識機構107で変換されたテキストファイルと、音声認識機構107でテキストファイルに認識できなかった音声文書を含む音声ファイルとを混在させて送信する送信機構104とを備える音声文書送信装置。テキストファイルと音声ファイルとを混在させて送信するので、音声ファイルをデータ量の少ない形で送信することができる。

概要

背景

従来から音声遠隔地に伝達するには、電話のように音声をそのまま送信する手段を用いたり、音声データをインターネットに乗せて遠隔地に送信することが行われていた。

概要

データ量を減縮した音声文書送信装置送信方法受信装置受信方法中継装置中継方法及び記録媒体を提供する。

音声による文書を入力する音声入力装置101と;音声入力装置101で入力された音声を認識してテキストファイルに変換する音声認識機構107と;音声認識機構107で変換されたテキストファイルと、音声認識機構107でテキストファイルに認識できなかった音声文書を含む音声ファイルとを混在させて送信する送信機構104とを備える音声文書送信装置。テキストファイルと音声ファイルとを混在させて送信するので、音声ファイルをデータ量の少ない形で送信することができる。

目的

そこで本発明は、データ量を減縮した音声文書の送信装置、送信方法、受信装置、受信方法、中継装置、中継方法及び記録媒体を提供することを目的としている。

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

音声による文書を入力する音声入力装置と;前記音声入力装置で入力された音声を認識してテキストファイルに変換する音声認識機構と;前記音声認識機構で変換されたテキストファイルと、前記音声認識機構でテキストファイルに変換しなかった音声文書を含む音声ファイルとを混在させて送信する送信機構とを備える;音声文書送信装置

請求項2

前記音声入力装置で入力された音声を予め登録されている例文識別子に変換する例文設定機構を備え;前記送信機構は、さらに例文の識別子を混在させて送信するように構成された;請求項1に記載の音声文書送信装置。

請求項3

前記音声認識機構は、前記音声のプロファイルを参照するように構成された、請求項1または請求項2に記載の音声文書送信装置。

請求項4

請求項1乃至請求項3のいずれか1項に記載の音声文書送信装置を用いて、音声による文書を送信する、音声文書送信方法

請求項5

音声による文書を入力する音声入力工程と;前記音声入力工程で入力された音声を認識してテキストファイルに変換する音声認識工程と;前記音声認識工程で変換されたテキストファイルと、前記音声認識工程でテキストファイルに変換しなかった音声文書を含む音声ファイルとを混在させて送信する送信工程とを備える;音声文書送信方法。

請求項6

音声入力工程で入力された音声を予め登録されている例文の識別子に変換する例文識別工程を備え;前記送信工程は、さらに例文の識別子を混在させて送信する;請求項5に記載の音声文書送信方法。

請求項7

前記音声認識工程は、前記音声のプロファイルを参照して音声を認識するように構成された、請求項5または請求項6に記載の音声文書送信方法。

請求項8

音声による文書を入力する音声入力処理と;前記音声入力処理で入力された音声を認識してテキストファイルに変換する音声認識処理と;前記音声認識処理で変換されたテキストファイルと、前記音声認識処理でテキストファイルに変換しなかった音声文書を含む音声ファイルとを混在させて送信する送信処理とを行うように;送信装置を制御するためのプログラムを、前記送信装置に提供して、音声文書送信装置として構成する;音声文書送信装置の製造方法。

請求項9

音声による文書を入力する音声入力処理と;前記音声入力処理で入力された音声を認識してテキストファイルに変換する音声認識処理と;前記音声認識処理で変換されたテキストファイルと、前記音声認識処理でテキストファイルに変換しなかった音声文書を含む音声ファイルとを混在させて送信する送信処理とを行うように;音声文書送信装置を制御するためのプログラムを格納した、音声文書送信装置で読み取り可能な記録媒体

請求項10

テキストファイルを含む信号を受信する受信機構と;前記受信装置で受信した信号を解読する解読機構と;前記解読機構で解読したテキストファイルを音声に変換する音声化機構を備える;音声文書受信装置。

請求項11

請求項10に記載の音声文書受信装置を用いて、音声による文書を受信する、音声文書受信方法

請求項12

テキストファイルを含む信号を受信する受信工程と;前記受信工程で受信した信号を解読する解読工程と;前記解読工程で解読したテキストファイルを音声に変換する音声化工程とを備える;音声文書受信方法。

請求項13

テキストファイルを含む信号を受信する受信処理と;前記受信処理で受信した信号を解読する解読処理と;前記解読処理で解読した信号に含まれるテキストファイルを音声に変換する音声化処理とを行うように;受信装置を制御するためのプログラムを、前記受信装置に提供して、音声文書受信装置として構成する;音声文書受信装置の製造方法。

請求項14

テキストファイルを含む信号を受信する受信処理と;前記受信処理で受信した信号を解読する解読処理と;前記解読処理で解読した信号に含まれるテキストファイルを音声に変換する音声化処理とを行うように;音声文書受信装置を制御するためのプログラムを格納した、音声文書受信装置で読み取り可能な記録媒体。

請求項15

テキストファイルと音声ファイルとを含む信号を受信する受信機構と;前記受信機構で受信した信号中の音声ファイルをテキストファイルに変換する音声認識機構と;前記受信機構で受信したテキストファイルと前記音声認識機構で変換したテキストファイルとを併せて送信するテキストファイル送信機構とを備える;音声文書中継装置

請求項16

請求項15に記載の音声文書中継装置を用いて、音声による文書を中継する、音声文書中継方法

請求項17

テキストファイルと音声ファイルとを含む信号を受信する受信工程と;前記受信工程で受信した信号中の音声ファイルをテキストファイルに変換するテキスト化工程と;前記受信工程で受信したテキストファイルと前記テキスト化工程で変換したテキストファイルとを併せて送信するテキストファイル送信工程とを備える;音声文書中継方法。

技術分野

0001

本発明は、音声文書送信装置送信方法受信装置受信方法、送信送致受信装置の製造方法、中継装置中継方法及び記録媒体に関し、特に短時間で効率的に音声文書を伝達することのできる送信装置、送信方法、受信装置、受信方法、送信送致受信装置の製造方法、中継装置、中継方法及び記録媒体に関するものである。

背景技術

0002

従来から音声遠隔地に伝達するには、電話のように音声をそのまま送信する手段を用いたり、音声データをインターネットに乗せて遠隔地に送信することが行われていた。

発明が解決しようとする課題

0003

以上のような従来の方法によれば、電話では、話言葉リアルタイムに送信するので、話をしている間中、送信装置は占有され、送信すべきデータ量も多く、そのため電話料金は高額になり勝ちであった。またインターネットで音声データを送信する場合は、音声データのデータ量が多いので、インターネット装置の負担が大きくなり勝ちであった。

0004

そこで本発明は、データ量を減縮した音声文書の送信装置、送信方法、受信装置、受信方法、中継装置、中継方法及び記録媒体を提供することを目的としている。

課題を解決するための手段

0005

上記目的を達成するために、請求項1に係る発明による音声文書送信装置100は、いわゆる音声電子メール送信装置であり、例えば図1に示すように、音声による文書を入力する音声入力装置101と;音声入力装置101で入力された音声を認識してテキストファイルに変換する音声認識機構107と;音声認識機構107で変換されたテキストファイルと、音声認識機構107でテキストファイルに変換しなかった音声文書を含む音声ファイルとを混在させて送信する送信機構104とを備える。

0006

音声認識機構107でテキストファイルに変換しなかったとは、典型的には音声認識機構107でテキストファイルに認識できなかった場合であるが、送信者が音声のまま送信したいと考えて、そのように入力装置101から入力した場合であってもよい。以下で説明する、音声文書送信方法の場合も同様である。

0007

このように構成すると、音声認識機構で変換されたテキストファイルと、音声認識機構で認識できなかった等のためテキストファイルに変換しなかった音声文書を含む音声ファイルとを混在させて送信する送信機構を備えるので、音声ファイルの全てまたは一部を、データ量負担の少ないテキストファイルで送信することができる。送信機構では、全ての音声ファイルがテキストファイルに変換できたときは、もちろんテキストファイルだけを送信する場合があってもよい。

0008

ここで、音声認識機構でテキストファイルに認識できなかった音声を音声ファイルにする音声ファイル作成機構を備えるようにしてもよい。

0009

請求項2に記載のように、請求項1に記載の音声文書送信装置100では、音声入力装置101で入力された音声を予め登録されている例文識別子に変換する例文設定機構109を備え;送信機構104は、さらに例文の識別子を混在させて送信するように構成してもよい。例文の識別子は、記号文字、番号による符号の他、アイコン、絵などの画像データであってもよい。

0010

また請求項3に記載のように、請求項1または請求項2に記載の音声文書送信装置では、音声認識機構107は、前記音声のプロファイルを参照するように構成されてもよい。音声プロファイルとは、音声の音質言語構造等を代理表示する事項、例えば、性別年齢発声者方言等の言語構造を表す出身地名(日本語英語、あるいは方言を表示する)、変声期の前か後か、風邪をひいているか否か、等である。これらをパラメータ化したものをプロファイルとしてもよい。

0011

ここで、音声のプロファイルは、入力された音声を分析して検出してもよいし、音声入力者が自分の性別、年齢等をキーボード等の入力装置で入力することによって検知してもよい。さらに、送信機構は前記プロファイルもテキストファイルと併せて送信するように構成してもよい。

0012

このように構成すると、音声のプロファイルを参照するように構成されているので、音声認識の精度が向上する。プロファイルをテキストファイルと一緒に送信するときは、受信側でテキストファイルから音声ファイルを再現するときの再現性、変換精度が向上する。

0013

前記目的を達成するために、請求項4に係る発明による音声文書送信方法は、いわゆる音声電子メール送信方法であり、請求項1乃至請求項3のいずれか1項に記載の音声文書送信装置を用いて、音声による文書を送信する。

0014

前記目的を達成するために、請求項5に係る発明による音声文書送信方法は、いわゆる音声電子メール送信方法であり、音声による文書を入力する音声入力工程と;前記音声入力工程で入力された音声を認識してテキストファイルに変換する音声認識工程と;前記音声認識工程で変換されたテキストファイルと、前記音声認識工程でテキストファイルに変換しなかった音声文書を含む音声ファイルとを混在させて送信する送信工程とを備える。

0015

このように構成すると、テキストファイルと音声ファイルとを混在させて送信する送信工程を備えるので、音声ファイルの全てまたは一部を、データ量の少ないテキストファイルで送信することができる。

0016

また請求項6に記載のように、請求項5に記載の音声文書送信方法では、音声入力工程で入力された音声を予め登録されている例文の識別子に変換する例文識別工程を備え;前記送信工程は、さらに例文の識別子を混在させて送信する。

0017

このように構成すると、例文識別工程を備え、前記送信工程はさらに例文の識別子を混在させて送信するので、テキストファイルよりもさらに送信すべきデータ量を少なくすることが可能となる。

0018

また請求項7に記載のように、請求項5または請求項6に記載の音声文書送信方法では、前記音声認識工程は、前記音声のプロファイルを参照して音声を認識するように構成してもよい。ここで、音声のプロファイルは、入力された音声を分析して検出してもよいし、音声入力者が自分の性別、年齢等をキーボード等の入力装置で入力することによって検知してもよい。さらにプロファイルを、音声のテキストファイルと併せて送信する工程を備えてもよい。

0019

このように構成すると、音声のプロファイルを参照するように構成されているので、音声認識の精度が向上するし、プロファイルをテキストファイルと一緒に送信するときは、受信側でテキストファイルから音声ファイルを再現するときの再現性が向上する。

0020

前記目的を達成するために、請求項8に係る発明による音声文書送信装置の製造方法は、音声による文書を入力する音声入力処理と;前記音声入力処理で入力された音声を認識してテキストファイルに変換する音声認識処理と;前記音声認識処理で変換されたテキストファイルと、前記音声認識処理でテキストファイルに変換しなかった音声文書を含む音声ファイルとを混在させて送信する送信処理とを行うように;送信装置を制御するためのプログラムを、前記送信装置に提供して、音声文書送信装置として構成する。ここで、送信装置は典型的にはパソコン等のコンピュータであり、プログラムの提供は典型的にはインターネット等のネットワークを介して提供し、利用者ダウンロードさせることによって行う。

0021

このように構成すると、送信装置を制御するためのプログラムを、コンピュータ等の送信装置に例えばインターネット等の通信手段を介して提供するので、例えば汎用のコンピュータを音声文書送信装置として構成することができる。

0022

前記目的を達成するために、請求項9に係る発明による音声文書送信装置(音声電子メール送信装置)で読み取り可能な記録媒体は、音声による文書を入力する音声入力処理と;前記音声入力処理で入力された音声を認識してテキストファイルに変換する音声認識処理と;前記音声認識処理で変換されたテキストファイルと、前記音声認識処理でテキストファイルに変換しなかった音声文書を含む音声ファイルとを混在させて送信する送信処理とを行うように;音声文書送信装置を制御するためのプログラムを格納する。このように構成すると、記録媒体に格納されたプログラムを音声文書送信装置として用いる例えばパソコンにインストールすることによって、そのパソコンに音声文書送信装置としての所定の送信機能を持たせることができる。

0023

前記目的を達成するために、請求項10に係る発明による音声文書受信装置200は、いわゆる音声電子メール受信装置であり、例えば図2に示すように、テキストファイルを含む信号を受信する受信機構203と;受信装置203で受信した信号を解読する解読機構206と;解読機構206で解読したテキストファイルを音声に変換する音声化機構207を備える。

0024

このように構成すると、解読機構で解読したテキストファイルを音声に変換する音声化機構を備えるので、データ量の少ないテキストファイルで送信され受信された文書を音声で出力させることができる。

0025

ここで、音声化機構で変換された音声を音声として出力する出力装置201を備えてもよいが、出力装置201は、音声で出力する他、解読されたテキストファイルをそのままテキストで出力することができるように構成されていてもよい。このときは、好みに応じて音声で出力したり、テキスト文書で出力したり、出力形式を任意に選択できる。

0026

このとき、受信装置200で受信する信号は、例文の識別子を含んでいてもよく、さらに音声ファイルを含んでいてもよい。いずれにしても、出力は音声かテキストかのいずれか1つの型式に変換されてなされる。

0027

さらに、音声文書受信装置200は、音声文書送信装置100の機能を併せて備えていてもよく、このときは、音声文書送受信装置として使用することができる。通常は、送信者は立場を変えて受信者にもなり得るものである。したがって、端末装置としては、送信機能と受信機能とを兼ね備えるのが好ましい。

0028

前記目的を達成するために、請求項11に係る発明による音声文書受信方法は、請求項10に記載の音声文書受信装置を用いて、音声による文書を受信する。

0029

前記目的を達成するために、請求項12に係る発明による音声文書受信方法は、テキストファイルを含む信号を受信する受信工程と;前記受信工程で受信した信号を解読する解読工程と;前記解読工程で解読したテキストファイルを音声に変換する音声化工程とを備える。さらに音声化工程で変換された音声を音声として出力する音声出力工程を備えてもよい。受信工程で受信する信号は、例文の識別子を含んでいてもよく、さらに音声ファイルを含んでいてもよい。いずれにしても、出力は音声型式に変換してなされる。但し、音声で出力する他、解読されたテキストファイルをそのままテキストで出力するようにしてもよい。このときは、好みに応じて音声で出力したり、テキスト文書で出力したり、出力形式を任意に選択できる。

0030

前記目的を達成するために、請求項13に係る発明による音声文書受信装置200の製造方法は、テキストファイルを含む信号を受信する受信処理と;前記受信処理で受信した信号を解読する解読処理と;前記解読処理で解読した信号に含まれるテキストファイルを音声に変換する音声化処理とを行うように;受信装置を制御するためのプログラムを、前記受信装置に提供して、音声文書受信装置として構成する。ここで、受信装置は典型的にはパソコン等のコンピュータであり、プログラムの提供は典型的にはインターネット等のネットワークを介して提供し、利用者にダウンロードさせることによって行う。

0031

このように構成すると、受信装置を制御するためのプログラムを、コンピュータ等の受信装置に例えばインターネット等の通信手段を介して提供するので、例えば汎用のコンピュータを音声文書受信装置として構成することができる。

0032

前記目的を達成するために、請求項14に係る発明による音声文書受信装置(音声電子メール受信装置)で読み取り可能な記録媒体は、テキストファイルを含む信号を受信する受信処理と;前記受信処理で受信した信号を解読する解読処理と;前記解読処理で解読した信号に含まれるテキストファイルを音声に変換する音声化処理とを行うように;音声文書受信装置を制御するためのプログラムを格納する。このように構成すると、音声文書受信装置に、所定の受信機能を持たせることができる。

0033

前記目的を達成するために、請求項15に係る発明による音声文書中継装置300は、いわゆる音声電子メール中継装置であり、例えば図3に示すように、テキストファイルと音声ファイルとを含む信号を受信する受信機構307と;受信機構307で受信した信号中の音声ファイルをテキストファイルに変換する音声認識機構309と;受信機構307で受信したテキストファイルと音声認識機構309で変換したテキストファイルとを併せて送信するテキストファイル送信機構307とを備える。ここで、典型的には受信機構と送信機構としては、通信インターフェースとして、1つの機構ないし装置に両機能を備えたものを用いる。

0034

典型的には、受信した信号を、音声認識機構でテキストファイルに変換する前に信号を解読する解読機構303を備える。受信機構307で受信する信号は、例文の識別子を含んでいてもよい。このときは、例文の識別子あるいはテキスト化された例文のテキストファイルも併せて送信される。

0035

前記目的を達成するために、請求項16に記載の音声文書中継方法は、請求項15に記載の音声文書中継装置を用いて、音声による文書を中継する。

0036

前記目的を達成するために、請求項17に係る発明による音声文書中継方法は、いわゆる音声電子メール中継方法であり、テキストファイルと音声ファイルとを含む信号を受信する受信工程と;前記受信工程で受信した信号中の音声ファイルをテキストファイルに変換するテキスト化工程と;前記受信工程で受信したテキストファイルと前記テキスト化工程で変換したテキストファイルとを併せて送信するテキストファイル送信工程とを備える。

0037

このように構成すると、受信工程で受信した信号中の音声ファイルをテキストファイルに変換するテキスト化工程を備えるので、受信信号中に音声ファイルが含まれていても、それをテキスト化することが可能であり、受信工程で受信したテキストファイルと前記テキスト化工程で変換したテキストファイルとを併せて送信するテキストファイル送信工程を備えるので、これを受信する受信装置では音声ファイルを含まないテキストファイルを受信することが可能となる。したがって、比較的少ないデータ量を受信すればすむ。

発明を実施するための最良の形態

0038

以下、本発明の実施の形態について、図面を参照して説明する。なお、各図において互いに同一あるいは相当する部材には同一符号を付し、重複した説明は省略する。

0039

図1ブロック図を参照して、本発明による実施の形態である音声電子メールの送信装置の構成例を説明する。図1に示す送信装置は、インターネットなどのネットワークを介して音声電子メールを送信する音声文書送信装置100である。送信装置100は、専用の装置とするが、それに限らずIC(集積回路、LSIであってもよい)を備える携帯電話やパソコン等に組み込んだものであってもよい。ここで、音声文書送信装置というとき、文書とは一般に文字で人の思想をあらわしたものであるが、ここでは文字で表し得るものであればよく、必ずしも文字の形をとらなくてもよい。例えば文字を経由することなく、いきなり口頭の音声で表現されたものであってもよい。

0040

送信装置100は、送信者の音声を入力するための入力装置101と、入力した音声を再生したり、送信者に操作指示を表示したりするための出力装置102を持っている。入力装置101は、例えばマイクロフォンであり、出力装置102は、例えば音声による出力装置としてのスピーカー視覚的出力装置としてのディスプレイプリンターである。

0041

送信装置100は、さらに入力装置101と出力装置102を制御するI/Oインターフェース部103を具備している。また、ネットワークを介して、他の送信受信装置と接続して、電子メールを送受信する送信機構としての通信インターフェース部104を備えている。

0042

さらに、I/Oインターフェイス103及び通信インターフェイス104と接続され、メールの送受信や装置全体の制御を行う制御部105を備える。制御部105には、操作命令やその管理を行う操作指示機構106と、音声で入力されたメール文を認識し、ディクテーションして文書化し、テキストファイルを作成する音声認識機構107と、音声で入力されたメール文から音声ファイルを作成する音声ファイル作成機構108と、送信者の音声入力したキーワードをもとに、予め登録してある例文群から例文を設定する例文設定機構109と、1メール内に混在する、テキストファイル、音声ファイル、例文の3形式(3形式のうち1つから3つの形式)を、1つのパケットにまとめる送信パケット作成機構110が含まれる。

0043

制御部105には、さらに記憶部111が接続されている。記憶部111には、登録されている例文を各例文に対応する例文識別子に対応させて保管する例文DB(データベース)、および様々なタイプの人々(性別、年齢、出身地等)の音声データを蓄積し、データベース化した音声DB、および言語データを保有する言語DBを持っている。音声DBと言語DBは音声認識に必要なDB群である。例文識別子は、記号や文字による符号の他、アイコン、絵などの画像データであってもよい。例文設定機構では、設定された例文は識別子の形で送信パケットに乗せられる。ただし、これに限らずテキストファイルの形で乗せてもよい。

0044

送信装置100では、入力された音声ファイルは、音声認識機構107で出来る限りテキストファイルに変換するが、認識できない部分はそのまま音声ファイルとして送信パケットに乗せられる。

0045

図2のブロック図を参照して、音声電子メールの受信装置の構成例を説明する。図2に示す装置は、ネットワークを介して電子メールを受信する音声文書受信装置200である。受信装置200は、専用の装置とするが、それに限らずIC(集積回路、LSIであってもよい)を備える携帯電話やパソコン等に組み込んだものであってもよい。

0046

受信装置200は、受信したメールを音声で再生したり、受信者に操作指示を表示したりするための出力装置201を備えている。出力装置201は、例えば音声による出力装置としてのスピーカー、視覚的出力装置としてのディスプレイである。

0047

受信装置200は、さらに出力装置201を制御するI/Oインターフェース部202を具備している。また、ネットワークを介して、他の送信受信装置と接続して、電子メールを送受信する受信機構としての通信インターフェース部203を備えている。

0048

さらに、I/Oインターフェイス202及び通信インターフェイス203と接続され、メールの送受信や装置全体の制御を行う制御部204を備える。制御部204には、操作命令やその管理を行う操作指示機構205と、テキストファイル、音声ファイル、例文の3形式(3形式のうち1つから3つの形式)が混在する受信パケットを、各形式に分解し、それぞれを解読するパケット解読機構206と、受信したメール文を音声化する音声化機構207が含まれている。

0049

制御部204には、さらに記憶部208が接続されている。記憶部208には、登録されている例文を保管する例文DB、および様々なタイプの人々(性別、年齢、出身地等)の音声データを蓄積し、データベース化した音声DBを備えている。記憶部208中の例文DBと音声DBは、それぞれ送信装置側の記憶部111が備えている例文DBと音声DBとに対応する。あるいは同一内容のDBとする。したがって、受信側でテキストファイルまたは例文識別子を音声化したとき、送信側と同じ内容あるいは近い内容の音声とすることができる。

0050

図3のブロック図を参照して、音声電子メールの送信装置100と受信装置200の中継地点となる、音声電子メール送受信装置(中継装置)の構成例を説明する。図3に示す装置は、音声電子メール送受信の中継を行う音声文書中継装置300である。

0051

中継装置300は、パソコンやワークステーションによって構成される。中継装置300は、メールの送受信や装置全体の制御を行う制御部301を備えており、ここには以下のような機構が含まれている。先ず操作指示機構302は、操作命令やその管理を行う。パケット解読機構303は、テキストファイル、音声ファイル、例文の3形式のうち、1つから3つの形式が混在する受信パケットを各形式に分解する。音声認識機構304は、受信したパケットのうち、音声ファイルの部分(送信装置でディクテーションが不可能だった部分)をさらにディクテーションして文書化し、テキストファイルを作成する。

0052

ここでの音声認識機構304は、送信装置100内の音声認識機構107より性能が高く構成されている。したがって、送信装置100でテキストファイルに変換できなかった音声データもテキストデータに変換できる。送信パケット作成機構305は、1メール内に存在するテキストファイル、例文、あるいはどちらか一つを、再び一つのパケットにまとめる。

0053

また、制御部301には記憶部306が接続されており、ここには、様々なタイプの人々(性別、年齢、出身地等)の音声データを蓄積し、データベース化した音声DB、および言語データを保有する言語DBを持っている。記憶部306中の例文DBと音声DBは、受信装置200の場合で説明したのと同様に、それぞれ送信装置側の記憶部111、あるいは受信装置200が備えている例文DBと音声DBとに対応する。

0054

制御部301には、通信インターフェース部307が接続されており、中継装置300をネットワークに接続し、メールの送受信を行う。

0055

図4概念図を参照して、電子メール送信装置401、電子メール受信装置402及び電子メール送受信装置(中継装置)403の関係を説明する。これらの装置は、ネットワーク404を介して結ばれている。ネットワーク404は、例えばインターネットや電話回線などの公衆回線である。

0056

ここで、電子メール送信装置401と電子メール受信装置402とを結ぶルートには、ネットワーク404を介して各装置を直接結ぶルートと、電子メール送受信装置(中継装置)403を間に中継させるルートの二つが存在する。

0057

また、送信装置401と受信装置402は、それぞれ図1で説明した送信装置100と図2で説明した受信装置200のように、送信と受信を専門に行う別々の装置であるが、これに限らず、一つの装置内に送信装置100と受信装置200とが存在し、送信も受信も行えるようにした装置であってもよい。電子メール送受信装置(中継装置)403としては、例えば図3で説明した中継装置300を用いる。

0058

また、例えばパソコンに音声電子メール送信装置としての機能を持たせるプログラムを格納した、コンピュータ読み取り可能な記録媒体としての例えばFDCD−ROM405から、その中に格納されたプログラムをパソコンにインストールする。送信装置401となるべきパソコンには、記録媒体の駆動装置が搭載されている。

0059

同様に例えばパソコンに音声電子メール受信装置としての機能を持たせるプログラムを格納した、コンピュータ読み取り可能な記録媒体としての例えばFDやCD−ROM406から、その中に格納されたプログラムをパソコンにインストールする。受信装置402となるべきパソコンには、記録媒体の駆動装置が搭載されている。

0060

また記録媒体405、406でプログラムを提供する代わりに、電話回線やインターネット等のネット404を介してプログラムを提供者側サーバからインストールすることによって汎用のコンピュータを送信装置401または受信装置402または両者の機能を有する送受信装置として構成してもよい。

0061

次に、図5及び図6に示す一連フローチャートを参照して、電子メールの内容(文章)を音声入力し送信する際の処理の一例を説明する。送信者が、メールの入力を終了しない限り、以下ステップ501からの処理が開始される(ステップ500)。

0062

まず、送信者は、メール文を自分で入力するのか、あるいは予め登録されている例文の中から選択するのかを判断する(ステップ501)。自分で入力する場合は、メール文を音声入力する(ステップ502)。すると、送信装置内の音声認識機構107は、入力された音声の認識が可能かどうかを判断する(ステップ503)。音声認識可能の場合は、入力された音声をディクテーションし、テキストファイルを作成する(ステップ504)。

0063

作成したテキストファイルは、送信パケットに順次格納し(ステップ505)、ステップ500に戻る。また、音声認識不可能と判断した場合は、音声ファイル作成機構108が、その部分の音声ファイルを作成する(ステップ506)。作成した音声ファイルは、送信パケットに順次格納し(ステップ507)、ステップ500に戻る。

0064

また、ステップ501において、予め例文DBに登録してある例文を使ってメール文を作成すると判断した場合は、送信者は装置に対して例文選択を行うという命令発信する(ステップ508)。例文設定機構109は、この命令を受信し(ステップ509)、記憶部111内の例文DBに登録してある例文群を、ディスプレイ等の出力装置102に表示する(ステップ510)。

0065

送信者は、表示された情報を参考にするなどして、使いたい例文を識別する識別子(例文番号、例文に含まれる単語、キーワード等)を口頭で入力する(ステップ511)。すると、音声認識機構107は、入力された音声の認識が可能かどうかを判断する(ステップ512)。音声認識不可能と判断した場合は(ステップ512)、再入力を促すメッセージを表示し(ステップ513)、送信者にもう一度、例文識別子を口頭入力させる(ステップ511)。

0066

音声認識可能の場合は、音声入力された例文識別子を例文設定機構109へ送信する(ステップ514)。例文設定機構109は、この識別子から、例文を検索する(ステップ515)。該当する例文が存在しない場合は(ステップ516)、エラーメッセージを表示する(ステップ517)。該当する例文が存在した場合は(ステップ516)、その例文を表示または音声再生する(ステップ518)。

0067

送信者が、装置の選択した例文を確定すると(ステップ519)、確定された例文の識別番号を送信パケットに順次格納し(ステップ520)、ステップ500に戻る。送信者が確定しなかった場合は、例文設定機構は、別の例文を選択しなおす(ステップ515に戻る)。そして、送信者によるメール文の入力がすべて終了した時(ステップ500)、これまでの処理で作成された送信パケット(テキストファイル、音声ファイル、例文識別番号のうち、1つから3つの形式が混在するもの)を閉じ、完成させる(ステップ521)。

0068

図7画面表示例の図を参照して、送信装置100で送信メールを入力する処理を説明する。画面の例600は、メール文を自分で入力して作成するか、予め登録してある例文から選択して作成するかを、送信者が選択する画面の例である。

0069

送信者が、自分で入力する手段を選択した場合は、画面例601で示す入力画面が表示され、送信者の言葉(例:お元気ですか)が画面上に表示される。例文選択によってメールを作成する手段が選ばれた場合は、例文選択の画面が表示される。

0070

画面例602は、例文の種類の一覧を表示している例である。この例では、「1.配送日設定」の例文を選びたい送信者が、この項目の識別子となる言葉(1、配送日等)を発声している。

0071

画面例603は、続いて、「1.配送日設定」の例文群が表示されている画面である。この例で、送信者は、同様に選択したい例文の識別子(3、10または2月2日、午後等)を発声する。選択された例文で作成されたメール文が表示されている様子が画面例604である。すなわち、例文の中に具体的な日付や午前/午後の情報が織り込まれて「2月2日(火)に変更お願いします。」「時間帯指定希望します。」「希望時間は午後です。」のような文書が画面上に表示される。

0072

図8を参照して、この装置で送信されるパケットの形式の一例を説明する。パケットは、テキストファイル、音声ファイル、例文識別番号のうち、1つから3つの形式が混在するものである。パケット内の各ファイルは、パケット内での順番を表すシーケンスタグ、ファイルの種類(テキストファイルか、音声ファイルか、例文識別番号)を表すファイル種類タグ、ファイルの長さを表すファイル長タグに続いて格納されている。ファイルの長さは例えばバイト数で表される。シーケンスタグ、ファイル種類タグ、ファイル長タグ、ファイル(又は例文識別番号)で1セットになっており、これが1セットから複数セット存在して1パケットとなる。

0073

ここで、電子メール送受信装置が、入力された音声を認識する、あるいは認識できないと判断する方法の一例を示す。電子メール送信装置100は、様々なタイプの人(性別、年齢層、地域等)の音声をサンプリングしてデータベース化した音声DBと、言語データを保有する言語DBを、記憶部111内に保有している。音声認識機構107では、入力された声のデータと、音声DBのデータとの比較・マッチング、および、言語DBのデータを用いての言語解析を行うことによって、入力された音声が示す文章を確定して行く。この場合は、音声DBのデータと言語DBのデータを参照するので、音声認識精度が著しく向上する。

0074

以上のような方法で、図4の例で説明すれば、送信装置401で作成された電子メールのパケットは、ネットワーク404を介して、中継となる電子メール送受信装置(中継装置)403、あるいは最終目的地である受信装置402へと送信される。送信するパケットに、音声ファイル(送信装置では音声認識不可能だった部分)が含まれる場合は、送信装置401より高性能の音声認識機構を保有する中継装置403へ送信される。パケットに音声ファイルが含まれない場合は、中継装置403を介してもよいが、受信装置402へ直接送信されようにしてもよい。

0075

図9のフローチャートを参照して、音声ファイルを含むパケットを受信した電子メール送受信装置(中継装置)での処理の一例を、図3で説明した中継装置300の場合で説明する。中継装置300内のパケット解読機構303は、受信したパケットの中身について、一つずつ(1ファイル毎または、1例文識別番号毎)、ステップ801からの処理を繰り返す(ステップ800)。

0076

まず、パケットに格納されている1ファイル(または1例文識別番号)が音声ファイルなのか否かを判断する(ステップ801)。音声ファイルではない場合、つまりそれは、テキストファイルか例文識別子としての識別番号である。これらは、そのまま送信用パケットに格納され(ステップ802)、ステップ800に戻る。

0077

音声ファイルの場合は、音声認識機構304によってディクテーションされ、音声はテキストファイルに変換される(ステップ803)。そして、パケット作成機構305が、送信用パケットにこのテキストファイルを格納し(ステップ804)、ステップ800に戻る。そして、受信したパケットの中身をすべて検証し終わり、空になった時点で(ステップ800)、これまでの処理で作成された送信用パケット(テキストファイル、例文識別番号等の識別子のうち、1つから2つの形式が混在するもの)を閉じ、完成させる(ステップ805)。この後、このパケットは、最終目的地である電子メール受信装置200へ送信される。

0078

次に、図10及び図11に示す一連のフローチャートを参照して、電子メール受信装置200が電子メールのパケットを受信した際の処理の一例を説明する。ここで、最終目的地である受信装置200が受信した電子メールのパケットの中身は、テキストファイル、または例文識別番号、或いは両者の混在である。送信された音声ファイルは、中継装置300によってテキストファイルに変換されているからである。

0079

最初に、受信者は、受信した電子メールを音声で聞くか、目で見るか(例えば画面上で見るかプリンタ打ち出すか)を選択する(ステップ900)。音声で聞くと選択した場合の処理を、先ず以下に説明する。受信装置200内のパケット解読機構206は、受信したパケットの中身について、一つずつ(1ファイル毎または、1例文識別番号毎)、以下終了までの処理を繰り返す(ステップ901)。

0080

まず、パケットに格納されている1ファイル(または1例文識別番号)がテキストファイルなのか、例文識別番号なのかを判断する(ステップ902)。テキストファイルの場合は、音声化機構207がテキスト文を音声化し(ステップ905)、ステップ901に戻る。例文識別番号の場合は、例文識別番号をキーにして記憶部208中の例文DBから例文を呼び出し(ステップ903)、該当例文のテキストファイルを作成する(ステップ904)。そして、音声化機構207がテキストファイルのテキスト文(この場合は、例文)を音声化し(ステップ905)、ステップ901に戻る。このようにして、受信したパケットの中身をすべて音声化し終わり、空になった時点で(ステップ901)、処理は終了する。

0081

次に、ステップ900において、受信した電子メールを画面上で見ると選択した場合の処理を説明する。受信装置200内のパケット解読機構206は、受信したパケットの中身について、一つずつ(1ファイル毎または、1例文識別番号毎)、以下終了までの処理を繰り返す(ステップ906)。まず、パケットに格納されている1ファイル(または1例文識別番号)がテキストファイルなのか、例文識別番号なのかを判断する(ステップ907)。

0082

テキストファイルの場合は、ステップ906に戻る。例文識別番号の場合は、例文識別番号をキーにして例文DBより例文を呼び出し(ステップ908)、該当例文のテキストファイルを作成する(ステップ909)。そして、例文識別番号が格納してあった場所に、このテキストファイルを挿入し(ステップ910)、ステップ906に戻る。そして、受信したパケットの中身をすべて検証し終わった時点で(ステップ906)、出来あがったテキストファイルを画面に出力し(ステップ911)、処理は終了する。

0083

例文を送受信する方法については、図5図6(送信の場合)、図10図11(受信の場合)で示しているように例文識別番号を送受信し、送受信装置100、200内で例文のテキストファイルを作成して再生または表示する方法のほか、例文の内容をテキストファイル形式の形で送受信してもよい。

0084

この方法では、図6のステップ520において、送信パケットの中には例文のテキストファイルが格納される。このとき、送信されるパケットは、テキストファイルと音声ファイルの混在型となる。また、音声ファイルは中継装置300によって、全てテキストファイルに変換されるので、最終目的地の受信装置200に受信されるパケットの中身は、全てテキストファイル形式である。

0085

この場合の受信時の処理を、図12のフローチャートを参照して説明する。このフローは、図10図11で示されるフローチャートの一部が省略されたものである。まず受信者は、受信した電子メールを音声で聞くか、画面上で見るかを選択する(ステップ1000)。音声で聞くと選択した場合、音声化機構207がテキストファイルのテキスト文を音声化する(ステップ1001)。一方、画面上で見ると選択した場合は、テキストファイルを画面に出力させる(ステップ1002)。このように受信者の好みや必要に応じて出力形式をいずれかに選択することができる。

0086

図13及び図14の一連のフローチャートを参照して、送信者によって入力された音声をプロファイリングし(男性女性、子供、高齢者等)、受信装置200ではそのプロファイルにあった音声で音声化を行う場合の各装置の処理を説明する。図13図14のフローチャートで示すのは、送信装置100における処理の一例である。これは、図5図6に示したフローチャートとほぼ同様であるが、図5のステップ503からステップ505の処理を、ステップ1103からステップ1107に代替し、ステップ512からステップ514の処理を、ステップ1114からステップ1118に代替し、図6のステップ520をステップ1124に代替している。

0087

代替されたステップ1103からステップ1107の処理は以下の通りである。ステップ1103では、音声認識機構107が、口頭入力されたメール文が音声認識可能かどうか判断している。音声認識可能の場合、そのとき音声プロファイリングが終了していなければ(ステップ1104)、ここで音声プロファイリングを行う(ステップ1105)。

0088

すなわち、様々なタイプの人(性別、年齢層、地域等)の音声をサンプリングしてデータベース化した音声DBを参照しながら、入力された音声を性別や年齢層などに分類する。そして、入力されたメール文をディクテーションしテキストファイルを作成した後(ステップ1106)、送信パケットに、作成したテキストファイルと、プロファイル結果を格納する(ステップ1107)。

0089

また、ステップ1114から1118、及びステップ1124の処理もこれと同様である。ステップ1124では、選択された例文番号と、プロファイル結果を送信パケットに格納する処理を行っている。また、受信装置100における処理は、図10で示したフローチャートのステップ905を、「テキストファイルのテキスト文を音声プロファイルに基づいて音声化する」に代替したものとなる。

0090

音声プロファイリングは、音声DBを参照しながら、入力された音声を性別や年齢層などに分類する他、送信者が直接入力してもよく、このときは、入力音声を分析して分類する処理を省略でき、その分だけ処理速度を高くできる。

0091

送信パケットには、テキストファイルと共にプロファイル結果も格納されて送信されるので、それを受信した受信装置200では、プロファイリング結果を利用して音声の再生ができるので、音声の再現性が高くなる。中継装置の場合も、プロファイリング結果を利用して、テキスト化未了の音声ファイルをテキストに変換できるので、変換精度を高くすることができる。

0092

以上の実施の形態では、認識された音声を少なくともテキストファイルに変換して、音声ファイルと混在させて送信し、またこれを中継する場合、さらに例文識別子を混在させて送信し、またこれを中継する場合、テキストファイルを、あるいはテキストファイルと識別子を受信し、音声であるいはテキストで出力する場合で説明したが、さらにテキストファイルに画像ファイル組合せてもよい。このときはテキストファイルに、音声ファイル、例文識別子、画像ファイルの3つのうち少なくとも1つを混在させて送信し、中継し受信する。

0093

例えば「あけましておめでとうございます」と送信装置に音声で入力し、併せてキーボード、専用ボタン等の入力装置から、毛筆体で表示すべしの指示を入力する。次に「本年もどうぞよろしく」と音声で入力し、この文書については別途キーボードで画像表示指示の入力はしない。このような情報を含んだ信号を受信した受信装置は、「あけましておめでとうございます」の部分は、毛筆フォントあるいは毛筆画像イメージで画面に表示し、「本年もどうぞよろしく」の部分は、何の飾りもない標準文字のテキスト文書で表示する。このように構成すると、受信側では、送信者の意思に従って視覚的に変化に富んだ文書を表示することができる。

発明の効果

0094

以上のように本発明によれば、音声認識機構で変換されたテキストファイル文書と、音声認識機構でテキストファイルに変換しなかった音声文書を含む音声ファイルとを混在させて送信する送信機構を備えるので、音声ファイルの全てまたは一部を、データ量の圧縮されたテキストファイルで送信することができる、送信装置を提供することが可能となる。

図面の簡単な説明

0095

図1本発明の実施の形態である送信装置の構成例を示すブロック図である。
図2本発明の実施の形態である受信装置の構成例を示すブロック図である。
図3本発明の実施の形態である中継装置の構成例を示すブロック図である。
図4音声電子メール送信装置、受信装置、中継装置が、ネットワークを介して接続されている様子を示す概念図である。
図5音声電子メールを送信する際の処理の一例を示すフローチャートである。
図6図5続きを示すフローチャートである。
図7送信装置で送信音声電子メールを入力する処理で表示される画面の例を示す図である。
図8送信装置で送信されるパケットの形式の一例を示す図である。
図9音声電子メールの中継装置での処理の一例を示すフローチャートである。
図10受信装置が電子メールのパケットを受信した際の処理の一例を示すフローチャートである。
図11図10の続きを示すフローチャートである。
図12受信するパケットの中身が全てテキストファイルであるときの受信時の処理の一例を示すフローチャートである。
図13送信者の音声をプロファイリングし、受信装置でそのプロファイリングに基づいて音声化をする場合の、各装置の処理の一例を示すフローチャートである。
図14図13の続きを示すフローチャートである。

--

0096

100送信装置
101入力装置
102出力装置
103 I/Oインターフェイス
104通信インターフェイス
105 制御部
106操作指示機構
107音声認識機構
108音声ファイル作成機構
109例文設定機構
110送信パケット作成機構
111 記憶部
200受信装置
201 出力装置
202 I/Oインターフェイス
203 通信インターフェイス
204 制御部
205 操作指示機構
206パケット解読機構
207音声化機構
208 記憶部
300中継装置
301 制御部
302 操作指示機構
303 パケット解読機構
304 音声認識機構
305 パケット作成機構
306 記憶部
307 通信インターフェイス
401 音声電子メール送信装置
402 音声電子メール受信装置
403 音声電子メール中継装置

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ