図面 (/)

技術 音声再生装置及び発話支援装置

出願人 国立研究開発法人情報通信研究機構
発明者 村田真樹井佐原均
出願日 2005年2月18日 (13年6ヶ月経過) 出願番号 2005-042916
公開日 2006年8月31日 (12年0ヶ月経過) 公開番号 2006-227425
状態 特許登録済
技術分野 音声の分析・合成 文書処理装置 機械翻訳
主要キーワード 呈示ステップ 再現度 発音パターン 変形規則 音声波形情報 頻度計数 単語配列 発音規則
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2006年8月31日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (8)

課題

発話者音声合成発音困難な語句を、好適な言い換えによって表現し、聴衆への意思疎通を促すための音声再生装置発話支援装置を提供すること。

解決手段

発話支援装置1は、原稿テキストデータを装置内に取得する入力手段21、単語列を抽出する単語列抽出手段22、単語列を同義語データベース24と照合し、置き換え可能な置換候補単語列検索する置換候補単語列検索手段23、各単語列の発音の困難度を予め定量的に記録した発音困難度データベース26、置換前の単語列と置換候補の単語列とについて、発音困難度データベース26からそれぞれの発音困難度を取得し、発音困難度が最小の単語列を選択し置換する単語列置換手段25、口述用テキストを出力する出力手段12とを備える。

概要

背景

年生活の多くの場面で人工的に音声合成処理された音声にする機会が増えている。音質的にもかなり改善が進んでおり、特定の文言を出力する場合にはイントネーションなどを細かく定義することで聞き取りやすい音声出力が実現できる。

しかしながら、Webコンテンツの読み上げなど任意のテキストを入力して音声合成を行うと、依然として聞き取りにくく、正確に内容が伝わらない恐れがある。一方で、テキストに対して適切な抑揚をつけることなどによって聞き取りやすくするための研究も進んでいるが、音声合成処理に関しての処理負荷が大きく、高速再生する場合などに不向きな問題がある。

聞き手が聞き取りにくい別のケースとしては、外国語での発話時に、母国語との発音方法の違いから正確な発音が困難で、意思伝わりにくい場合がある。特に国際会議などにおける発表時には予め原稿を用意しているため、文法的な誤りが少なく、用語の選択も正確であるにも関わらず、発話者の発音が不適当な結果、発話内容聴衆に伝わらないことは多い。
外国語学習において周知のように、たとえば日本人英語のLとRを適切に区別して発音することは困難である。これは日本語においてLとRに対応する発音の区別がなく、いずれも「ラリルレロ」で発音していることに起因していると考えられる。

発音は訓練によって大きく是正することが可能であるものの、LとRの区別のようにいくつかの発音に関してはかなりの訓練を積まなければ適切に区別することはできない。通訳等、専門家でない者にとってこの負担は大きいものである。意思を明確に伝える観点からすると、必ずしも伝わりにくい単語を無理に用いて正確な発音を行うように訓練をせず、単にその単語を用いないようにすれば回避できる場合もある。

本件発明者らによる非特許文献1においては、入力された文章に対して変形部で変形の候補をあげ、評価部において変形の妥当性チェックし、もっとも妥当であると判断されたものに変形し、それを出力するシステムを提案している。
評価部で用いられる尺度として、言い換え語間での類似度や長さ、頻度等様々な尺度があることが紹介されている。

田真樹、井佐原均 「言い換え統一モデル尺度に基づく変形の利用」言語処理学会第7回年次大会ワークショップ論文集2001年

例えば、長さを評価部の尺度として、より短い言い換えに高い評価を与えれば、文章の圧縮を行うことができる。
また、頻度を尺度にして、より頻度の高い単語に言い換えるようにすると、難解な文章を平易な単語で表現するように言い換えることができる。

本件発明者らは、上記文献において発音しにくい単語をあまり使わない尺度というものを当該文献において示唆したが、いかなる尺度であるのか具体的な研究が進んでいなかった。そのため、該文献の時点では発音しにくい単語を原文から除去するのか、あるいはいずれかの単語に言い換えるのか、その場合どのように言い換えるのか、技術的な考察が行われておらず、願望を記載したものにとどまっていた。

上記技術は下記の特許文献1などによっても開示されている。該開示では、複数種類の言い換えが必要な文または文章を、目的とする文または文章に簡単に変換することができるシステムを提供している。
具体的には、変形処理部が、変換対象文を入力すると変形規則記憶部中の変形規則を用いて多くの変換の候補を生成する。評価処理部は、生成された変換の候補について、文字列を変形した結果が目的とするふさわしい変換であるかどうかを評価するための複数の評価尺度を用いて評価し、評価結果のよい表現の文字列を選択する。その評価の高い文字列を変換結果文として出力する。
評価尺度は、評価尺度選択部によって選択することができ、また選択した評価尺度の重要度は評価重要度設定部によって設定することができる。

特開2003-76687号公報

本件出願人以外による開示としては、下記特許文献2が挙げられる。該開示の技術は、単語・複合語を問わず、聞き取りにくい表現を音声による読み上げに適した表現に変換し得る自然言語処理方法を提供することを目的とした技術である。
具体的には、テキスト変換部の発音パターン抽出部が、発音規則テーブル内に該当する発音パターンが存在するかをサーチし、読み上げた際に聞きづらいと推定される部分を抽出する。次に、テキスト変換処理部が、テキスト変換規則テーブルを用いて、抽出された部分を、読み上げを前提としたテキストに変換する。文書音読する際の音の組み合わせという、新規な観点から広く聞きづらい表現をサーチするので、複合語単位の表現でも適切な表現に置換できる、としている。

特開2000-172289号公報

しかし、上記非特許文献1及び特許文献1は一般的な言い換え技術を開示したものであって、これらによって発音しにくい単語を簡便に置き換える手法が提供されたとは言えない。すなわち如何なる尺度を用いて、如何なる言い換えに対し、如何なる評価を行うのかが一切開示されていないため、単にLとRを含まない単語に置き換えることはできても、その置き換えの有効性や正確性を評価できない。
このような従来の方法では、機械的な用語の置き換え作業を行ったのと変わりがなく、好適な言い換えによる発話支援を実現できない問題がある。

また、特許文献2は、本技術は音声読み上げに関連した技術であるが、置換に際して主に助詞ポーズを挿入することで聞き取りやすくする技術を開示しており、音声の正確な再現自体が困難な場合に適用できるものではない。もちろん、外国語に適用しても大きな効果を得ることはできない。

概要

発話者や音声合成が発音困難な語句を、好適な言い換えによって表現し、聴衆への意思疎通を促すための音声再生装置や発話支援装置を提供すること。 発話支援装置1は、原稿テキストデータを装置内に取得する入力手段21、単語列を抽出する単語列抽出手段22、単語列を同義語データベース24と照合し、置き換え可能な置換候補単語列検索する置換候補単語列検索手段23、各単語列の発音の困難度を予め定量的に記録した発音困難度データベース26、置換前の単語列と置換候補の単語列とについて、発音困難度データベース26からそれぞれの発音困難度を取得し、発音困難度が最小の単語列を選択し置換する単語列置換手段25、口述用テキストを出力する出力手段12とを備える。

目的

上述した従来技術のように、従来公知の技術では外国語発話時において発音が困難な語句を言い換える技術は提供されておらず、とくに国際会議におけるプレゼンテーションや、その原稿作成時に置き換え候補となる語句をユーザに呈示できるようなシステムは実現することができなかった。
本発明は、発話者にとって発音が困難な語句を、好適な言い換えによって表現し、聴衆への意思疎通を促すための発話支援方法及び装置を提供することを目的とする。

効果

実績

技術文献被引用数
1件
牽制数
1件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

原稿テキストを入力すると、音声合成処理により音声を発生する音声再生装置であって、原稿テキストデータを装置内に取得する入力手段と、該原稿テキストデータから単語又は単語列(以下、単語列と呼ぶ)を抽出する単語列抽出手段と、単語列に対する同義語を備えた同義語データベースと、単語列抽出手段により抽出された単語列を、該同義語データベースと照合し、置き換え可能な置換候補単語列検索する置換候補単語列検索手段と、音声合成処理における音声再現の困難度を予め定量的に記録した音声再現困難度データベースと、置換前の単語列と置換候補の単語列とについて、音声再現困難度データベースからそれぞれの音声再現度困難度を取得し、該音声再現困難度が最小の単語列を選択し置換する単語列置換手段と、上記手段により単語列が置換された口述用テキストに基づいて音声合成処理を行う音声合成手段と、音声を出力する音声出力手段とを備えたことを特徴とする音声再生装置。

請求項2

前記音声再現困難度データベースが、単語列中の所定の文字又は発音記号の数に応じて困難度を定めたものであって、前記単語列置換手段が、抽出された単語列における該所定の文字又は発音記号の数を計数し、音声再現困難度データベースに定められた音声再現困難度の計算式に基づいて当該単語列の音声再現困難度を算出する請求項1に記載の音声再生装置。

請求項3

前記音声再現困難度データベースが、2つ以上の区別の困難な文字又は発音記号に関して、いずれかの所定の文字又は発音記号が単語列中に含まれる数、又はいずれかの所定の文字又は発音記号が単語列中の第1アクセントの音を構成する数、単語列中のいずれかの所定の文字又は発音記号を他方の文字又は発音記号に入れ替えたときに有意な単語列を構成する数、の少なくともいずれかの情報を備えると共に、それらの数に対して所定の重み付け値を定義する構成であって、前記単語列置換手段が、各構成する数に対して重み付け値を乗じ、その総和をとる計算を行う請求項1又は2に記載の音声再生装置。

請求項4

前記音声再生装置が、前記原稿テキストと同一言語のコーパスデータベースを備え、前記単語列置換手段が、該置換候補単語列及び、その前後k-gram(kは前後で同一又は異なる任意の数)の単語列との配列が、該コーパスデータベース中出現する頻度を計数する頻度計数部と、該頻度が所定値以上の時に、前記置換候補単語列の音声再現困難度が最小でかつ、該頻度が最多の置換候補単語列に置換する音声再現困難度比較置換部とを備えたことを特徴とする請求項1ないし3のいずれかに記載の音声再生装置。

請求項5

原稿テキスト中の発音困難な語句を置き換えて発話しやすい口述用テキストを出力する発話支援装置であって、原稿テキストデータを装置内に取得する入力手段と、該原稿テキストデータから単語又は単語列(以下、単語列と呼ぶ)を抽出する単語列抽出手段と、単語列に対する同義語句を備えた同義語データベースと、単語列抽出手段により抽出された単語列を、該同義語データベースと照合し、置き換え可能な置換候補単語列を検索する置換候補単語列検索手段と、各単語列の発音の困難度を予め定量的に記録した発音困難度データベースと、置換前の単語列と置換候補の単語列とについて、発音困難度データベースからそれぞれの発音困難度を取得し、該発音困難度が最小の単語列を選択し置換する単語列置換手段と、上記手段により単語列が置換された口述用テキストを出力する出力手段とを備えたことを特徴とする発話支援装置。

請求項6

前記発音困難度データベースが、単語列中の所定の文字又は発音記号の数に応じて困難度を定めたものであって、前記単語列置換手段が、抽出された単語列における該所定の文字又は発音記号の数を計数し、発音困難度データベースに定められた発音困難度の計算式に基づいて当該単語列の発音困難度を算出する請求項5に記載の発話支援装置。

請求項7

前記発音困難度データベースが、2つ以上の区別の困難な文字又は発音記号に関して、いずれかの所定の文字又は発音記号が単語列中に含まれる数、又はいずれかの所定の文字又は発音記号が単語列中の第1アクセントの音を構成する数、単語列中のいずれかの所定の文字又は発音記号を他方の文字又は発音記号に入れ替えたときに有意な単語列を構成する数、の少なくともいずれかの情報を備えると共に、それらの数に対して所定の重み付け値を定義する構成であって、前記単語列置換手段が、各構成する数に対して重み付け値を乗じ、その総和をとる計算を行う請求項5又は6に記載の発話支援装置。

請求項8

前記発話支援装置が、前記原稿テキストと同一言語のコーパスデータベースを備え、前記単語列置換手段が、該置換候補単語列及び、その前後k-gram(kは前後で同一又は異なる任意の数)の単語列との配列が、該コーパスデータベース中で出現する頻度を計数する頻度計数部と、該頻度が所定値以上の時に、前記置換候補単語列の発音困難度が最小でかつ、該頻度が最多の置換候補単語列に置換する発音困難度比較置換部とを備えたことを特徴とする請求項5ないし7のいずれかに記載の発話支援装置。

請求項9

原稿テキスト中の発音困難な語句を置き換えて発話しやすい口述用テキストを出力する発話支援方法であって、入力手段が、原稿テキストデータを装置内に取得する入力ステップ、単語列抽出手段が、該原稿テキストデータから単語又は単語列(以下、単語列と呼ぶ)を抽出する単語列抽出ステップ、単語列に対する同義語句を備えた同義語データベースを用いて置換候補単語列検索手段が、単語列抽出ステップで抽出された単語列を、該同義語データベースと照合し、置き換え可能な置換候補単語列を検索する置換候補単語列検索ステップ、各単語列の発音の困難度を予め定量的に記録した発音困難度データベースを用いて単語列置換手段が、置換前の単語列と置換候補の単語列とについて、発音困難度データベースからそれぞれの発音困難度を取得し、該発音困難度が最小の単語列を選択し置換する単語列置換ステップ、出力手段が、上記各ステップにより単語列が置換された口述用テキストを出力する出力ステップを少なくとも含むことを特徴とする発話支援方法。

請求項10

前記発音困難度データベースが、単語列中の所定の文字又は発音記号の数に応じて困難度を定めたものであって、前記単語列置換ステップにおいて、抽出された単語列における該所定の文字又は発音記号の数を計数し、発音困難度データベースに定められた発音困難度の計算式に基づいて当該単語列の発音困難度を算出する請求項9に記載の発話支援方法。

請求項11

前記発音困難度データベースが、2つ以上の区別の困難な文字又は発音記号に関して、いずれかの所定の文字又は発音記号が単語列中に含まれる数、又はいずれかの所定の文字又は発音記号が単語列中の第1アクセントの音を構成する数、単語列中のいずれかの所定の文字又は発音記号を他方の文字又は発音記号に入れ替えたときに有意な単語列を構成する数、の少なくともいずれかの情報を備えると共に、それらの数に対して所定の重み付け値を定義する構成であって、前記単語列置換ステップにおいて、各構成する数に対して重み付け値を乗じ、その総和をとる計算を行う請求項9又は10に記載の発話支援方法。

請求項12

前記発話支援方法の単語列置換ステップにおいて、前記原稿テキストと同一言語のコーパスデータベースを用い、単語列置換手段が、該置換候補単語列及び、その前後k-gram(kは前後で同一又は異なる任意の数)の単語列との配列が、該コーパスデータベース中で出現する頻度を計数し、該頻度が所定値以上の時に、前記置換候補単語列の発音困難度が最小でかつ、該頻度が最多の置換候補単語列に置換する請求項9ないし11のいずれかに記載の発話支援方法。

請求項13

ワードプロセッサプログラムと共に用いられ、原稿テキスト中の発音困難な語句を置き換えて発話しやすい口述用テキストを出力する発話支援プログラムであって、ワードプロセッサ処理手段において編集状態の原稿テキストデータを取得する原稿テキストデータ読み出しステップ、単語列抽出手段が、該原稿テキストデータから単語又は単語列(以下、単語列と呼ぶ)を抽出する単語列抽出ステップ、単語列に対する同義語句を備えた同義語データベースを用いて置換候補単語列検索手段が、単語列抽出ステップで抽出された単語列を、該同義語データベースと照合し、置き換え可能な置換候補単語列を検索する置換候補単語列検索ステップ、各単語列の発音の困難度を予め定量的に記録した発音困難度データベースを用いて単語列選択手段が、置換前の単語列と置換候補の単語列とについて、発音困難度データベースからそれぞれの発音困難度を取得し、該発音困難度が最小の単語列を選択する単語列選択ステップ、置換単語列呈示手段が、ワードプロセッサ処理手段において編集状態の原稿テキストデータと共に、単語列選択ステップで選択された置換する単語列を呈示し、ユーザに置換の有無の入力を促す置換単語列呈示ステップ、単語列置換手段が、ユーザの入力に応じて、単語列の置換を行う単語列置換ステップを少なくとも含むことを特徴とするワードプロセッサプログラムと共に用いられる発話支援プログラム。

請求項14

前記発音困難度データベースが、単語列中の所定の文字又は発音記号の数に応じて困難度を定めたものであって、前記置換単語列呈示ステップにおいて、抽出された単語列における該所定の文字又は発音記号の数を計数し、発音困難度データベースに定められた発音困難度の計算式に基づいて当該単語列の発音困難度を算出する請求項13に記載のワードプロセッサプログラムと共に用いられる発話支援プログラム。

請求項15

前記発音困難度データベースが、2つ以上の区別の困難な文字又は発音記号に関して、いずれかの所定の文字又は発音記号が単語列中に含まれる数、又はいずれかの所定の文字又は発音記号が単語列中の第1アクセントの音を構成する数、単語列中のいずれかの所定の文字又は発音記号を他方の文字又は発音記号に入れ替えたときに有意な単語列を構成する数、の少なくともいずれかの情報を備えると共に、それらの数に対して所定の重み付け値を定義する構成であって、前記置換単語列呈示ステップにおいて、各数に対して重み付け値を乗じ、その総和をとる計算を行う請求項13又は14に記載のワードプロセッサプログラムと共に用いられる発話支援プログラム。

請求項16

前記発話支援プログラムの置換単語列呈示ステップにおいて、前記原稿テキストと同一言語のコーパスデータベースを用い、置換単語列呈示手段が、該置換候補単語列及び、その前後k-gram(kは前後で同一又は異なる任意の数)の単語列との配列が、該コーパスデータベース中で出現する頻度を計数し、該頻度が所定値以上の時に、前記置換候補単語列の発音困難度が最小でかつ、該頻度が最多の置換候補単語列を呈示する請求項13ないし15のいずれかに記載のワードプロセッサプログラムと共に用いられる発話支援プログラム。

技術分野

0001

本発明は、言語処理技術に関するものであって、特に音声合成処理により聞き取りやすい語句を用いるように、あるいは外国語発話する際に発話者発音しやすい語句を用いるように原文を変換する方法に係るものである。

背景技術

0002

年生活の多くの場面で人工的に音声合成処理された音声にする機会が増えている。音質的にもかなり改善が進んでおり、特定の文言を出力する場合にはイントネーションなどを細かく定義することで聞き取りやすい音声出力が実現できる。

0003

しかしながら、Webコンテンツの読み上げなど任意のテキストを入力して音声合成を行うと、依然として聞き取りにくく、正確に内容が伝わらない恐れがある。一方で、テキストに対して適切な抑揚をつけることなどによって聞き取りやすくするための研究も進んでいるが、音声合成処理に関しての処理負荷が大きく、高速再生する場合などに不向きな問題がある。

0004

聞き手が聞き取りにくい別のケースとしては、外国語での発話時に、母国語との発音方法の違いから正確な発音が困難で、意思伝わりにくい場合がある。特に国際会議などにおける発表時には予め原稿を用意しているため、文法的な誤りが少なく、用語の選択も正確であるにも関わらず、発話者の発音が不適当な結果、発話内容聴衆に伝わらないことは多い。
外国語学習において周知のように、たとえば日本人英語のLとRを適切に区別して発音することは困難である。これは日本語においてLとRに対応する発音の区別がなく、いずれも「ラリルレロ」で発音していることに起因していると考えられる。

0005

発音は訓練によって大きく是正することが可能であるものの、LとRの区別のようにいくつかの発音に関してはかなりの訓練を積まなければ適切に区別することはできない。通訳等、専門家でない者にとってこの負担は大きいものである。意思を明確に伝える観点からすると、必ずしも伝わりにくい単語を無理に用いて正確な発音を行うように訓練をせず、単にその単語を用いないようにすれば回避できる場合もある。

0006

本件発明者らによる非特許文献1においては、入力された文章に対して変形部で変形の候補をあげ、評価部において変形の妥当性チェックし、もっとも妥当であると判断されたものに変形し、それを出力するシステムを提案している。
評価部で用いられる尺度として、言い換え語間での類似度や長さ、頻度等様々な尺度があることが紹介されている。

0007

田真樹、井佐原均 「言い換え統一モデル尺度に基づく変形の利用」言語処理学会第7回年次大会ワークショップ論文集2001年

0008

例えば、長さを評価部の尺度として、より短い言い換えに高い評価を与えれば、文章の圧縮を行うことができる。
また、頻度を尺度にして、より頻度の高い単語に言い換えるようにすると、難解な文章を平易な単語で表現するように言い換えることができる。

0009

本件発明者らは、上記文献において発音しにくい単語をあまり使わない尺度というものを当該文献において示唆したが、いかなる尺度であるのか具体的な研究が進んでいなかった。そのため、該文献の時点では発音しにくい単語を原文から除去するのか、あるいはいずれかの単語に言い換えるのか、その場合どのように言い換えるのか、技術的な考察が行われておらず、願望を記載したものにとどまっていた。

0010

上記技術は下記の特許文献1などによっても開示されている。該開示では、複数種類の言い換えが必要な文または文章を、目的とする文または文章に簡単に変換することができるシステムを提供している。
具体的には、変形処理部が、変換対象文を入力すると変形規則記憶部中の変形規則を用いて多くの変換の候補を生成する。評価処理部は、生成された変換の候補について、文字列を変形した結果が目的とするふさわしい変換であるかどうかを評価するための複数の評価尺度を用いて評価し、評価結果のよい表現の文字列を選択する。その評価の高い文字列を変換結果文として出力する。
評価尺度は、評価尺度選択部によって選択することができ、また選択した評価尺度の重要度は評価重要度設定部によって設定することができる。

0011

特開2003-76687号公報

0012

本件出願人以外による開示としては、下記特許文献2が挙げられる。該開示の技術は、単語・複合語を問わず、聞き取りにくい表現を音声による読み上げに適した表現に変換し得る自然言語処理方法を提供することを目的とした技術である。
具体的には、テキスト変換部の発音パターン抽出部が、発音規則テーブル内に該当する発音パターンが存在するかをサーチし、読み上げた際に聞きづらいと推定される部分を抽出する。次に、テキスト変換処理部が、テキスト変換規則テーブルを用いて、抽出された部分を、読み上げを前提としたテキストに変換する。文書音読する際の音の組み合わせという、新規な観点から広く聞きづらい表現をサーチするので、複合語単位の表現でも適切な表現に置換できる、としている。

0013

特開2000-172289号公報

0014

しかし、上記非特許文献1及び特許文献1は一般的な言い換え技術を開示したものであって、これらによって発音しにくい単語を簡便に置き換える手法が提供されたとは言えない。すなわち如何なる尺度を用いて、如何なる言い換えに対し、如何なる評価を行うのかが一切開示されていないため、単にLとRを含まない単語に置き換えることはできても、その置き換えの有効性や正確性を評価できない。
このような従来の方法では、機械的な用語の置き換え作業を行ったのと変わりがなく、好適な言い換えによる発話支援を実現できない問題がある。

0015

また、特許文献2は、本技術は音声読み上げに関連した技術であるが、置換に際して主に助詞ポーズを挿入することで聞き取りやすくする技術を開示しており、音声の正確な再現自体が困難な場合に適用できるものではない。もちろん、外国語に適用しても大きな効果を得ることはできない。

発明が解決しようとする課題

0016

上述した従来技術のように、従来公知の技術では外国語発話時において発音が困難な語句を言い換える技術は提供されておらず、とくに国際会議におけるプレゼンテーションや、その原稿作成時に置き換え候補となる語句をユーザに呈示できるようなシステムは実現することができなかった。
本発明は、発話者にとって発音が困難な語句を、好適な言い換えによって表現し、聴衆への意思疎通を促すための発話支援方法及び装置を提供することを目的とする。

課題を解決するための手段

0017

本発明は、上記の課題を解決するために、次のような発話支援装置を提供する。
すなわち、請求項1に係る発明は、原稿テキスト中の発音困難な語句を置き換えて発話しやすい口述用テキストを出力する発話支援装置を提供する。
該装置には、原稿テキストデータを装置内に取得する入力手段と、該原稿テキストデータから単語又は単語列(以下、単語列と呼ぶ)を抽出する単語列抽出手段を備える。
さらに、単語列に対する同義語句を備えた同義語データベース記憶媒体に格納し、単語列抽出手段により抽出された単語列を、該同義語データベースと照合し、置き換え可能な置換候補単語列検索する置換候補単語列検索手段を有する。
また、各単語列の発音の困難度を予め定量的に記録した発音困難度データベースを記憶媒体に格納し、置換前の単語列と置換候補の単語列とについて、発音困難度データベースからそれぞれの発音困難度を取得し、該発音困難度が最小の単語列を選択し置換する単語列置換手段と、上記手段により単語列が置換された口述用テキストを出力する出力手段とを備える。

0018

請求項2に記載の発明によると、上記の発音困難度データベースが、単語列中の所定の文字又は発音記号の数に応じて困難度を定めたものであって、単語列置換手段が、抽出された単語列における該所定の文字又は発音記号の数を計数し、発音困難度データベースに定められた発音困難度の計算式に基づいて当該単語列の発音困難度を算出することを特徴とする。

0019

請求項3に記載の発明によると、上記の発話支援装置が、前記原稿テキストと同一言語のコーパスデータベースを備え、単語列置換手段が、置換候補単語列及び、その前後k-gram(kは前後で同一又は異なる任意の数)の単語列との配列がコーパスデータベース中出現する頻度を計数する頻度計数部と、該頻度が所定値以上の時に、前記置換候補単語列の発音困難度が最小でかつ、該頻度が最多の置換候補単語列に置換する発音困難度比較置換部とを備える構成を提供することができる。

0020

請求項4に記載の発明によると、次のような発話支援方法を提供することもできる。該方法は、コンピュータ上で実行するプログラムにより提要してもよい。
すなわち、原稿テキスト中の発音困難な語句を置き換えて発話しやすい口述用テキストを出力する発話支援方法であって、入力手段が、原稿テキストデータを装置内に取得する入力ステップ、単語列抽出手段が、該原稿テキストデータから単語又は単語列(以下、単語列と呼ぶ)を抽出する単語列抽出ステップを有する。
そして、単語列に対する同義語句を備えた同義語データベースを用いて置換候補単語列検索手段が、単語列抽出ステップで抽出された単語列を、該同義語データベースと照合し、置き換え可能な置換候補単語列を検索する置換候補単語列検索ステップ、各単語列の発音の困難度を予め定量的に記録した発音困難度データベースを用いて単語列置換手段が、置換前の単語列と置換候補の単語列とについて、発音困難度データベースからそれぞれの発音困難度を取得し、該発音困難度が最小の単語列を選択し置換する単語列置換ステップ、出力手段が、上記各ステップにより単語列が置換された口述用テキストを出力する出力ステップを少なくとも含んだ発話支援方法を提供する。

0021

請求項5に記載の発明は、上記の発音困難度データベースが、単語列中の所定の文字又は発音記号の数に応じて困難度を定めたものであって、単語列置換ステップにおいて、抽出された単語列における該所定の文字又は発音記号の数を計数し、発音困難性データベースに定められた発音困難度の計算式に基づいて当該単語列の発音困難度を算出することを特徴とするものである。

0022

請求項6に記載の発明は、発話支援方法の単語列置換ステップにおいて、原稿テキストと同一言語のコーパスデータベースを用い、単語列置換手段が、該置換候補単語列及び、その前後k-gram(kは前後で同一又は異なる任意の数)の単語列との配列が、該コーパスデータベース中で出現する頻度を計数し、該頻度が所定値以上の時に、前記置換候補単語列の発音困難度が最小でかつ、該頻度が最多の置換候補単語列に置換する技術を提供する。

0023

請求項7に記載の発明は、上記の技術を特にワードプロセッサプログラム上の機能として付加することを提案するものである。
すなわち、ワードプロセッサプログラムと共に用いられ、原稿テキスト中の発音困難な語句を置き換えて発話しやすい口述用テキストを出力する発話支援プログラムを提供する。
そして、ワードプロセッサ処理手段において編集状態の原稿テキストデータを取得する原稿テキストデータ読み出しステップ、単語列抽出手段が、該原稿テキストデータから単語又は単語列(以下、単語列と呼ぶ)を抽出する単語列抽出ステップを有し、作成中の文書から単語列を抽出する。

0024

さらに、単語列に対する同義語句を備えた同義語データベースを用いて置換候補単語列検索手段が、単語列抽出ステップで抽出された単語列を、該同義語データベースと照合し、置き換え可能な置換候補単語列を検索する置換候補単語列検索ステップ、各単語列の発音の困難度を予め定量的に記録した発音困難度データベースを用いて単語列選択手段が、置換前の単語列と置換候補の単語列とについて、発音困難度データベースからそれぞれの発音困難度を取得し、該発音困難度が最小の単語列を選択する単語列選択ステップを有する。
その上で、置換単語列呈示手段が、ワードプロセッサ処理手段において編集状態の原稿テキストデータと共に、単語列選択ステップで選択された置換する単語列を呈示し、ユーザに置換の有無の入力を促す置換単語列呈示ステップ、単語列置換手段が、ユーザの入力に応じて、単語列の置換を行う単語列置換ステップを含んだワードプロセッサプログラムと共に用いられる発話支援プログラムを提供するものである。

0025

請求項8に記載の発明は、発音困難度データベースが、単語列中の所定の文字又は発音記号の数に応じて困難度を定めたものであって、置換単語列呈示ステップにおいて、抽出された単語列における該所定の文字又は発音記号の数を計数し、発音困難度データベースに定められた発音困難度の計算式に基づいて当該単語列の発音困難度を算出することを特徴とする。

0026

請求項9に記載の発明は、発話支援プログラムの置換単語列呈示ステップにおいて、原稿テキストと同一言語のコーパスデータベースを用い、置換単語列呈示手段が、置換候補単語列及び、その前後k-gram(kは前後で同一又は異なる任意の数)の単語列との配列が、該コーパスデータベース中で出現する頻度を計数し、該頻度が所定値以上の時に、前記置換候補単語列の発音困難度が最小でかつ、該頻度が最多の置換候補単語列を呈示することを特徴とする。

発明の効果

0027

以上の発明により次の効果を奏する。すなわち、同義語データベースから多くの置換候補を得ると共に、発音の困難性を定量的に定めた発音困難性データベースを参照することにより、置換の重要性数値化して評価し、最も適切な置換候補を選択することができる。
特に、前後の単語列との配列がコーパス中に出現するか否かを調べることによって、不自然な置換を行わないようにすることができる。

0028

また、請求項7ないし9に記載の発明のようにワードプロセッサプログラムと組み合わせて使用することにより、口述用の原稿を作成しながら、随時に発音のしにくい単語列の言い換え候補を呈示される構成を提供することができるので、効率的な発話支援に寄与する。

発明を実施するための最良の形態

0029

以下、本発明の実施形態を図面に示しながら説述する。なお、本発明の実施においては、以下に限定されることなく、任意に変形、応用等を行うことが可能である。
図1は本発明における発話支援装置(1)の構成図である。本装置(1)は周知のパーソナルコンピュータ等によって構成することが望ましい。これらには、演算処理テキスト処理を司るCPU(10)と共に、処理中のデータや、処理に用いるデータベースを格納するハードディスク(11)や、表示を行うディスプレイ、CPU(10)と協働するメモリ(13)などが備えられている。

0030

まず、本装置(1)に対して原稿テキスト(20)を入力する。原稿テキストは、プレゼンテーションなどで読み上げる為の原稿であり、資料論文などに基づいて作成される。これら原稿テキストは文法的、語句の用法などは誤っていないが、発音のしやすさなどは考慮せずに作成されたものである。

0031

そして、原稿テキスト取得部(21)が該テキストデータをCPU(10)内に入力する。この処理は通常はハードディスク(11)からのデータ読み出しなど一般的な処理である。
入力された原稿テキストは、次の単語列抽出部(22)で抽出処理される。
本実施例では原稿テキストとして英文の発表用原稿を例に挙げて以下説述する。

0032

英語やフランス語、韓国語などは、一般に分かち書きと呼ばれる単語毎空白空ける方法で記載される。実際の発音は隣接する単語間で融合した発音となる場合も多いが、原則的には空白で区切られた単語毎に発音が途切れる。
したがって、本発明のように発音に着目する場合、空白で区切られた単語を抽出するのが簡便であり合理的である。
単語列抽出部(22)は空白コードを参照しながらテキストデータから単語を抽出していく。その際、ハードディスクに辞書データなどを備えるか、後述する同義語データベースやコーパスに含まれる情報を用いて、複数の単語で1つの意味を持つ熟語などの単語列を抽出してもよい。

0033

もっとも本発明は、英語等の発話支援に限らず日本語を対象としてもよく、その場合には公知の形態素解析処理を用いて、日本語テキストデータから単語列を抽出してもよい。
形態素解析処理は周知のさまざまな手法を用いることができるが、例えば形態素解析プログラムであるJUMANを用いて形態素解析して、形態素列に分解することができる。なお、本発明の実施においては文法的に厳密な形態素解析は特に必要ではない。発音の単位毎に分割することが主な目的であるから、単に辞書データを参照して、記載される文字数の多い単語毎に抽出するといった方法でもよい。

0034

単語列抽出部(22)で抽出された単語列毎に、言い換えを行う必要があるか、必要がある場合には如何なる語句に言い換えるか、次の処理により決定する。
すなわち、置換候補単語列検索部(23)はハードディスク内(11)に格納された同義語データベース(24)を参照して、抽出単語列に同義語(置換候補単語列)があるか否か検索する。

0035

同義語データベース(24)として、本実施例では英語の同義語データベースであるWordNet2.0(非特許文献2)を用いた。
http://wordnet.princeton.edu/ ,Princeton University, Wordnet 2.0.2003年

0036

なお、英語の場合には動詞活用形名詞の複数形などについても同義語表現として抽出する必要があるため、上記同義語データベースにはこれらの情報も付加して用いている。

0037

そして検索の結果、置換候補単語列が存在する単語列は該候補と共に次の単語列置換部(25)に、それ以外の単語列はそのまま置換候補単語列検索部(23)から出力される。
単語列置換部(25)では置換候補単語列に言い換えを行うのが良いか、発音困難度データベース(26)を参照して演算により決定する。

0038

発音困難度データベース(26)には、図2に示すようなデータテーブルを備えている。すなわち、本データベースは発音の困難度を定量的に設定したものであって、単語列の有する特性に対して困難度を与える。
困難度は例えば欄(30)のようにrightという単語の困難度13と各単語に対して個別に設定しても良い。しかし、全ての発音困難な単語を抽出するのは膨大な作業を必要とするため、欄(31)〜(33)のように単語の特性から単語列置換部(25)で算出するのが望ましい。

0039

すなわち、単語列置換部(25)は抽出された単語列における所定の文字か、発音記号の数等を計数して、発音困難度データベース(26)に格納された計算式に基づいて単語列の発音困難度を算出する。
計算式は任意に設定することができるが、本実施例では文字・発音記号の数と、重み付け値乗算する簡便な手法を用いている。

0040

具体的に説述すると、第1段(31)では単語列中にL又はRの文字がいくつ含まれているかに着目したものであり、当該単語に対する困難度はその個数×1と定義する。例えばleftであれば困難度1と算出される。
次に、第2段(32)では、単語列中の第1アクセントの音にL又はRが含まれる個数に着目している。一般的に第1アクセントの発音は重要であり、母国語として聞き取る者はこの音及び全体の韻律で単語を判断することも多い。そこで、第1アクセントにL又はRが含まれた場合の困難度はその個数×5と定義する。上記の困難度に加算する方法をとると、leftの困難度は1+5=6となる。

0041

第3段(33)の定義は、単語列中のLとRを入れ替えたときに別な有意な単語列を構成するか否かに着目している。例えばrightという単語ではRとLとを入れ替えてもlightとなり、正確な発音を行わなければ両者を混同する可能性は高い。
そこで、この個数×7を困難度として定義する。以上によると、rightの困難度は、いずれの条件にも1個ずつ合致するため、1+5+7=13として定義される。

0042

該発音困難度データベース(26)の構成は母国語及び外国語の関係によって定義されるものであるから、例えば中国人向けの日本語発話用データベースというように、組み合わせに応じて用意するのが望ましい。このように装置(1)に対して「母国語」「発話言語」の2個の情報を与えると、複数の発音困難度データベースから、2個の情報に合致するデータベースを選択して用いることにより、多言語に対応する装置構成を提供してもよい。
また、発話者が特に発音が苦手な単語列を手動で追加して言い換えるように構成してもよい。

0043

単語列置換部(25)では、以上により原文から抽出された単語列と、その置換候補単語列の発音困難度を比較して、最も困難度が小さい単語列を選択する。置換候補単語列の1つが最小である場合には、抽出された単語列を置き換えし、口述用テキスト(27)として出力する。出力にはディスプレイ12でも良いし、ハードディスク(11)上に結果を格納してもよい。
なお、同義語データベース中に置換候補とならない単語列(置換するとかえってLとRが増える場合など)を予め含まないように除去してある場合には、置換候補単語列は必ず抽出された単語列よりも発音困難度が小さいので、発音困難度の比較は置換候補単語列間のみで行えばよい。

0044

本発明の最小限の構成は以上の通りであるが、第2実施例として言い換えの正確さを高める技術を次に説述する。
図3は上記単語列置換部(25)の追加実施形態を説明する説明図である。該単語列置換部(25)以外の構成は上記と同様である。
本実施例では、言い換えにより単語列を置換しても自然な文となっているか否かを判定することを可能にする。

0045

本処理には図4のようなフローを用いる。
まず抽出された単語列(50)に対して、置換候補単語列検索部(23)で置換候補単語列が抽出(51)されると、元の原稿テキストデータからその前後k-gramの単語列を抽出(52)する。これには前後k-gram抽出部(40)が作用する。
なお抽出するのは形態素が原則であるが、本実施例では空白で区切られた単語でよい。
kは定数であって、前後独立して任意に設定できるが、本実施例では前後とも2-gram(k=2)としている。

0046

さらに単語配列生成部(41)において、前節k-gram、置換候補単語列、後節k-gramと連続して並んだ配列を生成(53)する。
これにより、前後k-gramは同一で置換対象の単語列のみを入れ替えた配列が生成される。

0047

生成された配列について、出現頻度計数部(42)によりコーパス(43)中から同一の配列の出現頻度fb2を計数(54)する。
コーパスは周知のように文章とともにその品詞情報構文情報などを付したものである。出現頻度の計数を目的とするだけであれば、コーパスに限らず一定の文章量を有するテキストデータベースを用いてもよい。

0048

自然な文章となっているか否かを判定するために、計数された出現頻度fb2が1以上であるか確認(55)する。1つもない場合には不自然な言い回しになっていると判定して、次の単語列に進む。

0049

1以上の場合には、発音困難度算出比較部(44)において、発音困難度を算出する。これには前述と同様の方法を用いるが、本実施例では発音困難度データベース(26)に備えた情報の1つとして「母音が後に隣接して続くR又はLの個数」を情報として用いる。英語の母音としてはa,i,u,e,o,yがある。
これによると、「R+母音」「L+母音」が抽出された単語列及び該置換候補単語列に含まれる頻度fb1を求め(56)、その値が最小の置換候補単語列を選べばよい。これはすなわち、発音困難度が最小の単語列を選択したことに他ならない。

0050

もしfb1が最小の単語列が複数存在した場合、そのなかでコーパス中における配列の出現頻度fb2が最大のものを選択(57)すればよい。
この選択方法によれば、「R+母音」等の発音困難度が高い要素を含む単語列を極力置き換えることができると同時に、正しい外国語文中において出現頻度の大きな配列を抽出することができるので、自然な言い回しに寄与する。

0051

以上により置換する単語列を決定したら、次の抽出された単語列の処理に進む。そして、原稿テキストデータから抽出されたすべての単語列について処理を行った後に、口述用テキスト(27)を出力する。

0052

本実施例ではk=2と固定した場合で説明したがkを動的に変化させることで、より有意義な前後節との組み合わせを抽出して出現頻度を比較することもできる。すなわち、対象となる単語列から前節又は後節に向けて内容語(文章を特徴づける有意な単語)が1個出現するまでの各文節を抽出する。
これは、機能語だけの文脈から言い換えした表現がコーパス等に出現したとしても、必ずしもその言い換えが正しいと判断するのは困難であるが、内容語まで含めて比較することで、その判断をより正しく行えるからである。

0053

具体的にはハードディスク等に機能語辞書を備えておき、機能語辞書と一致しない単語(内容語)がm個(mは任意の数)現れるまでの単語k-gramを抽出する。このとき、mを例えば1、kの上限を例えば7と規定しておき、1〜7の間で動的に変化するようにしてもよい。
本構成によると、言い換えたものが自然な文になっているかの検証において、言い換えた表現の周りの表現として効果的に内容語を使用できるので、確実な言い換えに寄与することができる。

0054

また上記では、LとRなど特定の文字やその位置を条件としたが、本発明は発音を対象としているので、発音記号に基づいて置換を行ってもよい。
発音記号は表1に示すように母音及び子音が規定されており、さらにアクセントが表示される。これらの記号は辞書データにより簡単に単語から発音記号への置き換えが可能であり、原稿テキストを一旦発音記号の表記にCPU(10)の発音記号変換部(図示しない)で変換することができる。

0055

0056

そして、発音記号を参照して、[r][l]や、[r]に母音が続く場合の個数を計数することができる。このように発音記号を用いると、文字列だけでは発音が困難か区別の難しい語句であっても、明確に発音困難として抽出することができる。
発音記号を用いる場合にも、発音困難度データベースには発音記号に対する困難度をそれぞれ設定した情報を備えておけばよい。

0057

本発明は、別の実施例3として、ワードプロセッサプログラム(ワープロソフトと呼ぶ)上に本発明技術を搭載する構成で提供することもできる。
図5はそのブロック図であり、CPU(60)にはワープロを動作させる処理部であるワードプロセッサ処理部(61)を有している。ここでは公知のワープロソフトが動作し、テキストの編集、読み込み、書き出しなどを行うことができる。

0058

そして、ワープロソフト上で編集中の原稿テキスト(62)に対して、本発明による以下の処理部が発話支援動作を行う。すなわち、読出部(63)が原稿テキストを読み出し、単語列抽出部(64)が単語列を抽出する。上記と同様の動作である。
各単語列に対して置換候補単語列検索部(65)が同義語データベース(66)を用いて置換候補単語列の検索を行う。

0059

このとき、原稿テキストは必ずしも全文が完成している必要はなく、入力しながら随時以上の動作を行ってもよい。例えば、1文が入力される(ピリオドが打たれる)と、各処理が行われるようにしてもよい。

0060

そして、単語列選択部(67)では発音困難度データベース(68)を参照しながら置換するのに最適な単語列を選択する。本実施例では、選択した後に、置換単語列提示部(69)がユーザに対して置換を勧める単語列を呈示する。
呈示にはディスプレイ(70)を用いるのが簡便であり、例えばワープロソフト上の当該単語列上に重複して置換を勧める単語列を表示する。呈示と同時に、置換をするか否かをユーザに促す表示を行う。

0061

ユーザがキーボード(71)などによって承諾すると、単語列置換部(72)の作用により、ワープロソフト上で当該単語列が置換単語列に置換される。
以上の方法によると、ユーザがワープロソフト上で口述用のテキストをタイピングしながら随時に発音しにくい単語を呈示し、承諾動作だけで言い換えを行うことができる。
本発明のシステムを実施する際には情報量の豊富な同義語データベース・コーパス等を用いることが好ましいが、情報量が少なくともユーザに呈示して、ユーザがその都度判断する本実施例のシステムであれば、十分に利用性が高い。

0062

以上の装置による実施結果図6に示す。
"approach"を"way"に書き換えたり、"length"を"size"に書き換えるなど、発音しやすい単語に書き換えられることがわかる。一方で、現在のシステムでは微妙なニュアンスの違いを言い換えられない場合もある。これには同義語データベースの内容の見直しなどにより精度を高めることが考えられる。
また、第3実施例と同じように他の実施例でも候補をユーザに対して呈示し、ユーザが言い換えを行うかいなか判断するようにしてもよい。

0063

本発明は、上記技術を用いて音声再生装置を提供することもできる。
従来、音声合成処理技術が周知であり、音声合成手段により、テキストデータから音声波形を生成し、スピーカ等から音声再生する技術が知られている。この際、一部の発音について完全に再生することが難しく、聞き取りにくい場合がある。上記した特許文献2はこの点を解消することを目的としたものであり、助詞やポーズを補ったり、機械的に言い換えすることで解決を図っている。

0064

しかし、このような方法では画一的な言い換えだけが可能であり、言語特有の曖昧な規則に柔軟に対応して言い換えを行うことはできない。特に予め聞き取りにくいと想定されるすべての語句を登録しなければならないので、新規な語句は聞き取りにくいものであっても対応できない。
これに対して本発明の技術は、上述したように規則に基づいて発音しにくい(聞き取りにくい)か否かを判定しながら新しい語句にも対応できる。

0065

図7は本発明に係る音声再生装置(80)の構成図である。
原稿テキストデータ(81)をCPU(82)にテキストデータ入力手段(83)によって入力する。該テキストデータ入力部(83)はCPUにテキストを入力する様々な手段を総称したものであり、例えばキーボードなどの直接入力する手段や、磁気ディスクなどの読み出し手段、ネットワークからの情報取得手段などを含む。

0066

そして、単語列抽出部(84)で上記と同様に単語列を抽出し、置換候補単語列検索部(85)で同義語データベース(86)から置換候補単語列を検索する。
さらに、抽出された単語列と、置換候補の単語列との間で音声再現困難度データベース(87)を参照して、単語列置換部(88)で音声再現困難度を算出する。

0067

該音声再現困難度は、上記発音困難度と同様の構成であるが、データベースに含まれる内容は次の音声合成部(89)で音声合成を行う際に正確な合成が困難な音に係る情報である。
すなわち、日本語では50音における特定の音や、促音などを定義する。例えば、音声合成部(89)で促音が不得意として、促音「っ」に音声再現困難度が5と定義されていたとする。やや不得意な場合としてすべての濁音には音声再現困難度が1と定義されていたとする。
このとき、「さっそく」の語句について、同義語データベース(86)から「すぐに」が抽出される。「すぐに」の困難度は1つの濁音を含んで1と算出されるから、困難度が5の「さっそく」は「すぐに」に置き換えられる。

0068

音声合成部(89)では公知の音声合成技術によりテキストデータから音声波形情報を生成する。任意の文字列を出力する方法として規則合成テキスト音声合成の方式が知られている。
一例として原稿テキストデータが日本語テキストの場合を説明すると、単語列抽出部(84)において、公知の形態素解析技術や辞書との照合によって単語列を抽出し、さらにハードディスク(91)に蓄積した表音文字対応データベースに基づいて単語の読み及びアクセント(韻律情報)を定義する。

0069

これによって入力された日本語テキストは表音文字列に変換される。単語列置換部(88)ではここで定義されたアクセントを参考に、第1アクセントの場合に重み付けを行うなど、上記実施例と同様の演算を行うことができる。
そして、音声合成部(89)において表音文字列を音声波形に変換する。ハードディスク(91)内の波形辞書データベースから各音素波形を読み出し、音声波形を生成する。

0070

各音素の波形は、その音素の両側にどのような音素が来るか(音素コンテキスト) によって著しく異なる。そのため一般的に、同じ音素でも音素コンテキストが異なるものは異なる波形を用意している。どれだけ細かく音素コンテキストに対処するかは、合成音声明瞭度・滑らかさに大きくかかわる。なお、明瞭度とは、人間による音の聞き取り率(認識率)であり、本実施例における音声再現困難度データベースに相対する概念である。

0071

音声合成技術では、このような音素コンテキストに対して複雑な処理により対応する研究が進められていたが、音声合成部(89)における処理を軽快にするために、本発明ではあらかじめ単語列を置換するものである。
従って、音声合成部(89)にはすでに上記明瞭度が高まるようなテキストが与えられ、生成された音声波形は音声出力部(90)に入力される。

0072

音声出力部(90)では公知のサウンドカードなどで構成され音声波形から音響(アナログデータ)生成し出力する。出力にはCPU(80)と接続したスピーカ(92)を用いる。

0073

もちろん本装置では、英語等の外国語を再生する場合に、上記実施例と同様に聴衆が聴き分けにくい音を回避して出力することができる。たとえば、LとRが含まれる単語を減らすことで日本人にとって聴き取りにくい語句の使用を減少させることができる。
より一般的に発音記号で比較を行い、類似した発音を持つ発音記号を多く含む単語を言い換えることもできる。例えば類似した発音を持つ発音記号を予め音声再現困難度データベースに備えて困難度を設定することで、紛らわしい発音を多く含む単語列は言い換えるようにする。これによって、外国語に堪能でない聞き手に聴き取りやすい音声再生装置を提供することもできる。

0074

以上の音声再生装置によると、音声合成部(89)における処理を軽減することができると同時に、音素コンテキストに対する様々な波形を用意する必要がなくなる。特に、音声合成部で複数の言語を再生する場合に、あらかじめ各言語の各音声コンテキストと波形をすべて備えるのは情報量が莫大になる問題がある。
しかし、本発明では音声合成部(89)における発音の不得意な音についての情報(発音記号が望ましい)を与えておけば、複数の言語においても各言語の同義語データベースから単語列の置換を行うことで、明瞭度の高い音声再生を実現することができる。

図面の簡単な説明

0075

本発明の第1の実施形態に係る発話支援装置の構成図である。
発音困難度データベースの一例である。
本発明の第2の実施形態に係る単語列置換部の構成図である。
同、フローチャートである。
本発明の第3の実施形態に係るブロック図である。
本発明による支援結果を示す図である。
本発明の第3の実施形態に係る音声再生装置の構成図である。

符号の説明

0076

1発話支援装置
10 CPU
11ハードディスク
12ディスプレイ
13メモリ
20原稿テキスト
21 原稿テキスト取得部
22単語列抽出部
23置換候補単語列検索部
24同義語データベース
25 単語列置換部
26発音困難度データベース
27 口述用テキスト

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

新着 最近 公開された関連が強い 技術

  • 株式会社日立国際電気の「 音声通信システム」が 公開されました。( 2018/08/02)

    【課題・解決手段】音声通信システムは、音声情報ビット列の各ビットを誤った時の聴感上の影響の大きさである重要度に応じて分類し、重要度の高いビットのグループをコアレイヤとし、高くないビットのグループを拡張... 詳細

  • 日本電気株式会社の「 テーブル意味推定システム、方法およびプログラム」が 公開されました。( 2018/08/02)

    【課題・解決手段】学習手段71は、テーブルのカラムの意味とそのテーブルの意味とを含む学習データに基づいて、テーブルのカラムの意味とテーブルの意味との間の規則性を示すモデルを学習する。推定手段72は、入... 詳細

  • 楽天株式会社の「 検査装置、検査方法、記録媒体、及び、プログラム」が 公開されました。( 2018/07/19)

    【課題・解決手段】取得部(24)は、HTMLで記述された文書を検査用ブラウザに与えて、文書を画面に表示させることにより、文書が描画された画像を取得する。認識部(26)は、取得された画像を文字認識するこ... 詳細

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する挑戦したい社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ