図面 (/)

技術 情報配信方法、情報配信プログラム、情報配信プログラム記憶媒体および情報配信装置

出願人 株式会社日立製作所
発明者 弥生隆明松林忠孝飯島岐勇小川祐一平田佳大海老名明弘
出願日 2004年4月27日 (15年11ヶ月経過) 出願番号 2004-132005
公開日 2005年11月10日 (14年4ヶ月経過) 公開番号 2005-316615
状態 拒絶査定
技術分野 検索装置
主要キーワード 関心事項 適合性フィードバック 適合度算出 特徴文字列 特定性 ペナントレース オリンピック 選挙情報
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2005年11月10日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (15)

課題

長期間に渡り頻繁に発生している事象に関する文書情報の配信を妨げることなく、短期間にだけ発生する文書情報も配信することができるようにする。

解決手段

最新文書抽出プログラム116により、所定の期間以内に作成、更新または収集された文書情報を最新文書情報として抽出し、短期発生文書情報特徴文字列抽出プログラム117により、最新文書情報から短期発生文書情報特徴文字列を抽出し、短期発生文書情報配信プロファイルを生成する。そして、類似文書検索プログラム118により前記最新文書情報について、前記短期発生文書情報配信プロファイルに対する適合度を評価し、適合度が所定の適合度以上である最新文書情報を短期発生文書情報として抽出し、ユーザが指定した種文書によって生成された配信プロファイルに基づき抽出された文書情報と併せて、ユーザに配信するようにした。

概要

背景

インターネット上には、膨大な量の電子化文書(以下、「文書情報」と呼ぶ。)が存在する。そのため、その中から自分が関心のある事項について最新情報を収集しようとすると、検索するだけでも大きな労力を必要とする。そこで、ユーザが設定する配信条件に基づき、インターネット上の文書情報を自動的に収集し、さらに、収集された文書情報の中からユーザが関心を持っている文書情報を選択し、選択された文書情報をユーザへ配信する情報配信システムに対するニーズが高まってきている。

このような情報配信システムの例が、特許文献1に開示されている。特許文献1によれば、情報配信システムは、まず、ユーザから種文書の入力を受ける。種文書とは、ユーザが配信を受けようとする文書情報の配信条件を生成するためのサンプル文書である。そこで、情報配信システムは、種文書から配信条件として用いるデータ(以下、「配信プロファイル」と呼ぶ)を生成する。そして、配信プロファイルに基づき、種文書と収集した文書情報との内容の類似性を示す指標である適合度を算出し、算出した適合度が所定値(以下、「適合度しきい値」と呼ぶ)を超える文書情報のみをユーザに配信する。この情報配信システムにより、ユーザは、種文書を入力するだけで、種文書に類似するプロファイルの文書情報の配信を受けることができる。

しかしながら、特許文献1に記載の情報配信システムには、短期間にだけ発生する事象(例えば、選挙情報オリンピックなどのイベント情報)に関する文書情報(以下、「短期発生文書情報」と呼ぶ)については、ユーザの欲求満足させるレベルの配信を行うことができないという問題がある。

種文書は、通常、ユーザが文書情報の配信を受けようとする関心事項について、長期間に渡って平均的に頻繁に発生している事象を示す文章キーワードを用いて表現される。従って、短期間にだけ発生する事象に関する文章やキーワードは、種文書の記載から漏れることが多い。そのため、短期発生文書情報は、種文書との適合度が低く評価され、配信の機会を失することになる。一方、短期発生文書情報は、ニュース性や話題性に富む情報を多く含んでおり、このような短期発生文書情報をも併せて配信して欲しいと思うのは、ユーザの自然な欲求である。従って、短期発生文書情報が配信されないとすれば、ユーザの欲求を満足させることができない。この例については後記する。

そこで、この情報配信システムにおいて、ユーザが短期発生文書情報の配信を受ける意図で種文書を修正すると、配信プロファイルが変更されるため、ユーザが長期間に渡り配信を受けようとしていた本来の文書情報の一部分または大部分が配信されなくなる。また、短期間にだけ発生する事象は、不定期な事象であり、場合によっては、突発的な事象でもあるので、そのような事象がある度にユーザが種文書を修正するのは、ユーザにとって大きな負担となる。

特許文献2には、文書情報を配信するたびに配信プロファイルを修正する適合性フィードバックを利用した情報配信システムの例が開示されている。適合性フィードバックは、文書情報に対してユーザが「所望する」文書情報であるか「所望しない」文書情報であるかの評価を行い、その評価に基づいて種文書の配信プロファイルを修正する技術である。従って、適合性フィードバックを適用すると、修正して生成されるプロファイルは、その時々においてインターネットに存在する文書によって、種文書の配信プロファイルが強調されたものになる。そのため、短期発生文書情報を抽出可能なプロファイルが生成されるものの、その一方で、長期間に渡り配信を受けようとしている文書情報が配信されなくなる問題は、依然として解決されない。
特開2000−339346号公報(段落0046〜段落0122、図1、図3〜図11)
特開2001−117937号公報(段落0015〜段落0140、図1、図4〜図21)

以下、特許文献1および特許文献2に記載されている情報配信システムにおける情報配信方法およびその問題点について、図13および図14を参照して具体的に説明する。ここで、図13は、特許文献1に記載されている情報配信システムにおける情報配信方法を示した図であり、図14は、特許文献2に記載されている情報配信システムにおける情報配信方法を示した図である。

まず、図13を用いて特許文献1に記載されている情報配信システムにおける情報配信方法について説明する。

図13において、ユーザ端末110は、種文書201、および、配信を希望する適合度しきい値202を登録する。本例では、ユーザ端末110は、「野球」に関する文書情報を所望しており、「野球:アルファリーグベータチームが…」という種文書201、および、適合度しきい値202を「60」点以上として登録している。

情報配信システム203は、まず、種文書201に出現する名詞文字列を抽出し、各文字列出現回数計数する。そして、その出現回数の多い文字列を、その文書の内容を特徴的に表すキーワード(以下、「特徴文字列」と呼ぶ)とみなして抽出し、その出現回数をもって、その重みとする。さらに、特徴文字列と重みの組の内、重みの大きい組を配信プロファイル204として登録する。本例の場合、重みの大きい3個の特徴文字列「野球」、「アルファリーグ」、「ベータチーム」が、それぞれの重み「50」、「40」、「30」と共に、配信プロファイル204として登録されている。

その後、情報配信システム203は、ネットワーク107から文書情報群205を収集し、配信プロファイル204に対して文書情報群205に含まれる個々の文書情報の適合度を算出する。適合度の算出は、例えば、式1に従って行われる。ここで、S(D)は配信プロファイルに対する文書情報Dの適合度であり、Tは特徴文字列の異なり数であり、Frq(i,D)は文書情報Dにおける特徴文字列iの出現頻度であり、w(i)は配信プロファイルの特徴文字列iに対する重みである。

本例の場合、「40」の重みを持つ特徴文字列「アルファリーグ」1個と「30」の重みを持つ特徴文字列「ベータチーム」1個とが含まれている文書1の適合度が「70」、「30」の重みを持つ特徴文字列「ベータチーム」1個のみが含まれている文書2の適合度が「30」、「50」の重みを持つ特徴文字列「野球」1個と「40」の重みを持つ特徴文字列「アルファリーグ」1個が含まれている文書3の適合度が「90」となる。ここでは、適合度しきい値202が「60」に設定されているため、適合度しきい値202の設定値「60」を上回る文書1と文書3とが、配信文書情報207としてユーザ端末110に配信される。

以上のように、ユーザは、種文書を入力すれば、その種文書から生成される配信プロファイルに対する適合度の高い文書情報が抽出され、その配信を受けることができる。しかしながら、1年に1回、特定の短期間にしか話題にならない「MVP」などの文字列は、配信プロファイルの特徴文字列から漏れるために、「MVP」を獲得した選手の話題に関する文書情報の配信が行われることはない。

次に、図14を用いて特許文献2に記載されている情報配信システムにおける情報配信方法について説明する。ただ、その配信方法は、適合性フィードバックを適用していることを除けば、特許文献1に記載されている情報配信システムにおける情報配信方法とほとんど同じなので、その相違点についてだけ説明する。

適合性フィードバックを適用した場合には、配信プロファイルの特徴文字列の重みを式2に従って修正する。ここで、w'(i)は特徴文字列iに対する修正後の重み、w(i)は修正前の重みであり、FP(j)は「所望する」と評価されたj番目の文書情報に含まれている特徴文字列iの出現頻度、FN(k)は「所望しない」と評価されたk番目の文書に含まれる特徴文字列iの出現頻度である。また、Pは「所望する」と評価された文書情報の数であり、Nは「所望しない」と評価された文書情報の数である。なお、α、βはパラメータであり、本例ではいずれも1としている。

図14において、本例では、ユーザ端末110が、「ベータチームのTOMがMVPを…」といった種文書301を所望したものとして、前記適合性フィードバックを用いて、配信プロファイルを修正することを想定する。

本例では、種文書301から特徴文字列として、「TOM」、「MVP」、「ベータチーム」が抽出され、それぞれの出現頻度が「80」、「70」、「25」として計数されるものとする。そして、配信プロファイルに前記特徴文字列が追加され、式2に従って前記特徴文字列の重みが修正される。この結果、特徴文字列「TOM」の重みは「80」、特徴文字列「MVP」の重みは「70」、特徴文字列「ベータチーム」の重みは「55」、特徴文字列「野球」の重みは「50」、特徴文字列「アルファリーグ」の重みは「40」となる。そして、重みの大きい3個の特徴文字列「TOM」、「MVP」、「ベータチーム」が、それぞれの重みと共に配信プロファイル302に登録されることになる。

その後、情報配信システム203は、ネットワーク107から文書情報群205を収集し、前記文情報群205に含まれる個々の文書情報の、配信プロファイル302に対する適合度を算出する。

その結果、適合度算出結果303では、「80」の重みを持つ特徴文字列「TOM」1個と「70」の重みを持つ特徴文字列「MVP」1個と「55」の重みを持つ特徴文字列「ベータチーム」1個が含まれている文書2の適合度が「205」、「55」の重みを持つ特徴文字列「ベータチーム」1個のみが含まれている文書1の適合度が「55」、特徴文字列を含まない文書3の適合度が「0」となる。

この場合、適合度しきい値202は「60」に設定されているため、文書2のみが配信文書情報304としてユーザ端末110に配信される。結果として、従来の配信プロファイルであれば配信されていた文書1、文書3がユーザに配信されないことになる。このように、短期発生文書情報の配信を行おうとすると、本来、長期に渡り配信していた文書情報の配信が行われなくなる。

概要

長期間に渡り頻繁に発生している事象に関する文書情報の配信を妨げることなく、短期間にだけ発生する文書情報も配信することができるようにする。最新文書抽出プログラム116により、所定の期間以内に作成、更新または収集された文書情報を最新文書情報として抽出し、短期発生文書情報特徴文字列抽出プログラム117により、最新文書情報から短期発生文書情報特徴文字列を抽出し、短期発生文書情報配信プロファイルを生成する。そして、類似文書検索プログラム118により前記最新文書情報について、前記短期発生文書情報配信プロファイルに対する適合度を評価し、適合度が所定の適合度以上である最新文書情報を短期発生文書情報として抽出し、ユーザが指定した種文書によって生成された配信プロファイルに基づき抽出された文書情報と併せて、ユーザに配信するようにした。

目的

本発明の課題は、ユーザが関心を持っている長期間に渡り頻繁に発生する事象に関する文書情報の配信を妨げることなく、短期発生文書情報を配信することを可能にする手段および方法を提供することにある。

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

文書情報を提供する情報提供サーバから文書情報を収集し、前記収集した文書情報の中から、ユーザ端末から入力される配信指示情報に応じた文書情報を抽出し、前記抽出した文書情報を前記ユーザ端末へ配信する情報配信装置における情報配信方法であって、前記ユーザ端末から入力される配信指示情報に基づき、配信すべき文書情報を検索するための配信プロファイルを生成する配信プロファイル生成ステップと、前記情報提供サーバから文書情報を収集する文書情報収集ステップと、前記文書情報について、前記配信プロファイルに対する適合度を評価する文書情報配信プロファイル適合度評価ステップと、前記文書情報のうち、抽出する時点を基準に所定の期間以内に作成、更新または収集された文書情報である最新文書情報を抽出する最新文書情報抽出ステップと、前記最新文書情報から、最新文書情報を特徴付け短期発生文書情報特徴文字列を抽出する短期発生文書情報特徴文字列抽出ステップと、前記短期発生文書情報特徴文字列から、配信すべき短期発生文書情報を検索するための短期発生文書情報配信プロファイルを生成する短期発生文書情報配信プロファイル生成ステップと、前記最新文書情報について、前記短期発生文書情報配信プロファイルに対する適合度を評価する短期発生文書情報配信プロファイル適合度評価ステップと、前記文書情報のうち、前記文書情報配信プロファイル適合度評価ステップにおいて前記配信プロファイルに対する適合度が所定の適合度以上であると評価された文書情報と、前記最新文書情報のうち、前記短期発生文書情報配信プロファイル適合度評価ステップにおいて前記短期発生文書情報配信プロファイルに対する適合度が所定の適合度以上であると評価された最新文書情報とを配信する文書情報・短期発生文書情報配信ステップとを行うことを特徴とする情報配信方法。

請求項2

前記短期発生文書情報配信プロファイル生成ステップにおける前記短期発生文書情報配信プロファイルの生成は、前記最新文書情報に含まれる特徴文字列出現回数時系列変化に基づいて行うことを特徴とする請求項1に記載の情報配信方法。

請求項3

文書情報・短期発生文書情報配信ステップにおける前記文書情報および前記短期発生文書情報の配信は、前記文書情報または前記短期発生文書情報の名称と、前記名称に関連付けられた前記文書情報または前記短期発生文書情報の所在場所を示す情報とを含んだ情報の配信であることを特徴とする請求項1または請求項2に記載の情報配信方法。

請求項4

文書情報・短期発生文書情報配信ステップにおける前記文書情報および前記短期発生文書情報の配信は、前記文書情報および前記短期発生文書情報に加えて前記短期発生文書情報配信プロファイルの内容を配信することを特徴とする請求項1ないし請求項3のいずれかの一項に記載の情報配信方法。

請求項5

請求項1ないし請求項4のいずれかの一項に記載の情報配信方法を、コンピュータに実行させるための情報配信プログラム

請求項6

請求項5に記載の情報配信プログラムをコンピュータ読み取り可能な記憶媒体に記憶したことを特徴とする情報配信プログラム記憶媒体。

請求項7

文書情報を提供する情報提供サーバから文書情報を収集し、前記収集した文書情報の中から、ユーザ端末から入力される配信指示情報に応じた文書情報を抽出し、前記抽出した文書情報を前記ユーザ端末へ配信する情報配信装置であって、前記ユーザ端末から入力される配信指示情報に基づき、配信すべき文書情報を検索するための配信プロファイルを生成する配信プロファイル生成手段と、前記情報配信サーバから文書情報を収集する文書情報収集手段と、前記文書情報について、前記配信プロファイルに対する適合度を評価する文書情報配信プロファイル適合度評価手段と、前記文書情報のうち、抽出する時点を基準に所定の期間以内に作成、更新または収集された文書情報である最新文書情報を抽出する最新文書情報抽出手段と、前記最新文書情報から、最新文書情報を特徴付ける短期発生文書情報特徴文字列を抽出する短期発生文書情報特徴文字列抽出手段と、前記短期発生文書情報特徴文字列から、配信すべき短期発生文書情報を検索するための短期発生文書情報配信プロファイルを生成する短期発生文書情報配信プロファイル生成手段と、前記最新文書情報について、前記短期発生文書情報配信プロファイルに対する適合度を評価する短期発生文書情報配信プロファイル適合度評価手段と、前記文書情報のうち、前記文書情報配信プロファイル適合度評価手段によって前記配信プロファイルに対する適合度が所定の適合度以上であると評価された文書情報と、前記最新文書情報のうち、前記短期発生文書情報配信プロファイル適合度評価手段によって前記短期発生文書情報配信プロファイルに対する適合度が所定の適合度以上であると評価された最新文書情報とを配信する文書情報・短期発生文書情報配信手段とを備えたことを特徴とする情報配信装置。

請求項8

前記短期発生文書情報配信プロファイル生成手段は、前記最新文書情報に含まれる特徴文字列の出現回数の時系列変化に基づいて前記短期発生文書情報配信プロファイルを生成することを特徴とする請求項7に記載の情報配信装置。

請求項9

文書情報・短期発生文書情報配信手段による前記文書情報および前記短期発生文書情報の配信は、前記文書情報または前記短期発生文書情報の名称と、前記名称に関連付けられた前記文書情報または前記短期発生文書情報の所在場所を示す情報とを含んだ情報の配信であることを特徴とする請求項7または請求項8に記載の情報配信装置。

請求項10

文書情報・短期発生文書情報配信手段による前記文書情報および前記短期発生文書情報の配信は、前記文書情報および前記短期発生文書情報に加えて前記短期発生文書情報配信プロファイルの内容を配信することを特徴とする請求項7ないし請求項9のいずれかの一項に記載の情報配信装置。

技術分野

0001

本発明は、インターネット上に存在する電子化文書を、ユーザがあらかじめ設定した配信条件検索し、その配信条件を満たす電子化文書をユーザに配信する情報配信方法情報配信プログラム、情報配信プログラム記憶媒体および情報配信装置に関する。

背景技術

0002

インターネット上には、膨大な量の電子化文書(以下、「文書情報」と呼ぶ。)が存在する。そのため、その中から自分が関心のある事項について最新情報を収集しようとすると、検索するだけでも大きな労力を必要とする。そこで、ユーザが設定する配信条件に基づき、インターネット上の文書情報を自動的に収集し、さらに、収集された文書情報の中からユーザが関心を持っている文書情報を選択し、選択された文書情報をユーザへ配信する情報配信システムに対するニーズが高まってきている。

0003

このような情報配信システムの例が、特許文献1に開示されている。特許文献1によれば、情報配信システムは、まず、ユーザから種文書の入力を受ける。種文書とは、ユーザが配信を受けようとする文書情報の配信条件を生成するためのサンプル文書である。そこで、情報配信システムは、種文書から配信条件として用いるデータ(以下、「配信プロファイル」と呼ぶ)を生成する。そして、配信プロファイルに基づき、種文書と収集した文書情報との内容の類似性を示す指標である適合度を算出し、算出した適合度が所定値(以下、「適合度しきい値」と呼ぶ)を超える文書情報のみをユーザに配信する。この情報配信システムにより、ユーザは、種文書を入力するだけで、種文書に類似するプロファイルの文書情報の配信を受けることができる。

0004

しかしながら、特許文献1に記載の情報配信システムには、短期間にだけ発生する事象(例えば、選挙情報オリンピックなどのイベント情報)に関する文書情報(以下、「短期発生文書情報」と呼ぶ)については、ユーザの欲求満足させるレベルの配信を行うことができないという問題がある。

0005

種文書は、通常、ユーザが文書情報の配信を受けようとする関心事項について、長期間に渡って平均的に頻繁に発生している事象を示す文章キーワードを用いて表現される。従って、短期間にだけ発生する事象に関する文章やキーワードは、種文書の記載から漏れることが多い。そのため、短期発生文書情報は、種文書との適合度が低く評価され、配信の機会を失することになる。一方、短期発生文書情報は、ニュース性や話題性に富む情報を多く含んでおり、このような短期発生文書情報をも併せて配信して欲しいと思うのは、ユーザの自然な欲求である。従って、短期発生文書情報が配信されないとすれば、ユーザの欲求を満足させることができない。この例については後記する。

0006

そこで、この情報配信システムにおいて、ユーザが短期発生文書情報の配信を受ける意図で種文書を修正すると、配信プロファイルが変更されるため、ユーザが長期間に渡り配信を受けようとしていた本来の文書情報の一部分または大部分が配信されなくなる。また、短期間にだけ発生する事象は、不定期な事象であり、場合によっては、突発的な事象でもあるので、そのような事象がある度にユーザが種文書を修正するのは、ユーザにとって大きな負担となる。

0007

特許文献2には、文書情報を配信するたびに配信プロファイルを修正する適合性フィードバックを利用した情報配信システムの例が開示されている。適合性フィードバックは、文書情報に対してユーザが「所望する」文書情報であるか「所望しない」文書情報であるかの評価を行い、その評価に基づいて種文書の配信プロファイルを修正する技術である。従って、適合性フィードバックを適用すると、修正して生成されるプロファイルは、その時々においてインターネットに存在する文書によって、種文書の配信プロファイルが強調されたものになる。そのため、短期発生文書情報を抽出可能なプロファイルが生成されるものの、その一方で、長期間に渡り配信を受けようとしている文書情報が配信されなくなる問題は、依然として解決されない。
特開2000−339346号公報(段落0046〜段落0122、図1図3図11
特開2001−117937号公報(段落0015〜段落0140、図1図4〜図21)

0008

以下、特許文献1および特許文献2に記載されている情報配信システムにおける情報配信方法およびその問題点について、図13および図14を参照して具体的に説明する。ここで、図13は、特許文献1に記載されている情報配信システムにおける情報配信方法を示した図であり、図14は、特許文献2に記載されている情報配信システムにおける情報配信方法を示した図である。

0009

まず、図13を用いて特許文献1に記載されている情報配信システムにおける情報配信方法について説明する。

0010

図13において、ユーザ端末110は、種文書201、および、配信を希望する適合度しきい値202を登録する。本例では、ユーザ端末110は、「野球」に関する文書情報を所望しており、「野球:アルファリーグベータチームが…」という種文書201、および、適合度しきい値202を「60」点以上として登録している。

0011

情報配信システム203は、まず、種文書201に出現する名詞文字列を抽出し、各文字列出現回数計数する。そして、その出現回数の多い文字列を、その文書の内容を特徴的に表すキーワード(以下、「特徴文字列」と呼ぶ)とみなして抽出し、その出現回数をもって、その重みとする。さらに、特徴文字列と重みの組の内、重みの大きい組を配信プロファイル204として登録する。本例の場合、重みの大きい3個の特徴文字列「野球」、「アルファリーグ」、「ベータチーム」が、それぞれの重み「50」、「40」、「30」と共に、配信プロファイル204として登録されている。

0012

その後、情報配信システム203は、ネットワーク107から文書情報群205を収集し、配信プロファイル204に対して文書情報群205に含まれる個々の文書情報の適合度を算出する。適合度の算出は、例えば、式1に従って行われる。ここで、S(D)は配信プロファイルに対する文書情報Dの適合度であり、Tは特徴文字列の異なり数であり、Frq(i,D)は文書情報Dにおける特徴文字列iの出現頻度であり、w(i)は配信プロファイルの特徴文字列iに対する重みである。

0013

0014

本例の場合、「40」の重みを持つ特徴文字列「アルファリーグ」1個と「30」の重みを持つ特徴文字列「ベータチーム」1個とが含まれている文書1の適合度が「70」、「30」の重みを持つ特徴文字列「ベータチーム」1個のみが含まれている文書2の適合度が「30」、「50」の重みを持つ特徴文字列「野球」1個と「40」の重みを持つ特徴文字列「アルファリーグ」1個が含まれている文書3の適合度が「90」となる。ここでは、適合度しきい値202が「60」に設定されているため、適合度しきい値202の設定値「60」を上回る文書1と文書3とが、配信文書情報207としてユーザ端末110に配信される。

0015

以上のように、ユーザは、種文書を入力すれば、その種文書から生成される配信プロファイルに対する適合度の高い文書情報が抽出され、その配信を受けることができる。しかしながら、1年に1回、特定の短期間にしか話題にならない「MVP」などの文字列は、配信プロファイルの特徴文字列から漏れるために、「MVP」を獲得した選手の話題に関する文書情報の配信が行われることはない。

0016

次に、図14を用いて特許文献2に記載されている情報配信システムにおける情報配信方法について説明する。ただ、その配信方法は、適合性フィードバックを適用していることを除けば、特許文献1に記載されている情報配信システムにおける情報配信方法とほとんど同じなので、その相違点についてだけ説明する。

0017

適合性フィードバックを適用した場合には、配信プロファイルの特徴文字列の重みを式2に従って修正する。ここで、w'(i)は特徴文字列iに対する修正後の重み、w(i)は修正前の重みであり、FP(j)は「所望する」と評価されたj番目の文書情報に含まれている特徴文字列iの出現頻度、FN(k)は「所望しない」と評価されたk番目の文書に含まれる特徴文字列iの出現頻度である。また、Pは「所望する」と評価された文書情報の数であり、Nは「所望しない」と評価された文書情報の数である。なお、α、βはパラメータであり、本例ではいずれも1としている。

0018

0019

図14において、本例では、ユーザ端末110が、「ベータチームのTOMがMVPを…」といった種文書301を所望したものとして、前記適合性フィードバックを用いて、配信プロファイルを修正することを想定する。

0020

本例では、種文書301から特徴文字列として、「TOM」、「MVP」、「ベータチーム」が抽出され、それぞれの出現頻度が「80」、「70」、「25」として計数されるものとする。そして、配信プロファイルに前記特徴文字列が追加され、式2に従って前記特徴文字列の重みが修正される。この結果、特徴文字列「TOM」の重みは「80」、特徴文字列「MVP」の重みは「70」、特徴文字列「ベータチーム」の重みは「55」、特徴文字列「野球」の重みは「50」、特徴文字列「アルファリーグ」の重みは「40」となる。そして、重みの大きい3個の特徴文字列「TOM」、「MVP」、「ベータチーム」が、それぞれの重みと共に配信プロファイル302に登録されることになる。

0021

その後、情報配信システム203は、ネットワーク107から文書情報群205を収集し、前記文情報群205に含まれる個々の文書情報の、配信プロファイル302に対する適合度を算出する。

0022

その結果、適合度算出結果303では、「80」の重みを持つ特徴文字列「TOM」1個と「70」の重みを持つ特徴文字列「MVP」1個と「55」の重みを持つ特徴文字列「ベータチーム」1個が含まれている文書2の適合度が「205」、「55」の重みを持つ特徴文字列「ベータチーム」1個のみが含まれている文書1の適合度が「55」、特徴文字列を含まない文書3の適合度が「0」となる。

0023

この場合、適合度しきい値202は「60」に設定されているため、文書2のみが配信文書情報304としてユーザ端末110に配信される。結果として、従来の配信プロファイルであれば配信されていた文書1、文書3がユーザに配信されないことになる。このように、短期発生文書情報の配信を行おうとすると、本来、長期に渡り配信していた文書情報の配信が行われなくなる。

発明が解決しようとする課題

0024

以上のように、従来技術においては、ユーザが短期発生文書情報を所望して配信プロファイルを修正すると、それまでは配信され、ユーザの関心事項となっている長期間に渡り頻繁に発生する事象に関する文書情報の配信が行われなくなるという問題がある。

0025

本発明の課題は、ユーザが関心を持っている長期間に渡り頻繁に発生する事象に関する文書情報の配信を妨げることなく、短期発生文書情報を配信することを可能にする手段および方法を提供することにある。

課題を解決するための手段

0026

前記課題を解決するため、本発明の情報配信方法では、従来技術同様に、ユーザ端末から入力される配信指示情報に基づき、配信すべき文書情報を検索するための配信プロファイルを生成する配信プロファイル生成ステップと、ネットワークを介して文書情報を収集する文書情報収集ステップと、収集された文書情報について、前記配信プロファイルに対する適合度を評価する文書情報配信プロファイル適合度評価ステップとを行った上に、さらに、前記収集された文書情報のうち、抽出する時点を基準に所定の期間以内に作成、更新または収集された文書情報である最新文書情報を抽出する最新文書情報抽出ステップと、その抽出された最新文書情報から、最新文書情報を特徴付け短期発生文書情報特徴文字列を抽出する短期発生文書情報特徴文字列抽出ステップと、その抽出された短期発生文書情報特徴文字列から、配信すべき短期発生文書情報を検索するための短期発生文書情報配信プロファイルを生成する短期発生文書情報配信プロファイル生成ステップと、最新文書情報について、短期発生文書情報配信プロファイルに対する適合度を評価する短期発生文書情報配信プロファイル適合度評価ステップと、文書情報配信プロファイル適合度評価ステップにおいて配信プロファイルに対する適合度が所定の適合度以上であると評価された文書情報と、短期発生文書情報配信プロファイル適合度評価ステップにおいて短期発生文書情報配信プロファイルに対する適合度が所定の適合度以上であると評価された最新文書情報とを配信する文書情報・短期発生文書情報配信ステップとを行うようにした。

0027

本発明は、また、以上の情報配信方法をコンピュータに実行させる情報配信プログラムであり、その情報配信プログラムを記憶した情報配信プログラム記憶媒体である。さらに、本発明は、以上の情報配信方法におけるステップを実行するための手段を備えた情報配信装置である。

0028

以上の本発明においては、配信プロファイル登録ステップと文書情報収集ステップと文書情報配信プロファイル適合度評価ステップとを行うことによって、ユーザが長期間に渡って配信を受けようとしている事象に関する文書情報を抽出することができる。また、最新文書情報抽出ステップと短期発生文書情報特徴文字列抽出ステップと短期発生文書情報配信プロファイル生成ステップとを行うことによって短期発生文書情報を配信するための短期発生文書情報配信プロファイルを生成することができ、その短期発生文書情報配信プロファイルに基づき、短期発生文書情報配信プロファイル適合度評価ステップにより配信するべき短期発生文書情報を抽出することができる。そして、このようにして抽出された文書情報および短期発生文書情報を、文書情報・短期発生文書情報配信ステップを行うことによってユーザに配信する。

0029

以上のように、本発明においては、ユーザが関心を持っている長期間に渡り頻繁に発生する事象に関する文書情報についての配信プロファイルとは独立した別個の短期発生文書情報配信プロファイルが作成される。そして、その短期発生文書情報配信プロファイルに基づき、短期発生文書情報が配信される。

発明の効果

0030

本発明により、ユーザが関心を持っている長期間に渡り頻繁に発生する事象に関する文書情報の配信が妨げられることなく、短期発生文書情報の配信が可能となる。従って、ユーザは、長期間に渡って頻繁に発生している事象に関する文書情報の配信と短期発生文書情報の配信とを同時に受けることができるようになる。

発明を実施するための最良の形態

0031

以下、本発明の実施形態について図面を用いて詳しく説明する。図1は、本発明を適用した情報配信システムの構成の例を示した図である。

0032

<情報配信システムの構成>
図1において、本発明を適用した情報配信システムは、情報配信装置である情報配信サーバ100、ネットワーク107、情報提供サーバ109およびユーザ端末110によって構成される。また、情報配信サーバ100は、ディスプレイ101、キーボード102、中央演算処理装置(CPU:Central Processing Unit)103、主メモリ104、フレキシブルディスクドライブ106、ハードディスクドライブ125およびそれらを結ぶバス108を備えたコンピュータによって構成される。

0033

情報提供サーバ109は、例えば、新聞社等の報道機関が設置した情報提供を目的としたサーバであり、HTTP(Hyper Text Transfer Protocol)サーバプログラム稼働し、例えば、ニュースデータ電子化した文書情報を公開している。図1では、情報提供サーバ109は、1つしか記載されていないが、複数あっても構わない。また、情報配信サーバ100は、ユーザが所望する文書情報を、ネットワーク107を介して情報提供サーバ109から取得し、電子メールによりユーザ端末110へ配信する。ユーザ端末110は、通常のパソコンで構成され、ユーザは、電子メールで配信された文書情報をユーザ端末110で閲覧することができる。また、ユーザは、ユーザ端末110においてHTML(Hyper Text Markup Language)文書等を表示するブラウザを利用することにより、情報提供サーバ109で公開されている文書情報を直接に閲覧することもできる。

0034

なお、本実施形態では、情報配信サーバ100が、情報提供サーバ109から文書情報を収集し、電子メールにより文書情報をユーザ端末110へ配信する構成としているが、情報提供サーバ109が、情報配信サーバ100の指示に従い、電子メールにより文書情報をユーザ端末110へ配信する構成としても構わない。また、本実施形態では、電子メールを用いて文書情報をユーザ端末110へ配信する構成としているが、情報配信サーバ100上でHTTPサーバプログラムを稼働させて、ユーザ端末110のブラウザを介してユーザ端末110の表示装置に配信された文書情報を表示させる構成としても構わないし、他の専用画面上に表示させる構成としても構わない。

0035

さらに、本実施形態では、情報提供サーバ109、ユーザ端末110がネットワーク107を介して接続される構成としているが、情報提供サーバ109が公開しているデータを、フレキシブルディスク105を介してやり取りするなど、他の媒体を用いてデータをやり取りする構成としてもかまわない。

0036

情報配信サーバ100は、システム制御プログラム111、配信プロファイル生成プログラム112、文書情報収集プログラム113、短期発生文書情報配信プロファイル生成プログラム114、文書情報・短期発生文書情報配信制御プログラム115およびその他のプログラムを保有している。ここで、短期発生文書情報配信プロファイル生成プログラム114は、最新文書情報抽出プログラム116および短期発生文書情報特徴文字列抽出プログラム117から構成される。また、文書情報・短期発生文書情報配信制御プログラム115は、類似文書検索プログラム118および文書情報配信プログラム119から構成される。なお、これらのプログラム112〜119は、情報配信プログラムである。

0037

これらのプログラム112〜119は、フレキシブルディスク105からフレキシブルディスクドライブ106を介して読み込まれ、主メモリ104に格納される。また、これらのプログラム112〜119を実行する主体は、CPU103である。なお、本実施形態では、これらのプログラムをフレキシブルディスク105から読み込む構成としているが、他のコンピュータ読み取り可能な記憶媒体(CD−ROMなど)から読み込む構成としても構わないし、ハードディスクドライブ125などの二次記憶装置にあらかじめ格納しておき、実行時に主メモリ104に読み込む構成としても構わない。また、主メモリ104には、配信プロファイル格納エリア120、短期発生文書情報配信プロファイル格納エリア121、文書情報格納エリア122、最新文書情報格納エリア123、ワークエリア124、配信済み文書情報格納エリア126が確保される。

0038

情報配信処理の手順>
次に、本実施形態に係る情報配信を行うための処理の手順について説明する。

0039

<1>システム制御プログラム111の処理手順
図2は、情報配信サーバ100におけるシステム制御プログラム111の処理の流れを示したPAD(Problem Analysis Diagram)図である。システム制御プログラム111は、配信プロファイルと短期発生文書情報配信プロファイルの管理、および、配信処理の制御を行う。

0040

システム制御プログラム111においてCPU103は、キーボード102から終了指示が入力されるまでステップS102からステップS108までの処理を繰り返す(S101)。そして、ユーザ端末110から種文書および適合度しきい値が入力されたと判定され場合には(S102でYes)、配信プロファイル生成プログラム112を起動し、配信プロファイル生成プログラム112により該当ユーザの配信プロファイルを生成する(S103)。その配信プロファイルの具体的な生成方法については後記する。

0041

次に、文書情報収集プログラム113を起動し(S104)、実行することにより、情報提供サーバ109から文書情報を収集し、収集した文書情報を文書情報格納エリア122に格納する。次に、短期発生文書情報配信プロファイル生成プログラム114を起動し(S105)、実行することにより、短期発生文書情報配信プロファイルを生成する。短期発生文書情報配信プロファイルの具体的な作成方法については後記する。次に、文書情報・短期発生文書情報配信制御プログラム115を起動し(S106)、実行することにより、文書情報の配信処理を行う。配信処理の詳細については後記する。

0042

次に、ステップS107においては、キーボード102から終了指示の入力があった場合には(S107でYes)、ステップS101で指示した繰り返し処理を終了する(S108)。

0043

なお、本実施形態では、文書情報格納エリア122の内容を、処理の都度クリアしない構成としているが、主メモリ使用量の削減のために、文書情報格納エリア122の内容を、処理の都度クリアする構成としても構わない。また、本実施形態では、文書情報収集プログラム113によって収集される文書情報の件数を制限していないが、主メモリ使用量の削減のために、収集される文書情報の件数を制限する構成としても構わない。また、本実施形態では、終了指示は、キーボード102から入力される構成としているが、ネットワーク107に接続された端末(図示せず)から入力される構成としても、一定時間が経過した後に終了する構成としても、他の契機で処理を終了する構成としても構わない。

0044

<2>配信プロファイル生成プログラム112の処理手順
図3は、情報配信サーバ100における配信プロファイル生成プログラム112の処理の流れを具体例で示した図である。

0045

本情報配信システムのユーザは、まず、ユーザ端末110から電子メールを介して種文書501と適合度しきい値502を入力する。本例では、種文書501として「野球:アルファリーグのベータチームが対抗試合を実施」、適合度しきい値502として「60」が入力されたものとする。

0046

配信プロファイル生成プログラム112においてCPU103は、指定された種文書501を、漢字カタカナなどの文字種境界で分割を行い、単一の文字種で構成される文字列の内、漢字、カタカナ、英字で構成されるものを特徴文字列として抽出し、前記特徴文字列の種文書内での出現回数を、前記特徴文字列の重みとして算出し、ユーザを識別するためのユーザIDと、前記指定された適合度しきい値502とを合わせて配信プロファイル格納エリア120に格納する。その結果、配信プロファイル格納エリア120には、ユーザID503、適合度しきい値504、前記種文書から抽出された特徴文字列505および重み506が組となって追加されることになる。

0047

なお、本実施形態では、文字種に基づいて特徴文字列を抽出する構成としたが、特開平6−301722号公報で開示されているような形態素解析に基づいて特徴文字列を抽出する構成としても構わないし、特開平10−326275号公報で開示されているような文字列の出現確率を用いて特徴文字列を抽出する構成であっても構わない。また、本実施形態では種文書から抽出する特徴文字列の種類数を制限していないが、メモリ使用量の削減のために種文書から抽出する特徴文字列の種類数を制限しても構わない。

0048

また、本実施形態では、特徴文字列の重み算出方法として、種文書内の特徴文字列の出現回数を用いる構成としたが、例えば、文書情報を蓄積するデータベースを設けておくことで、"Information Retrieval", William B. Frakes, Ricardo Baeza-Yates, Prentice Hall PTR, 1992, p.363〜p.391, "Ranking Algorithm" に開示されている特徴文字列の特定性を表す指標IDF(Inverted Document Frequency)を用い、前記データベース内において特定性の高い、すなわち、文書情報を特徴付ける特徴文字列に対して大きな重みを算出する構成としても構わないし、その他の指標を用いる構成としても構わない。

0049

なお、IDFは、式3によって定義される。式3において、IDF(i)は、特徴文字列iのIDFを示し、Nは前記データベース中の全文書情報の数を示す。また、n(i)は、前記データベースに特徴文字列iが出現する文書数を示す。

0050

0051

また、本実施形態では、電子メールを介して入力された種文書501に基づき配信プロファイルを生成する構成としているが、あらかじめ配信プロファイルをファイル上に作成しておき、所定のコマンドにより配信プロファイル格納エリア120に登録したり、専用画面を介して、配信プロファイルを登録したりするように、他の方法で配信プロファイルを生成しても構わない。また、本実施形態では、適合度しきい値をユーザが入力する構成としているが、システムで規定する構成としても構わない。

0052

<3>短期発生文書情報配信プロファイル生成プログラム114の処理手順
図4は、短期発生文書情報配信プロファイル生成プログラム114の処理手順を示すPAD図である。短期発生文書情報配信プロファイル生成プログラム114は、ネットワーク107を介して収集される文書情報から、短期発生文書情報配信プロファイル格納エリア121内に短期発生文書情報配信プロファイルを生成するプログラムである。

0053

図4において、CPU103は、まず、最新文書情報抽出プログラム116を起動する(S201)。すると、CPU103は、最新文書情報抽出プログラム116に従い、収集された文書情報の中から、文書情報の更新日時が、収集処理が行われている時刻から遡及する所定の期間に含まれる文書情報(以下、「最新文書情報」と呼ぶ)を抽出し、その最新文書情報を最新文書情報格納エリア123へ格納する。

0054

次に、CPU103は、短期発生文書情報特徴文字列抽出プログラム117を起動する(S202)。すると、CPU103は、短期発生文書情報特徴文字列抽出プログラム117に従い、最新文書情報格納エリア123に格納された最新文書情報から短期発生文書情報を特徴付けるキーワード(以下、「短期発生文書情報特徴文字列」と呼ぶ)を抽出し、その短期発生文書情報特徴文字列を短期発生文書情報配信プロファイル格納エリア121へ格納する。

0055

なお、短期発生文書情報配信プロファイル格納エリア121の構成は、図3に示した配信プロファイル格納エリア120とほぼ同様の構成となるが、特徴文字列の代わりに、短期発生文書情報特徴文字列が格納される点が異なる。

0056

<3.1>最新文書情報抽出処理の流れ
次に、最新文書情報抽出プログラム116の最新文書情報抽出処理の流れを、図5および図6を用いて説明する。ここで、図5は、最新文書情報抽出プログラム116が実行されるときの文書情報格納エリア122の構成例を示した図であり、図6は最新文書情報抽出プログラム116の処理の流れを示したPAD図である。

0057

本実施形態では、図5に示すように、最新文書情報抽出プログラム116の処理が行われるときには、文書情報収集プログラム113によって、情報提供サーバ109から収集された文書情報701が文書情報格納エリア122に蓄積される。そして、文書情報701は、文書情報を一意に識別するための文書ID702、本文703、文書情報の更新日時704によって管理される。

0058

図6の最新文書情報抽出プログラム116において、CPU103は、まず、最新文書情報格納エリア123の内容をクリアする(S301)。次に、文書情報収集プログラム113によって文書情報格納エリア122に格納されている文書情報の数だけ、ステップS303からステップS305までの処理を繰り返す(S302)。

0059

繰り返し処理においては、まず、処理対象となっている文書情報の更新日時を取得する(S303)。次に、更新日時が、あらかじめシステムで規定されている所定の期間に含まれる場合には(S304でYes)、その文書情報を最新文書情報として最新文書情報格納エリア123に追加する(S305)。ここで、あらかじめシステムで規定されている所定の期間とは、例えば、この処理を実行している日時の3日前の日時から実行日時までの期間とする。

0060

なお、本実施形態では、最新文書情報の抽出に、文書情報の更新日時を用いる構成としているが、文書情報の作成日時を用いる構成としても構わないし、文書情報の収集日時とするなど、他の抽出条件に基づいて、最新文書情報を抽出する構成としても構わない。また、本実施形態では、最新文書情報の判断基準となる期間をあらかじめシステムで規定する構成としているが、専用画面を設けて、ユーザに期間を設定させる構成としても構わない。

0061

また、本実施形態では、収集されたすべての文書情報から最新文書情報を抽出する構成としているが、短期発生文書情報特徴文字列抽出の精度を向上させるために、ユーザに配信された文書情報を抽出対象とする構成としても構わないし、適合度しきい値を上回らなかったために配信されなかった文書情報を抽出対象とする構成としても構わないし、前記二つの文書情報の両方を抽出対象とする構成としても構わない。

0062

<3.2>短期発生文書情報特徴文字列抽出処理の流れ
次に、短期発生文書情報特徴文字列抽出プログラム117による短期発生文書情報特徴文字列抽出処理の流れを、図7および図8を用いて説明する。ここで、図7は、短期発生文書情報特徴文字列抽出プログラム117の処理の流れを示したPAD図であり、図8は、短期発生文書情報特徴文字列抽出処理の流れを具体例で示した図である。

0063

図7において、まず、短期発生文書情報特徴文字列抽出プログラム117において、CPU103は、ワークエリア124の内容をクリアする(S401)。次に、最新文書情報抽出プログラム116の実行によって最新文書情報格納エリア123に格納されている最新文書情報の数だけ、ステップS403、ステップS404の処理を繰り返す(S402)。

0064

その繰り返し処理においては、処理対象となっている最新文書情報を、漢字やカタカナなどの文字種の境界で分割を行い、単一の文字種で構成される文字列の内、漢字、カタカナ、英字で構成される文字列を特徴文字列として抽出し、その特徴文字列の種文書内の出現回数を計数する(S403)。そして、その特徴文字列とその出現回数を、ワークエリア124に追加する(S404)。

0065

次に、ワークエリア124に格納されている特徴文字列の数だけ、ステップ406およびステップ407の処理を繰り返す(S405)。

0066

その繰り返し処理においては、処理対象となっている特徴文字列の出現回数が、あらかじめシステムで規定されている数を上回る場合には(S406)、その特徴文字列を短期発生文書情報特徴文字列として、その特徴文字列の出現回数と共に、短期発生文書情報配信プロファイル格納エリア121に追加する(S407)。

0067

そして、配信プロファイル格納エリア120に格納されている適合度しきい値を、短期発生文書情報配信プロファイル格納エリア121にコピーする(S408)。

0068

以上の短期発生文書情報特徴文字列抽出プログラム117の処理の流れを、図8によってさらに具体的に説明する。図8の短期発生文書情報特徴文字列抽出プログラム117において、CPU103は、最新文書情報抽出プログラム116が最新文書情報格納エリア123に格納したすべての最新文書情報から、特徴文字列を抽出し、その特徴文字列の出現回数を計数する。なお、ここでの特徴文字列の抽出方法は、配信プロファイル生成プログラム112において行われる特徴文字列の抽出方法と特に変わることはない。

0069

次に、特徴文字列の出現回数があらかじめシステムで規定されている数を上回る特徴文字列およびその特徴文字列の出現回数を、短期発生文書情報特徴文字列1403および重み1404として、短期発生文書情報配信プロファイル格納エリア121に格納する。なお、本例ではシステムで規定される数を「1」としている。

0070

また、配信プロファイル生成プログラム112の実行によって配信プロファイル格納エリア120に格納された適合度しきい値504を、短期発生文書情報用の適合度しきい値1402として、短期発生文書情報配信プロファイル格納エリア121にコピーする。

0071

なお、本実施形態では、短期発生文書情報特徴文字列の判断基準となる出現回数を、あらかじめシステムで規定する構成としているが、ユーザ端末110に専用画面を設けて、ユーザに出現回数を設定させる構成としても構わない。また、本実施形態では、出現回数が一定値を上回った特徴文字列全てを、短期発生文書情報特徴文字列と判断する構成としているが、配信プロファイルに登録済みの特徴文字列を、短期発生文書情報特徴文字列から除外する構成としても構わない。

0072

また、本実施形態では、短期発生文書情報配信プロファイル格納エリア121の適合度しきい値は、配信プロファイル格納エリア120に格納されている適合度しきい値をコピーすることによって、同じ値に設定されているが、ユーザに別途指定させる構成としても構わないし、システムで規定するなど、他の方法で短期発生文書情報配信プロファイルに対応付ける適合度しきい値を設定する構成としても構わない。

0073

また、本実施形態では、最新文書情報内における特徴文字列の出現回数によって、短期発生文書情報特徴文字列を抽出しているが、特徴文字列の出現回数の時系列変化に基づいて短期発生文書情報特徴文字列を抽出するようにしてもよい。図9は、特徴文字列の出現回数の時系列変化に基づいて短期発生文書情報特徴文字列を抽出する手順の例を示した図である。

0074

図9において、特徴文字列の出現回数を記憶したワークエリア124の内容(図7ステップS404参照)をクリアせずに、例えば、前日収集した文書情報群1501から抽出した特徴文字列の出現回数および今日収集した文書情報群1502から抽出した特徴文字列の出現回数をワークエリア124に記憶する。そして、その差が所定の数を上回った特徴文字列を、短期発生文書情報特徴文字列とし、その出現回数の差を重みとして当該特徴文字列を短期発生文書情報配信プロファイル格納エリア121に格納する。

0075

なお、以上のように特徴文字列の出現回数の時系列変化に基づいて短期発生文書情報特徴文字列を抽出すると、それに基づき構成される短期発生文書情報配信プロファイルにより、短期的に発生する事象でも特に突発的に発生した事象やニュース性の大きな事象に関する文書情報の抽出が可能となる。

0076

<4>文書情報・短期発生文書情報配信制御プログラム115の処理手順
次に、文書情報・短期発生文書情報配信制御プログラム115の処理の流れを、図10および図11を用いて説明する。図10は、配信済み文書情報格納エリア126の構成を示した図であり、図11は、文書情報・短期発生文書情報配信制御プログラム115の処理の流れを示すPAD図を示した図である。

0077

図10において、配信済み文書情報格納エリア126は、文書ID1001およびユーザID1002によって構成され、文書情報・短期発生文書情報配信制御プログラム115は、文書ID1001およびユーザID1002を対応付けて管理する。

0078

図11の文書情報・短期発生文書情報配信制御プログラム115において、CPU103は、まず、配信済み文書情報格納エリア126の内容をクリアする(S501)。次に、文書情報格納エリア122(図1参照)に格納されている文書情報の数だけ、ステップS503からステップS506までの処理を繰り返す(S502)。

0079

その繰り返し処理において、CPU103は、類似文書検索プログラム118を起動し、配信プロファイル格納エリア120に格納されている配信プロファイルに対して当該文書情報の適合度を算出する(S503)。その結果、適合度が適合度しきい値504を超える場合には(S504でYes)、文書情報配信プログラム119を起動し、電子メールを介して当該文書情報を配信プロファイルに関連付けられているユーザに配信し(S505)、当該文書情報の文書IDと、当該ユーザのユーザIDの組を配信済み文書情報格納エリア126に格納して蓄積する(S506)。

0080

次に、文書情報・短期発生文書情報配信制御プログラム115において、CPU103は、文書情報格納エリア122に格納されている文書情報の数だけ、ステップS508からステップS510までの処理を繰り返す(S507)。

0081

その繰り返し処理において、CPU103は、類似文書検索プログラム118を起動し、短期発生文書情報配信プロファイル格納エリア121に格納されている短期発生文書情報配信プロファイルに対して当該文書情報の適合度を算出する(S508)。その結果、適合度が短期発生文書情報配信プロファイルに対応付けられている適合度しきい値を超え、かつ、文書情報の文書IDとユーザIDの組とが配信済み文書情報格納エリア126に蓄積されていない場合、すなわち、当該文書情報がユーザに配信されていない場合には(S509でYes)、文書情報配信プログラム119を起動し、当該文書情報を短期発生文書情報配信プロファイルに対応付けられているユーザに電子メールを介して配信する(S510)。

0082

なお、本実施形態では、適合度を式1を用いて算出する構成としたが、他の算出式を用いる構成としても構わない。

0083

また、本実施形態では、配信プロファイルと文書情報の適合度算出処理を、短期発生文書情報配信プロファイルと文書情報の適合度算出処理よりも先に行い、配信プロファイルによって配信された文書情報を、短期発生文書情報配信プロファイルの配信結果から除外する構成としているが、処理順序を逆とし、短期発生文書情報配信プロファイルによって配信された文書情報を、配信プロファイルの配信結果から除外する構成としても構わない。

0084

また、本実施形態では、配信プロファイルによる配信結果と、短期発生文書情報配信プロファイルによる配信結果を、別々の電子メールで配信する構成としているが、同一の電子メールにまとめて配信する構成としても構わない。

0085

また、本実施形態では、配信プロファイルによる配信結果と、短期発生文書情報配信プロファイルによる配信結果を独立に生成する構成としているが、配信プロファイルによる配信結果の中から、短期発生文書情報を優先的に取り出してユーザに提示するために、配信プロファイルによる配信結果に含まれる文書情報を対象にして、短期発生文書情報配信プロファイルによる適合度算出処理を行い、短期発生文書情報配信プロファイルによる配信結果を生成する構成にしても構わないし、ユーザが気付かない文書情報を積極的に配信できるように、配信プロファイルによる配信結果に含まれない文書情報を対象にして、短期発生文書情報配信プロファイルによる適合度算出処理を行い、短期発生文書情報配信プロファイルによる配信結果を生成する構成にしても構わない。

0086

また、本実施形態では、配信プロファイルと短期発生文書情報配信プロファイルを別々に管理する構成としているが、短期発生文書情報配信プロファイルが生成されてから一定時間が経過した後、ユーザの着目している短期間にだけ発生していた事象が、長期間に渡って発生する事象に変化したと見なして、短期発生文書情報配信プロファイルの内容を配信プロファイルに追加する構成としても構わないし、配信プロファイルの内容をクリアして、短期発生文書情報配信プロファイルの内容で置換する構成としても構わないし、その他の方法で配信プロファイルと短期発生文書情報配信プロファイルを結合する構成としても構わない。

0087

<配信処理の具体的な例>
最後に、図12および図1を参照して本実施形態における文書情報の配信処理の具体的な処理の流れについて説明する。図12は、本実施形態における文書情報の配信処理の具体的な処理の流れを纏めて示した図である。

0088

図12において、まず、システム制御プログラム111により、文書情報収集プログラム113が起動されると、情報提供サーバ109から文書情報1201が収集され、文書情報格納エリア122に格納される(S104)。本例では、文書情報1「TOM、MVPの喜びを語る…」、文書情報2「MVPをTOM選手が獲得…」、文書情報3「野球ペナントレース…」、文書情報4「野球アルファリーグ…」が格納されている。

0089

次に、短期発生文書情報配信プロファイル生成プログラム114で、最新文書情報抽出プログラム116が起動されると、文書情報の更新日付に基づいて最新文書情報が抽出され、最新文書情報格納エリア123に格納される(S305)。本例では、最新文書情報は処理の前日までに更新されたものとしており、文書情報1「TOM、MVPの喜びを語る…」、文書情報2「MVPをTOM選手が獲得…」が最新文書情報として、最新文書情報格納エリア123に格納されている。

0090

次に、短期発生文書情報配信プロファイル生成プログラム114で、短期発生文書情報特徴文字列抽出プログラム117が起動されると、最新文書情報から短期発生文書情報特徴文字列が抽出される(S407)。本例では、出現回数が2以上である場合に、短期発生文書情報特徴文字列と判定するものとしており、2回以上出現しているキーワード「TOM」、「MVP」が短期発生文書情報特徴文字列として抽出され、その短期発生文書情報特徴文字列の重みと共に、短期発生文書情報配信プロファイル格納エリア121に格納されている。

0091

次に、文書情報・短期発生文書情報配信制御プログラム115で、類似文書検索プログラム118が起動されると、配信プロファイル格納エリア120に格納されている配信プロファイルに対する適合度が算出される(S503)。算出された適合度が適合度しきい値以上の文書情報1202は、文書情報配信プログラム119によってユーザ端末110へと配信される(S505)。本例では、配信プロファイルに合致した文書情報3「野球ペナントレース…」、文書情報4「野球アルファリーグ…」がユーザ端末110に配信されている。

0092

次に、文書情報・短期発生文書情報配信制御プログラム115で、類似文書検索プログラム118が起動されると、短期発生文書情報配信プロファイル格納エリア121に格納された短期発生文書情報配信プロファイルに対する適合度が算出される(S508)。算出された適合度が適合度しきい値以上の文書情報1203は、文書情報配信プログラム119によってユーザ端末110へと配信される(S510)。本例では、短期発生文書情報配信プロファイルに合致した文書情報1「TOM、MVPの喜びを語る…」、文書情報2「MVPをTOM選手が獲得…」がユーザ端末110に配信されている。

0093

以上のように、本実施形態においては、収集される文書情報から最新文書情報が抽出され、その最新文書情報に基づき短期発生文書情報配信プロファイルが生成される。そして、ユーザが入力した種文書に基づく配信プロファイルとこの短期発生文書情報配信プロファイルに基づき、ユーザが配信を求めた長期間に渡り頻繁に発生している事象に関する文書情報と短期間にのみ発生する事象に関する短期発生文書情報とを同時に配信することができる。このとき、短期発生文書情報の配信によって、長期間に渡り頻繁に発生している事象に関する文書情報の配信が妨げられることはない。また、短期発生文書情報配信プロファイルの生成は、情報配信サーバ100において自動的に生成されるため、ユーザに余分な負担がかかることもない。

0094

なお、以上述べた実施形態では、文書情報および短期発生文書情報の配信は、抽出された文書情報および短期発生文書情報そのものをユーザ端末110に電子メールを用いて配信する構成としているが、抽出された文書情報および短期発生文書情報ごとに区別してその名称または概要の一覧を配信する構成としてもよい。この場合、配信される文書情報および短期発生文書情報の名称または概要の各々には、それらが所在するURL(Uniform Resource Locator)を付す。ユーザは、ユーザ端末110でブラウザを介してそのURLが示す情報配信サーバ100や情報提供サーバ109の文書情報または短期発生文書情報を閲覧することができる。

0095

このような文書情報の配信においては、電子メールの通信量が大幅に削減される。もっとも、ユーザが指定されたURLの文書情報を閲覧するときに、その文書情報をアクセスするための通信が発生するが、一般に、ユーザは、配信された文書情報をすべて閲覧するとは限らないので、全体としての通信量は、低減される。

0096

また、以上述べた実施形態では、短期発生文書情報配信プロファイルは、ユーザ端末110に配信されていないが、文書情報および短期発生文書情報に加えて短期発生文書情報配信プロファイルをユーザ端末110に配信する構成としてもよい。

0097

本実施形態においては、短期発生文書情報配信プロファイルは、ユーザが関与することなく、情報配信サーバ100内部で自動的に生成される。ユーザは、自分が知らない基準によって物事が行われる場合、不信または不安を感じるものであるが、短期発生文書情報配信プロファイルをユーザに提示することによって、その不信または不安を解消させることができる。

図面の簡単な説明

0098

本発明を適用した情報配信システムの構成の例を示した図である。
本発明の実施形態における情報配信サーバにおけるシステム制御プログラムの処理の流れを示したPAD図である。
本発明の実施形態における情報配信サーバにおける配信プロファイル生成プログラムの処理の流れを具体例で示した図である。
本発明の実施形態における短期発生文書情報配信プロファイル生成プログラムの処理手順を示すPAD図である。
本発明の実施形態における最新文書情報抽出プログラムが実行されるときの文書情報格納エリアの構成例を示した図である。
本発明の実施形態における最新文書情報抽出プログラムの処理の流れを示したPAD図である。
本発明の実施形態における短期発生文書情報特徴文字列抽出プログラムの処理の流れを示したPAD図である。
本発明の実施形態における短期発生文書情報特徴文字列抽出処理の流れを具体例で示した図である。
本発明の実施形態における変形例として、特徴文字列の出現回数の時系列変化に基づいて短期発生文書情報特徴文字列を抽出する手順の例を示した図である。
本発明の実施形態における配信済み文書情報格納エリアの構成を示した図である。
本発明の実施形態における文書情報・短期発生文書情報配信制御プログラムの処理の流れを示すPAD図を示した図である。
本実施形態における文書情報の配信処理の具体的な処理の流れを纏めて示した図である。
特許文献1に記載されている情報配信システムにおける情報配信方法を示した図である。
特許文献2に記載されている情報配信システムにおける情報配信方法を示した図である。

符号の説明

0099

100情報配信サーバ
101ディスプレイ
102キーボード
103 CPU
104主メモリ
105フレキシブルディスク
106フレキシブルディスクドライブ
107ネットワーク
108バス
109情報提供サーバ
110ユーザ端末
111システム制御プログラム
112配信プロファイル生成プログラム
113文書情報収集プログラム
114短期発生文書情報配信プロファイル生成プログラム
115短期発生文書情報配信制御プログラム
116最新文書情報抽出プログラム
117短期発生文書情報特徴文字列抽出プログラム
118類似文書検索プログラム
119文書情報配信プログラム
120 配信プロファイル格納エリア
121 短期発生文書情報配信プロファイル格納エリア
122 文書情報格納エリア
123 最新文書情報格納エリア
124ワークエリア
125ハードディスクドライブ
126配信済み文書情報格納エリア

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

  • 株式会社ソケッツの「 検索装置および方法」が 公開されました。( 2019/09/19)

    【課題】同一の感性ワードで加重的に絞り込み検索を行えるようにする。【解決手段】同一の感性ワードで加重的に絞り込み検索を行う場合、類似・関連ワード抽出部319が、感性ワードに類似・関連する別のワードを検... 詳細

  • ヤフー株式会社の「 情報処理装置、情報処理方法、及び情報処理プログラム」が 公開されました。( 2019/09/12)

    【課題】ユーザの移動の妨害に応じた適切な対応を可能にする。【解決手段】本願に係る情報処理装置は、取得部と、決定部とを有する。取得部は、ユーザの位置情報と、ユーザが位置するエリアにおいて発生する事象のう... 詳細

  • ヤフー株式会社の「 情報処理装置、情報処理方法、及び情報処理プログラム」が 公開されました。( 2019/09/12)

    【課題】類似のコンテンツを適切に抽出する。【解決手段】本願に係る情報処理装置は、取得部と、検索部とを有する。取得部は、複数のコンテンツの各々に対応する複数のノードが、複数のコンテンツの類似性に応じて連... 詳細

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ