図面 (/)

技術 ユーザ意図の有無に基づく検索キーワードの推薦

出願人 アリババ・グループ・ホールディング・リミテッド
発明者 ジュウ・リージュウ・シャオーン
出願日 2011年12月23日 (7年9ヶ月経過) 出願番号 2013-547593
公開日 2014年1月20日 (5年8ヶ月経過) 公開番号 2014-501422
状態 特許登録済
技術分野 検索装置
主要キーワード 高低順 調整増 因子パラメータ ファストフードレストラン 検索識別子 推薦値 品質因子 商品モデル
関連する未来課題
重要な関連分野

この項目の情報は公開日時点(2014年1月20日)のものです。
また、この項目は機械的に抽出しているため、正しく解析できていない場合があります

図面 (11)

解決手段

検索キーワード推薦は、ユーザによって入力された検索キーワードセットを受信し、明確に規定されていない意図に対応する複数の所定の単語と検索キーワードセットを比較することを含み、検索キーワードセットがユーザによって明確に規定された意図を示すか否かを判定し、検索キーワードセットが明確に規定された意図を示さないと判定された場合、推薦検索キーワードを取得するために第1の推薦方法を実行することを備え、第1の推薦方法は、複数の推薦方法から選択され、第1の推薦方法は、知識ベースの推薦方法、セッション相関ベースの方法、または、それらの組み合わせを含む。

概要

背景

既存の検索エンジンは、一般に、検索キーワード推薦機能を提供する。例えば、いくつかのウェブベースエンジンにおいて、ユーザが検索フィールドに検索キーワードを入力して「検索」ボタンクリックした後にシステムジャンプするページは、検索結果だけでなく、ユーザによって入力された検索キーワードに関連する検索エンジン推薦の他の検索キーワードまたは検索キーワードの組み合わせをも含む。または、ユーザが検索フィールドに検索キーワードを入力すると、ユーザが推薦検索キーワードを選択して検索を実行できるように、ユーザ入力検索キーワードに関連した推薦検索キーワードが、検索フィールドのプルダウンメニューにポップアップする。

検索キーワードを推薦するための既存のスキームは、一般に、検索ログに基づいている。ユーザによって入力された検索キーワードとより高い相関を有する検索ログ内の検索キーワードが、推薦検索キーワードとして機能する。基本的な原理な以下の通りである。

まず、検索ログが構築される。検索ログに含まれる検索キーワードは、通常、以下のソースを有する。すなわち、第1のソースはユーザによって検索フィールドに入力されたすべての検索キーワード、第2のソースは検索エンジンによって推薦された検索キーワードである。また、検索ログ内の検索キーワードに対応する重要パラメータの値が決定される。検索ログ内の検索キーワードに対応する重要パラメータの値は、主に以下の因子によって決定される。具体的には、各検索キーワードの重要パラメータの値は、すべての因子に加重和法を適用することによって決定されうる。

1.クリック因子、すなわち、検索キーワードの検索結果がユーザによってクリックされたことを示す記録があるか否か、クリック数、およびクリック順位。具体的には、ユーザが検索キーワードを用いて検索を実行しただけで、検索結果のウェブページリンクをクリックしなかった場合、この検索キーワードに対するクリック因子パラメータ値は比較的低くなり、例えば、この因子についての所定のパラメータ値は0である。ユーザが検索キーワードを用いて検索を実行した後に検索結果をクリックした場合、この検索キーワードに対するクリック因子パラメータ値は比較的高くなり、例えば、この因子についての所定のパラメータ値は、検索結果がクリックされた回数である。検索キーワードに対するクリック記録がある場合、クリック数が多いほど、その検索キーワードについてのクリックパラメータ値が高くなり、その結果、重要パラメータの加重和の値が高くなる。

2.検索キーワードの品質因子。検索キーワードの品質因子は、検索キーワード長、意味的語数、および、所定の検索キーワードセットにおける検索キーワードの包含/非包含を含む。検索キーワード長は、検索キーワードに含まれる文字数であり、すなわち、具体的には、異なる文字数に対応する因子パラメータ値である。例えば、長さ「2」の検索キーワードに対応する所定の因子パラメータ値は1であり、長さ「3」の検索キーワードに対応する所定の因子パラメータ値は0.8であり、長さ「4」の検索キーワードに対応する所定の因子パラメータ値は0.5である、など。「意味的用語数」とは、以下のようなものである。検索キーワードが単語分割処理を受けた後、それによって得られた意味的用語の数が、所定の閾値と比較される。検索キーワードに対応する意味的用語因子パラメータ値は、比較結果に基づいて決定される。所定の検索キーワードセットの例は、禁止単語セット、商品ブランド単語セット、および、特別な購入意欲単語セットである。検索キーワードに対応するパラメータ値は、比較された検索キーワードがこれらの所定の検索キーワードセット内のサンプル単語を含むか否かに基づいて、この因子について決定される。

検索キーワードを推薦する時、検索エンジンは、ユーザが検索フィールドに入力した検索キーワードを受信した後に、通常、検索ログに含まれる各検索キーワードに関して以下の工程を実行する。

1.検索ログに含まれる検索キーワードと、入力された検索キーワードとの間の類似度値を決定する。2つの検索キーワードの間の類似度を決定できる多くの具体的な方法がある。例えば、2つの検索キーワードの最長共通部分文字列に基づく方法が用いられてよい。次いで、決定された類似度値および検索ログに含まれる検索キーワードの重要パラメータ値に加重和法を用いることによって、検索ログに含まれる検索キーワードの推薦値を決定することができる。

2.対応する推薦値の高から低への順序に従って、検索ログに含まれる検索キーワードを順位付けて、最初のN個の検索キーワードをユーザに推薦されるキーワードとして選択する。

検索キーワードを推薦するための上述の検索ログベースのスキームの利点は、検索プロセスを完了させるまたは修正するという明確な意図を持つユーザを段階的に導く能力にある。例えば、ユーザによって入力された検索キーワードが「携帯電話」であるとする。検索キーワードを推薦するための上述の検索ログベースのスキームに従って推薦される最初の検索キーワードは、「Sブランドの携帯電話」である。ユーザが、さらに検索を実行するために、推薦された検索キーワード「Sブランドの携帯電話」をクリックした場合、かかる行動は、現行入力検索キーワードが「Sブランドの携帯電話」であるということと等価である。検索キーワードを推薦するための上述の検索ログベースのスキームに従って推薦される2番目の検索キーワードは、「Sブランドのスマートフォン」である、などと続く。

しかしながら、例えば、検索キーワードとして「代理店フランチャイズ」を入力したユーザなど、明らかな検索意図を持たないユーザの場合、上述したように連続的に絞り込んでいく推薦スキームでは、容易に要件を満たすことができない。推薦される検索キーワードは、しばしば、全体として、入力検索キーワードと意味的に同じであるか、あるいは、検索キーワードに他の限定詞を追加して形成された単語列である。さらに、推薦される検索キーワードは、しばしば、特定の分野に限定される。検索キーワード推薦は、しばしば、かかる検索用語には有効でない。つまり、推薦された検索キーワードが、ユーザによってクリックされることはまれである。さらに、検索エンジンサーバは、キーワードに関連した推薦を実行する際に、検索ログを取得し、類似度値の計算の実行し、順位付けなどの動作を実行する必要がある。その結果、検索エンジンサーバのシステムリソース占有されるが、それでも、推薦された関連キーワードは、ユーザの要求を満たすことができない。したがって、このアプローチは、検索エンジンサーバのシステムリソースを浪費し、処理効率下げる。

概要

検索キーワード推薦は、ユーザによって入力された検索キーワードセットを受信し、明確に規定されていない意に対応する複数の所定の単語と検索キーワードセットを比較することを含み、検索キーワードセットがユーザによって明確に規定された意を示すか否かを判定し、検索キーワードセットが明確に規定された意を示さないと判定された場合、推薦検索キーワードを取得するために第1の推薦方法を実行することを備え、第1の推薦方法は、複数の推薦方法から選択され、第1の推薦方法は、知識ベースの推薦方法、セッション相関ベースの方法、または、それらの組み合わせを含む。B

目的

既存の検索エンジンは、一般に、検索キーワードの推薦機能を提供する

効果

実績

技術文献被引用数
0件
牽制数
0件

この技術が所属する分野

(分野番号表示ON)※整理標準化データをもとに当社作成

ライセンス契約や譲渡などの可能性がある特許掲載中! 開放特許随時追加・更新中 詳しくはこちら

請求項1

方法であって、ユーザによって入力された検索キーワードセットを受信し、明確に規定されていない意図に対応する複数の所定の単語と前記検索キーワードセットを比較することを含み、前記検索キーワードセットが前記ユーザによって明確に規定された意図を示すか否かを判定し、前記検索キーワードセットが明確に規定された意図を示さないと判定された場合、推薦検索キーワードを取得するために第1の推薦方法を実行すること、を備え、前記第1の推薦方法は、複数の推薦方法から選択され、前記第1の推薦方法は、知識ベースの推薦方法、セッション相関ベースの方法、または、それらの組み合わせを含む、方法。

請求項2

請求項1に記載の方法であって、前記検索キーワードセットが明確に規定された意図を示すと判定された場合、さらに、さらなる推薦検索キーワードを取得するために第2の推薦方法を実行することを備える、方法。

請求項3

請求項2に記載の方法であって、前記第2の推薦方法は、検索ログベースの推薦方法を含む、方法。

請求項4

請求項1に記載の方法であって、前記第1の推薦方法は、少なくとも知識ベースの推薦方法およびセッション相関ベースの推薦方法の組み合わせを含み、前記知識ベースの推薦方法は、第1の割合の推薦キーワードに寄与し、前記セッション相関ベースの推薦方法は、第2の割合の推薦キーワードに寄与する、方法。

請求項5

請求項4に記載の方法であって、さらに、前記知識ベースの推薦方法の第1のエクスポージャフィードバック率および前記セッション相関ベースの推薦方法の第2のエクスポージャ−フィードバック率を記録し、将来受信される検索キーワードセットについて前記知識ベースの推薦方法が寄与する推薦キーワードの前記第1の割合、および、将来受信される検索キーワードセットについて前記セッション相関ベースの推薦方法が寄与する推薦キーワードの前記第2の割合を調整すること、を備える、方法。

請求項6

請求項1に記載の方法であって、前記知識ベースの推薦方法は、検索ログに基づいて複数の語彙項目セットを取得し、前記複数の語彙項目セットから、前記検索キーワードセットと最もマッチする1または複数の語彙項目を含む語彙項目セットを選択し、格納されたルールセットから被選択ルールを選択し、前記格納されたルールセット内の各ルールは語彙項目タイプの優先順位配列を含み、前記被選択ルールにおいて前記選択された語彙項目セットの語彙項目タイプは、対応する優先順位配列内の最初の項目であり、前記被選択ルールの前記優先順位配列内の2番目の語彙項目タイプを特定し、前記2番目の語彙項目タイプのセット内に存在すると共に、前記受信された検索キーワードセットと論理的に対応する語彙項目を、前記推薦検索キーワードの1つとして決定すること、を備える、方法。

請求項7

請求項6に記載の方法であって、前記複数の語彙項目セットは、複合タイプ語彙項目集合モノタイプ語彙項目セット、ブランドタイプ語彙項目セット、および、商品モデルタイプ語彙項目セットを含む、方法。

請求項8

請求項1に記載の方法であって、前記セッション相関ベースの推薦方法は、ユーザによる検索セッションに対応する検索キーワード列を格納し、前記受信された検索キーワードセットを含む前記格納された検索キーワード列において、前記受信された検索キーワードの後にリストされた複数の検索キーワードセットを特定し、前記複数の検索キーワードセットに基づいて、前記推薦検索キーワードを決定すること、を備える、方法。

請求項9

請求項8に記載の方法であって、前記推薦検索キーワードの決定は、様々なカテゴリの業界の語彙項目を有する予め格納されたセットに基づいて、前記検索キーワード列において前記入力検索キーワードの後にリストされた前記検索キーワードセットから、前記受信された検索キーワードと同じ業界カテゴリの検索キーワードセットを推薦検索キーワードとして選択することを含む、方法。

請求項10

請求項8に記載の方法であって、前記推薦検索キーワードの決定は、後にリストされた後続リスト検索キーワードセット全体の中に異なる後続リスト検索キーワードセットが出現する確率を計算し、前記確率に基づいて、出現する可能性が最も高い検索キーワードセットを推薦検索キーワードとして選択すること、を含む、方法。

請求項11

請求項1に記載の方法であって、さらに、予め格納された検索キーワードセットと、それらに対応する業界カテゴリに基づいて、前記受信された検索キーワードセットに対応する関連業界カテゴリを決定し、各関連業界カテゴリについて、前記受信された検索キーワードセットのクリック因子属性値を決定し、前記決定されたクリック因子属性値に少なくとも部分的に基づいて、前記受信された検索キーワードセットが前記関連業界カテゴリに属する確率を決定し、前記確率に基づいて、前記関連業界カテゴリに対応する推薦キーワードの数を決定すること、を備え、推薦検索キーワードを取得するための前記第1の推薦方法の実行は、前記関連業界カテゴリに対する推薦検索キーワードを決定することを含む、方法。

請求項12

請求項1に記載の方法であって、さらに、明確に規定された意図に対応する複数の所定の単語と共に前記検索キーワードセットを含む、方法。

請求項13

ステムであって、1または複数のプロセッサであって、ユーザによって入力された検索キーワードセットを受信し、明確に規定されていない意図に対応する複数の所定の単語と前記検索キーワードセットを比較し、明確に規定されている意図に対応する複数の所定の単語と前記検索キーワードセットを比較することを含み、前記検索キーワードセットが前記ユーザによって明確に規定された意図を示すか否かを判定し、前記検索キーワードセットが明確に規定された意図を示さないと判定された場合、推薦検索キーワードを取得するために第1の推薦方法を実行するように構成されている1または複数のプロセッサを備え、前記第1の推薦方法は、複数の推薦方法から選択され、前記第1の推薦方法は、知識ベースの推薦方法、セッション相関ベースの方法、または、それらの組み合わせを含み、前記システムは、さらに、前記1または複数のプロセッサに接続されていると共に前記1または複数のプロセッサに命令を提供するよう構成されている1または複数のメモリを備える、システム。

請求項14

請求項13に記載のシステムであって、前記検索キーワードセットが明確に規定された意図を示すと判定された場合、前記1または複数のプロセッサは、さらに、さらなる推薦検索キーワードを取得するために第2の推薦方法を実行するよう構成されている、システム。

請求項15

請求項14に記載のシステムであって、前記第2の推薦方法は、検索ログベースの推薦方法を含む、システム。

請求項16

請求項13に記載のシステムであって、前記第1の推薦方法は、少なくとも知識ベースの推薦方法およびセッション相関ベースの推薦方法の組み合わせを含み、前記知識ベースの推薦方法は、第1の割合の推薦キーワードに寄与し、前記セッション相関ベースの推薦方法は、第2の割合の推薦キーワードに寄与する、システム。

請求項17

請求項16に記載のシステムであって、前記1または複数のプロセッサは、さらに、前記知識ベースの推薦方法の第1のエクスポージャ−フィードバック率および前記セッション相関ベースの推薦方法の第2のエクスポージャ−フィードバック率を記録し、将来受信される検索キーワードセットについて前記知識ベースの推薦方法が寄与する推薦キーワードの前記第1の割合、および、将来受信される検索キーワードセットについて前記セッション相関ベースの推薦方法が寄与する推薦キーワードの前記第2の割合を調整するよう構成されている、システム。

請求項18

請求項13に記載のシステムであって、前記知識ベースの推薦方法は、検索ログに基づいて複数の語彙項目セットを取得し、前記複数の語彙項目セットから、前記検索キーワードセットと最もマッチする1または複数の語彙項目を含む語彙項目セットを選択し、格納されたルールセットから被選択ルールを選択し、前記格納されたルールセット内の各ルールは語彙項目タイプの優先順位配列を含み、前記被選択ルールにおいて、前記選択された語彙項目セットの語彙項目タイプは、対応する優先順位配列内の最初の項目であり、前記被選択ルールの前記優先順位配列内の2番目の語彙項目タイプを特定し、前記2番目の語彙項目タイプのセット内に存在すると共に、前記受信された検索キーワードセットと論理的に対応する語彙項目を、前記推薦検索キーワードの1つとして決定すること、を備える、システム。

請求項19

請求項18に記載のシステムであって、前記複数の語彙項目セットは、複合タイプ語彙項目集合、モノタイプ語彙項目セット、ブランドタイプ語彙項目セット、および、商品モデルタイプ語彙項目セットを含む、システム。

請求項20

請求項13に記載のシステムであって、前記セッション相関ベースの推薦方法は、ユーザによる検索セッションに対応する検索キーワード列を格納し、前記受信された検索キーワードセットを含む前記格納された検索キーワード列において、前記受信された検索キーワードの後にリストされた複数の検索キーワードセットを特定し、前記複数の検索キーワードセットに基づいて、前記推薦検索キーワードを決定すること、を備える、システム。

請求項21

請求項20に記載のシステムであって、前記推薦検索キーワードの決定は、様々なカテゴリの業界の語彙項目を有する予め格納されたセットに基づいて、前記検索キーワード列において前記入力検索キーワードの後にリストされた前記検索キーワードセットから、前記受信された検索キーワードと同じ業界カテゴリの検索キーワードセットを推薦検索キーワードとして選択することを含む、システム。

請求項22

請求項20に記載のシステムであって、前記推薦検索キーワードの決定は、後にリストされた後続リスト検索キーワードセット全体の中に異なる後続リスト検索キーワードセットが出現する確率を計算し、前記確率に基づいて、出現する可能性が最も高い検索キーワードセットを推薦検索キーワードとして選択すること、を含む、システム。

請求項23

請求項12に記載のシステムであって、さらに、予め格納された検索キーワードセットと、それらに対応する業界カテゴリに基づいて、前記受信された検索キーワードセットに対応する関連業界カテゴリを決定し、各関連業界カテゴリについて、前記受信された検索キーワードセットのクリック因子属性値を決定し、前記決定されたクリック因子属性値に少なくとも部分的に基づいて、前記受信された検索キーワードセットが前記関連業界カテゴリに属する確率を決定し、前記確率に基づいて、前記関連業界カテゴリに対応する推薦キーワードの数を決定すること、を備え、推薦検索キーワードを取得するための前記第1の推薦方法の実行は、前記関連業界カテゴリに対する推薦検索キーワードを決定することを含む、システム。

請求項24

検索キーワード推薦ためのコンピュータプログラム製品であって、前記コンピュータプログラム製品は、コンピュータ読み取り可能な記憶媒体内具現化され、ユーザによって入力された検索キーワードセットを受信するためのコンピュータ命令と、前記検索キーワードセットが前記ユーザによって明確に規定された意図を示すか否かを判定するためのコンピュータ命令であって、明確に規定されていない意図に対応する複数の所定の単語と前記検索キーワードセットを比較し、明確に規定されている意図に対応する複数の所定の単語と前記検索キーワードセットを比較することを含む、コンピュータ命令と、前記検索キーワードセットが明確に規定された意図を示さないと判定された場合、推薦検索キーワードを取得するために第1の推薦方法を実行するためのコンピュータ命令と、を備え、前記第1の推薦方法は、複数の推薦方法から選択され、前記第1の推薦方法は、知識ベースの推薦方法、セッション相関ベースの方法、または、それらの組み合わせを含む、コンピュータプログラム製品。

技術分野

0001

他の出願の相互参照
本願は、すべての目的のために参照により本明細書に組み込まれる、発明の名称を「A METHODAND DEVICE FOR RECOMMENDING SEARCHKEYWORDS」とする、2010年12月31日出願の中国特許出願第201010618555.4号に基づく優先権を主張する。

0002

本願は、情報検索技術の分野に関し、特に、検索キーワード推薦に関する。

背景技術

0003

既存の検索エンジンは、一般に、検索キーワードの推薦機能を提供する。例えば、いくつかのウェブベースエンジンにおいて、ユーザが検索フィールドに検索キーワードを入力して「検索」ボタンクリックした後にシステムジャンプするページは、検索結果だけでなく、ユーザによって入力された検索キーワードに関連する検索エンジン推薦の他の検索キーワードまたは検索キーワードの組み合わせをも含む。または、ユーザが検索フィールドに検索キーワードを入力すると、ユーザが推薦検索キーワードを選択して検索を実行できるように、ユーザ入力検索キーワードに関連した推薦検索キーワードが、検索フィールドのプルダウンメニューにポップアップする。

0004

検索キーワードを推薦するための既存のスキームは、一般に、検索ログに基づいている。ユーザによって入力された検索キーワードとより高い相関を有する検索ログ内の検索キーワードが、推薦検索キーワードとして機能する。基本的な原理な以下の通りである。

0005

まず、検索ログが構築される。検索ログに含まれる検索キーワードは、通常、以下のソースを有する。すなわち、第1のソースはユーザによって検索フィールドに入力されたすべての検索キーワード、第2のソースは検索エンジンによって推薦された検索キーワードである。また、検索ログ内の検索キーワードに対応する重要パラメータの値が決定される。検索ログ内の検索キーワードに対応する重要パラメータの値は、主に以下の因子によって決定される。具体的には、各検索キーワードの重要パラメータの値は、すべての因子に加重和法を適用することによって決定されうる。

0006

1.クリック因子、すなわち、検索キーワードの検索結果がユーザによってクリックされたことを示す記録があるか否か、クリック数、およびクリック順位。具体的には、ユーザが検索キーワードを用いて検索を実行しただけで、検索結果のウェブページリンクをクリックしなかった場合、この検索キーワードに対するクリック因子パラメータ値は比較的低くなり、例えば、この因子についての所定のパラメータ値は0である。ユーザが検索キーワードを用いて検索を実行した後に検索結果をクリックした場合、この検索キーワードに対するクリック因子パラメータ値は比較的高くなり、例えば、この因子についての所定のパラメータ値は、検索結果がクリックされた回数である。検索キーワードに対するクリック記録がある場合、クリック数が多いほど、その検索キーワードについてのクリックパラメータ値が高くなり、その結果、重要パラメータの加重和の値が高くなる。

0007

2.検索キーワードの品質因子。検索キーワードの品質因子は、検索キーワード長、意味的語数、および、所定の検索キーワードセットにおける検索キーワードの包含/非包含を含む。検索キーワード長は、検索キーワードに含まれる文字数であり、すなわち、具体的には、異なる文字数に対応する因子パラメータ値である。例えば、長さ「2」の検索キーワードに対応する所定の因子パラメータ値は1であり、長さ「3」の検索キーワードに対応する所定の因子パラメータ値は0.8であり、長さ「4」の検索キーワードに対応する所定の因子パラメータ値は0.5である、など。「意味的用語数」とは、以下のようなものである。検索キーワードが単語分割処理を受けた後、それによって得られた意味的用語の数が、所定の閾値と比較される。検索キーワードに対応する意味的用語因子パラメータ値は、比較結果に基づいて決定される。所定の検索キーワードセットの例は、禁止単語セット、商品ブランド単語セット、および、特別な購入意欲単語セットである。検索キーワードに対応するパラメータ値は、比較された検索キーワードがこれらの所定の検索キーワードセット内のサンプル単語を含むか否かに基づいて、この因子について決定される。

0008

検索キーワードを推薦する時、検索エンジンは、ユーザが検索フィールドに入力した検索キーワードを受信した後に、通常、検索ログに含まれる各検索キーワードに関して以下の工程を実行する。

0009

1.検索ログに含まれる検索キーワードと、入力された検索キーワードとの間の類似度値を決定する。2つの検索キーワードの間の類似度を決定できる多くの具体的な方法がある。例えば、2つの検索キーワードの最長共通部分文字列に基づく方法が用いられてよい。次いで、決定された類似度値および検索ログに含まれる検索キーワードの重要パラメータ値に加重和法を用いることによって、検索ログに含まれる検索キーワードの推薦値を決定することができる。

0010

2.対応する推薦値の高から低への順序に従って、検索ログに含まれる検索キーワードを順位付けて、最初のN個の検索キーワードをユーザに推薦されるキーワードとして選択する。

0011

検索キーワードを推薦するための上述の検索ログベースのスキームの利点は、検索プロセスを完了させるまたは修正するという明確な意図を持つユーザを段階的に導く能力にある。例えば、ユーザによって入力された検索キーワードが「携帯電話」であるとする。検索キーワードを推薦するための上述の検索ログベースのスキームに従って推薦される最初の検索キーワードは、「Sブランドの携帯電話」である。ユーザが、さらに検索を実行するために、推薦された検索キーワード「Sブランドの携帯電話」をクリックした場合、かかる行動は、現行入力検索キーワードが「Sブランドの携帯電話」であるということと等価である。検索キーワードを推薦するための上述の検索ログベースのスキームに従って推薦される2番目の検索キーワードは、「Sブランドのスマートフォン」である、などと続く。

0012

しかしながら、例えば、検索キーワードとして「代理店フランチャイズ」を入力したユーザなど、明らかな検索意図を持たないユーザの場合、上述したように連続的に絞り込んでいく推薦スキームでは、容易に要件を満たすことができない。推薦される検索キーワードは、しばしば、全体として、入力検索キーワードと意味的に同じであるか、あるいは、検索キーワードに他の限定詞を追加して形成された単語列である。さらに、推薦される検索キーワードは、しばしば、特定の分野に限定される。検索キーワード推薦は、しばしば、かかる検索用語には有効でない。つまり、推薦された検索キーワードが、ユーザによってクリックされることはまれである。さらに、検索エンジンサーバは、キーワードに関連した推薦を実行する際に、検索ログを取得し、類似度値の計算の実行し、順位付けなどの動作を実行する必要がある。その結果、検索エンジンサーバのシステムリソース占有されるが、それでも、推薦された関連キーワードは、ユーザの要求を満たすことができない。したがって、このアプローチは、検索エンジンサーバのシステムリソースを浪費し、処理効率下げる。

図面の簡単な説明

0013

以下の詳細な説明と添付の図面において、本発明の様々な実施形態を開示する。

0014

検索推薦プラットフォームの一実施形態を示す図。

0015

検索用語推薦を行うための処理の一実施形態を示すフローチャート

0016

検索キーワード推薦デバイスの一実施形態を示す概略図。

0017

検索キーワード推薦処理の一実施形態を示すフローチャート。

0018

推薦割合a、b、および、cを調整するための処理の一実施形態を示すフローチャート。

0019

知識ベース推薦方法の一実施形態を示す概略図。

0020

いくつかの語彙項目セットの例を示す図。

0021

セッション相関ベースの推薦方法の一実施形態を示すフローチャート。

0022

検索キーワードを推薦するための処理の一実施形態を示すフローチャート。

0023

検索キーワードを推薦するためのデバイスの一実施形態を示すブロック図。

実施例

0024

本発明は、処理、装置、システム、物質組成コンピュータ読み取り可能な格納媒体上に具現化されたコンピュータプログラム製品、および/または、プロセッサ(プロセッサに接続されたメモリに格納および/またはそのメモリによって提供される命令を実行するよう構成されたプロセッサ)を含め、様々な形態で実装されうる。本明細書では、これらの実装または本発明が取りうる任意の他の形態を、技術と呼ぶ。一般に、開示された処理の工程の順序は、本発明の範囲内で変更されてもよい。特に言及しない限り、タスクを実行するよう構成されるものとして記載されたプロセッサまたはメモリなどの構成要素は、ある時間にタスクを実行するよう一時的に構成された一般的な構成要素として、または、タスクを実行するよう製造された特定の構成要素として実装されてよい。本明細書では、「プロセッサ」という用語は、1または複数のデバイス、回路、および/または、コンピュータプログラム命令などのデータを処理するよう構成された処理コアを指すものとする。

0025

以下では、本発明の原理を示す図面を参照しつつ、本発明の1または複数の実施形態の詳細な説明を行う。本発明は、かかる実施形態に関連して説明されているが、どの実施形態にも限定されない。本発明の範囲は、特許請求の範囲によってのみ限定されるものであり、多くの代替物変形物、および、等価物を含む。以下の説明では、本発明の完全な理解を提供するために、多くの具体的な詳細事項が記載されている。これらの詳細事項は、例示を目的としたものであり、本発明は、これらの具体的な詳細事項の一部または全てがなくとも特許請求の範囲に従って実施可能である。簡単のために、本発明に関連する技術分野で周知の技術事項については、本発明が必要以上にわかりにくくならないように、詳細には説明していない。

0026

既存の検索キーワード推薦スキームの特定の問題、すなわち、明確に規定された意図を持たないユーザに検索キーワードを推薦した場合の質の低い推薦結果と、検索エンジンサーバシステムリソースの浪費に対処するための検索キーワード推薦スキームが開示されている。いくつかの実施形態において、このスキームの第1の工程は、ユーザによって入力された検索キーワードが、明確に規定された検索意図を反映しているか否かを評価する工程である。検索キーワードは、ユーザが入力した検索キーワードに明確な検索意図があるか否かに従って、異なる検索キーワード推薦スキームによってユーザに推薦される。

0027

さらに、本願の実施形態は、明確に規定された検索意図を持たないユーザに検索キーワードを推薦するための2つの方法を提供する。いくつかの実施形態では、明らかな検索意図を欠く検索キーワードに関する推薦検索キーワードを決定するために、第1の所定の推薦方法が、推薦検索キーワードを決定する主要な方法として用いられ、他の推薦方法が、検索キーワードを決定する補助的な方法として用いられる。第1の所定の推薦方法は、明らかな検索意図がない状況に適した知識ベースシステムの推薦方法および/またはセッション相関ベースの推薦方法であるため、検索キーワード推薦結果を改善し、検索エンジンサーバの効率を高める。

0028

図1Aは、検索推薦プラットフォームの一実施形態を示す図である。システム100は、クライアントデバイス102、ネットワーク104、推薦サーバ106、データベース108、および、ウェブサーバ110を備える。いくつかの実施形態において、ネットワーク104は、高速データネットワークおよび/または遠隔通信ネットワークを用いて実装される。いくつかの実施形態において、推薦サーバ106およびウェブサーバ110は、別個に動作するが互いに連携するよう構成されている。いくつかの実施形態において、推薦サーバ106およびウェブサーバ110は、単一のデバイスに組み込まれる、および/または、協働するよう構成されている。

0029

クライアントデバイス102の例としては、ラップトップコンピュータデスクトップコンピュータ、スマートフォン、携帯デバイスタブレットデバイス、または、任意のその他のコンピュータデバイスが挙げられる。様々な実施形態において、ウェブサーバ110および/または推薦サーバ106との通信を可能にするために、ウェブブラウザなどのアプリケーションがデバイス102にインストールされる。

0030

この例において、ウェブサーバ(例えば、検索エンジン)は、クライアントデバイスからユーザによって送信された検索キーワードを受信し、それらを推薦サーバに送信し、さらなる推薦キーワードを受信し、さらなる推薦キーワードをユーザに送信するよう構成されている。いくつかの実施形態において、推薦サーバは、クライアントデバイスと直接通信する。推薦サーバ106は、クライアントデバイス(デバイス102など)から受信した検索キーワードに応じて、さらなる検索キーワードを推薦するよう構成されている。データベース108は、意図が明確に規定されている明確意図単語および意図が明確に規定されていない不明確意図単語を格納するよう構成されており、それらの単語は、検索キーワード推薦を行うために推薦サーバによって用いられる。

0031

図1Bは、検索用語推薦を行うための処理の一実施形態を示すフローチャートである。処理150は、システム(100など)上で実行されてよい。

0032

工程152では、検索キーワードのセット(例えば、ユーザによって入力された1または複数の検索キーワード)が受信される。

0033

工程154では、検索キーワードのセットが、ユーザによって明確に規定された意図に対応するか否かが判定される。この例において、受信された検索キーワードのセットは、予め構成された不明確意図ワードセット内および予め構成された明確意図ワードセット内のサンプル単語と比較される。不明確意図ワードセット内のサンプル単語は、特定の検索意図がないことを示唆しており、明確意図ワードセット内のサンプル単語は、いくつかの特定の検索意図の存在を示唆する単語である。各セット内の単語は、手動分類および/または機械学習によって構築されてよい。一般に、不明確意図サンプル単語は、抽象的概念を表し、実体または物に明確に対応しない単語である。不明確意図サンプル単語は、商品名またはブランドを直接含むことも、それらに対応することもない。例えば、「プログラミング」、「リスク分析」、「法的告訴」などは、不明確意図サンプル単語である。対照的に、「明確意図単語」は、実体または物に明確に対応する具体的な単語またはフレーズである。実在する物体および商品の名称は、明確意図単語である。例としては、「携帯電話」、「自動車」、「消化器」などが挙げられる。

0034

この例において、受信された検索キーワードが予め構成された不明確意図ワードセット(または、明確意図ワードセット)内のサンプル単語を含むか否かを判定するために、受信された検索キーワードが不明確意図ワードセット(または、明確意図ワードセット)内のサンプル単語と同じ部分文字列を含むか否かが判定される。受信された検索キーワードが不明確意図ワードセット内のサンプル単語を含むが、明確意図ワードセット内のサンプル単語を含まない場合、制御は工程156に進み、そうでない場合、制御は工程158に進む。

0035

工程156では、任意選択的に、明確に規定された検索意図がないことを示す検索意図識別子(例えば、0)が、受信された検索キーワードセットに関連付けられる。処理は、工程160に進む。

0036

工程160では、推薦検索キーワードを決定するための複数の方法の内の第1の方法が選択および実行される。選択は、受信された検索キーワードが明確に規定された検索意図を有するか否かに少なくとも部分的に基づく。この例において、第1の所定の推薦方法は、推薦検索キーワードを決定する主要な方法として用いられる。任意選択的に、検索キーワードを決定する補助的な方法として他の推薦方法を用いることができる。以下で詳述するように、第1の所定の推薦方法は、知識ベースのシステム推薦方法および/またはセッション相関ベースの推薦方法であってよい。この例において、主要な方法が知識ベースシステムの推薦方法である場合、セッション相関ベースの推薦方法などの他の推薦方法は、知識ベースシステムの推薦方法の補助的な推薦方法とみなされてよい。主要な方法がセッション相関ベースの推薦方法である場合、知識ベースシステムの推薦方法などの他の推薦方法は、セッション相関ベースの推薦方法の補助的な推薦方法とみなされてよい。

0037

工程158では、任意選択的に、受信された検索キーワードセットが明確に規定された検索意図を有することを示す検索意図識別子(例えば、1)が、受信された検索キーワードセットに関連付けられる。処理は、工程162に進む。

0038

工程162では、さらなる推薦検索キーワードを決定するために、第2の所定の推薦方法が実行される。第2の所定の推薦方法は、検索ログベースの推薦方法であってもよいし、検索ログベースの推薦方法と、検索キーワードを決定するための他の方法であるその他の補助的な方法とを組み合わせた方法であってもよい。

0039

本願の実施形態において、知識ベースシステムの推薦方法およびセッション相関ベースの推薦方法は共に、不明確検索識別子を有する検索キーワードの推薦に適しており、良好な推薦結果を得ることができる。主に知識ベースシステムまたはセッション相関ベースの推薦方法である推薦方法を用いて検索キーワードを推薦する処理について、以下の具体的な実施形態において詳述する。受信された検索キーワードが不明確意図ワードセット内のサンプル単語のみを含むと判定された場合、検索キーワード推薦のための主要な方法としてこれら2つの方法のいずれかを用いれば、検索キーワード推薦結果を向上させると共に、従来技術の問題、すなわち、明確に規定された検索意図を持たないユーザに検索キーワードを推薦した場合に起きる質の低い推薦結果と、結果として起きる検索エンジンサーバシステムのリソースの浪費とを解決することができる。

0040

いくつかの実施形態において、2以上の推薦方法が推薦キーワードを生成するために用いられる場合、第1の推薦方法によって推薦される検索キーワードの割合は、その他の推薦方法によって推薦される検索キーワードの割合よりも大きい。

0041

図2は、検索キーワード推薦デバイスの一実施形態を示す概略図である。デバイス200は、推薦サーバ106を実装するために用いられてよい。この例において、デバイス200は、意図識別モジュール202、推薦方法選択モジュール204、および、検索キーワード推薦モジュール206を備える。

0042

意図識別モジュール202は、受信された検索キーワードが、明確に規定された意図を示すか否かを判定するよう構成される。この例において、そのモジュールは、入力検索キーワードが、不明確意図ワードセット内のサンプル単語を含むが明確意図ワードセット内のサンプル単語を含まないのか、もしくは、そうでないのかをチェックする。そうである場合、受信された検索キーワードは、明確に規定された意図を示さず、入力検索キーワードに対応する検索識別子は、不明確検索意図識別子であり、そうでない場合、受信された検索キーワードは、明確に規定された意図を有し、入力検索キーワードに対応する検索識別子は、明確検索意図識別子である。意図識別モジュールは、処理に向けて推薦方法選択モジュールに入力検索キーワードの検索意図識別子を送信する。

0043

推薦方法選択モジュール204は、推薦戦略と、異なる検索意図識別子との間の所定の対応関係に従って、意図識別モジュールから送信された検索意図識別子に対応する最適な推薦戦略を選択するよう構成される。

0044

検索キーワード推薦モジュール206は、ユーザによって入力された検索キーワードと、推薦方法選択モジュールによって推薦された推薦戦略とに基づいて、推薦検索キーワードを決定するよう構成される。

0045

図3Aは、検索キーワード推薦処理の一実施形態を示すフローチャートである。処理300は、システム(106または200など)上で実行されてよい。

0046

工程302では、検索キーワードのセットが受信される。例えば、検索キーワードは、検索エンジンウェブページの検索フィールドへのユーザによる入力(「代理店フランチャイズ」など)に対応しうる。

0047

工程304では、検索キーワードのセットは、予め構成された不明確意図ワードセットおよび明確意図ワードセットと比較され、検索意図識別子が、検索キーワードのセットに関連付けられる。

0048

入力検索キーワードが不明確意図ワードセット内のサンプル単語を含むが明確意図ワードセット内のサンプル単語を含まない場合、入力検索キーワードに対応する検索識別子は、ユーザの検索意図が明確に規定されていないことを示す値(検索意図が明確に規定されていない不明確検索意図識別子と呼ぶ)に設定される。そうでない場合、検索識別子は、ユーザの検索意図が明確に定義されていることを示す値(明確検索意図識別子と呼ぶ)に設定される。様々な実施形態において、不明確検索意図識別子および明確検索意図識別子は、様々な所定の値に対応しうる。例えば、不明確検索意図識別子として「NEG」および明確検索意図識別子として「POS」;あるいは、不明確検索意図識別子として「0」および明確検索意図識別子として「1」などである。

0049

工程306では、検索意図識別子と、異なる検索意図識別子および推薦方法の対応付けとに基づいて、複数の利用可能な推薦方法の中から1または複数の推薦方法が選択される。

0050

異なる検索意図識別子および推薦戦略および異なる検索意図識別子の対応表の一例を、表1に示す。この表において、推薦方法Aは、知識ベースのシステム(KBS)の推薦方法であり、推薦方法Bは、セッション相関ベースの推薦方法であり、推薦方法Cは、検索ログベースの推薦方法である。

0051

いくつかの実施形態において、各々の異なる検索意図識別子に対応する推薦戦略は、推薦方法の組み合わせである。例えば、不明確検索意図識別子に対応する推薦戦略は、推薦検索キーワードを決定する主要な方法として第1の所定の推薦方法が用いられると共に、検索キーワードを決定する補助的な方法としてその他の推薦方法が用いられる戦略であってよく、明確検索意図識別子に対応する推薦戦略は、推薦検索キーワードを決定する主要な方法として検索ログベースの推薦方法が用いられると共に、検索キーワードを決定する補助的な方法としてその他の推薦方法が用いられる戦略であってよい。いくつかの実施形態において、この主要−補助の関係性は、表2に示すように、推薦キーワードの総数の内、各タイプの推薦方法によって推薦される検索キーワードの数の割合として具体化される。

0052

以下を前提とする。すべての推薦検索キーワードの内、推薦方法Aによって推薦される検索キーワードの割合をa、すべての推薦検索キーワードの内、推薦方法Bによって推薦される検索キーワードの割合をb、すべての推薦検索キーワードの内、推薦方法Cによって推薦される検索キーワードの割合をc。明確検索意図識別子に対応する推薦方法に関しては、c>=a+bである。不明確検索意図識別子に対応する推薦方法に関しては、a+b>=cである。説明のために、割合a、b、および、cを、「推薦割合」と呼ぶことがある。

0053

工程308では、選択された推薦方法は、ユーザによって入力された検索キーワードのセットに適用され、推薦検索キーワードが決定される。

0054

再び表2を参照すると、特定の値a、b、および、cは、自己適応的な方法で動的に調整できる。例えば、エクスポージャフィードバック率(exposure−feedback rate)ベース(CTRクリックスルー率ベース)の方法が、値a、b、および、cの動的調整のために用いられてよい。検索キーワード(検索結果を取得するために検索されたユーザ入力キーワードまたは推薦キーワードのいずれか)は、エクスポージャを受けたとされる。ユーザが検索結果をクリックした場合、検索キーワードは、フィードバックを経験したとされる。推薦方法に関して、現在の検索結果が、推薦方法Aによって推薦された検索キーワードを用いて検索することで得られた場合、推薦方法Aは、1回のエクスポージャを取得したとされる。ユーザによって現在クリックされた検索結果が、推薦方法A(知識ベースシステムの推薦方法)によって推薦された検索キーワードから得られたものである場合、推薦方法Aは、1回のフィードバックを受けたとされる。

0055

推薦方法の「エクスポージャ−フィードバック率」は、その推薦方法によって得られたエクスポージャの回数と、この回数のエクスポージャに基づいて得られたフィードバックの回数との比である。例えば、推薦方法Aのエクスポージャ−フィードバック率は、推薦Aが所定の時間枠中に用いられた回数と、推薦方法Aで得られたフィードバックの回数との比である。

0056

図3Bは、推薦割合a、b、および、cを調整するための処理の一実施形態を示すフローチャートである。処理350は、システム(106または200など)上で実行されてよい。

0057

工程352では、所定の時間内にユーザが検索結果をクリックするたびに、現在の検索結果に用いられた推薦方法が記録される。換言すると、所定の時間内に各推薦方法が受けたエクスポージャの回数が記録される。

0058

工程354では、各推薦方法によって推薦された検索キーワードが所定の時間内にフィードバックを受けた回数がカウントされる。

0059

工程356では、各推薦方法に対応するエクスポージャ−フィードバック率が、受けたエクスポージャの回数および受けたフィードバックの回数に基づいて計算される。

0060

工程358では、所定の調整増分に従って、検索エンジンは、すべての推薦方法によって決定された推薦検索キーワードの総数の内、最も低いエクスポージャ−フィードバック率を有する推薦方法(より高いフィードバック効率を達成する推薦と理解することができる)によって決定される推薦検索キーワードの数の割合を増大させ、最も高いエクスポージャ−フィードバック率を有する推薦方法(より低いフィードバック効率を達成する推薦方法と理解することができる)に対応するこの比を減少させる。

0061

一例として、工程352において、5日間で、推薦方法Aが1,000のエクスポージャを受け、推薦方法Bが500のエクスポージャを受け、推薦方法Cが300のエクスポージャを受けたとする。

0062

さらに、工程354において、5日間で、推薦方法Aが500のフィードバックを受け、推薦方法Bが200のフィードバックを受け、推薦方法Cが100のフィードバックを受けたとする。

0063

工程356では、推薦方法Bに対応するエクスポージャ−フィードバック率は、500エクスポージャ/200フィードバック=2.5である。

0064

推薦方法Cに対応するエクスポージャ−フィードバック率は、300エクスポージャ/100フィードバック=3である。

0065

推薦方法Aに対応するエクスポージャ−フィードバック率は、1,000エクスポージャ/500フィードバック=2である。

0066

調整前には、a=40%、b=40%、および、c=20%であると仮定する。工程358で、推薦方法Aは最も低いエクスポージャ−フィードバック率を有し、推薦方法Cは最も高いエクスポージャ−フィードバック率を有するため、aおよびcの値が変更される。5%の調整増分が予め設定されていると仮定すると、新たな値は、以下のように計算される。a’=a+5%=45%、c’=c−5%=15%。

0067

以下では、知識ベースの推薦方法およびセッション相関ベースの推薦方法について詳述する。

0068

知識ベースの推薦方法
図4は、知識ベースの推薦方法の一実施形態を示す概略図である。処理400は、システム(106または200など)によって実行されてよい。

0069

工程402では、検索ログを格納するデータベースから検索キーワードデータが取得され、2以上の語彙項目セットを取得するために、クラスタリング技術が検索キーワードに適用される。同じ語彙項目セット内のすべての語彙項目は、論理的対応を有すると共に、同じ語彙項目タイプを有しており、異なる語彙項目セットに対応する語彙項目タイプは異なっている。

0070

この例では、以下の4つの異なるタイプの語彙項目セットが取得される。各語彙項目が複数の単語を含む複合タイプ語彙項目セット、各語彙項目が1つの単語を含むモノタイプ語彙項目セット、各語彙項目がブランドに対応するブランドタイプ語彙項目セット、および各語彙項目が商品モデルに対応する商品モデルタイプ語彙項目セット。ブランドタイプおよび商品モデルタイプ語彙項目セットは、複合タイプおよびモノタイプ語彙項目セットよりも具体的である。この時、語彙項目が複数の語彙項目セットに属しうる場合、より具体的な語彙項目セットに関連付けられる(例えば、「tv9829」は、モノタイプ語彙項目または商品モデルタイプ語彙項目でありうるため、商品モデルタイプに関連付けられる)。

0071

図5は、いくつかの語彙項目セットの例を示す図である。この例において、複合タイプ語彙項目セット内の語彙項目「スマートG携帯電話」、モノタイプ語彙項目セット内の語彙項目「携帯電話」、ブランドタイプ語彙項目セット内の語彙項目「ブランドS」、および、商品モデルタイプ語彙項目セット内の語彙項目「i9000」は、すべて携帯電話に関連するため、論理的に互いに対応する。

0072

複合語項目セット内の語彙項目「デジタルピクチャフレーム」は、モノタイプ語彙項目セット内の「ピクチャフレーム」と論理的に関連しており、すべてフォトフレームと関連するため、ブランドタイプ語彙項目セット内の語彙項目「ブランドA」および商品モデルタイプ語彙項目セット内の語彙項目「v630」とも論理的に対応する。

0073

複合語彙項目セット内の語彙項目「代理店フランチャイズ」は、モノタイプ語彙項目セット内の「代理店」と論理的に関連しており、ブランドタイプ語彙項目セット内の語彙項目「ブランドA代理店」および商品モデルタイプ語彙項目セット内の語彙項目「T50b」などにも論理的に対応する。

0074

図4に戻ると、工程404において、受信された検索キーワードに基づいて、工程402で取得された語彙項目セットから1つの語彙項目セットが選択される。選択された語彙項目セットは、検索キーワードのセットと最もマッチする語彙項目を含む。

0075

この例において、ユーザによって入力された検索キーワードのセットは、検索キーワードのセットが属するセットを決定するために、上述の4つの語彙項目セット内の語彙項目と比較される。例えば、検索キーワードのセットが「フランチャイズ代理店」である場合、ユーザによって入力された検索キーワードが属するセットは、複合タイプ語彙項目セットである。

0076

工程406では、1または複数の特定のルールが、格納されたルールセットから選択される。ここで、ルールセット内の各ルールは、語彙項目タイプを優先順位で並べた配列を含む。選択されたルールにおいて、入力検索キーワードが属するセットの語彙項目タイプは、配列内の最初の項目である。例えば、以下のルールが格納されてよい。

0077

ルール1:複合タイプ>ブランドタイプ>商品モデルタイプ、

0078

ルール2:モノタイプ>複合タイプ>ブランドタイプ>商品モデルタイプ、

0079

ルール3:商品モデルタイプ>ブランドタイプ、

0080

ルール4:ブランドタイプ>商品モデルタイプ、

0081

・・・

0082

一例として検索キーワードセット「フランチャイズ代理店」を用いると、「フランチャイズ代理店」に対応するセットは、複合タイプ語彙項目を含むセットである。したがって、検索キーワード「フランチャイズ代理店」について、選択されるルールは、複合タイプが配列の最初の項目であるルール1である。

0083

工程408では、各々の選択されたルールについて、対応する優先順位配列において最初の項目に続く2番目の語彙項目タイプが決定される。

0084

ルール1では、配列内の最初の項目「複合タイプ」の後の語彙項目タイプは、「ブランドタイプ」である。

0085

工程410では、2番目の語彙項目タイプのセットに含まれると共に、受信された検索キーワードセットと論理的に対応する語彙項目が、推薦検索キーワードとして決定される。

0086

図5を再び参照すると、複合タイプ語彙項目セット内の「代理店フランチャイズ」と論理的に関連するブランドタイプ語彙項目セット内の語彙項目は「ブランドA代理店」なので、語彙項目「ブランドA代理店」が、推薦検索キーワードとして機能するよう選択される。

0087

工程406において選択されるルールの数は少なくとも1つである。したがって、少なくとも1つの対応する検索キーワードが工程410において推薦される。知識ベースシステムの推薦方法を用いて推薦された検索キーワードの数mが、知識ベースシステムの推薦方法を用いて推薦された検索キーワードの内、検索戦略によって必要とされる数a*n(nは推薦検索キーワードの総数)を超えた場合(すなわち、m>a*nの時)、a*n個の検索キーワードが、知識ベースシステムの推薦方法によって推薦されたm個の検索キーワードから選択される。具体的な好ましい方法は、検索キーワードの重要パラメータ値に基づいて選択することを含む。

0088

セッション相関ベースの推薦方法
図6は、セッション相関ベースの推薦方法の一実施形態を示すフローチャートである。

0089

工程602では、検索ログにおいて同一ユーザによって用いられた隣接する検索キーワードの間のクリック関係および時間間隔に基づいて、各検索セッションに対応する検索キーワード列が決定および格納される。ここで、検索キーワード列の各々は、少なくとも2つの検索キーワードを含む。本明細書で用いられているように、隣接する検索キーワードは、入力された時刻が、所定の閾値よりも小さい時間間隔で隔てられている異なる検索キーワードである。検索ログは、一般に、単一のユーザの検索記録を格納する。検索記録は、入力検索キーワードに基づいて実行されたウェブページ検索の時刻と、検索結果がクリックされたか否かなどの情報とを含む。

0090

「2つの隣接するキーワードの間のクリック関係」とは、同一ユーザが、設定された期間(5分間など)内にこれら2つの検索キーワードの各々に基づいて別個のウェブ検索を行い、かつ、ユーザが、これら2つの検索キーワードの各々に基づいて得られた検索結果内のウェブページリンクをクリックしたことを意味する。ユーザが検索結果内のウェブページリンクをクリックしたという事実は、このユーザが、これらの検索キーワードを用いた検索セッションに比較的満足したということを示唆する。隣接するキーワードについて、入力時刻の後に来る検索キーワードセットは、前に入力された検索キーワードに基づいて推薦された検索キーワードセットの中から選択された検索キーワードセットであってもよいし、ユーザによって入力された別の検索キーワードであってもよい。

0091

上述の方法によって、少なくとも2つの検索キーワードを含むと共に1つの検索セッションに対応する検索キーワード列を取得することができる。

0092

この例において、他のキーワード列の中から、以下の検索キーワード列が取得される。

0093

検索キーワード列1:「代理店−代理店フランチャイズ−ブランドAフランチャイズ加盟店−ブランドAモデルT50b商品」、

0094

検索キーワード列2:「代理店フランチャイズ−アパレルティックフランチャイズ−フランチャイズホットライン」、

0095

検索キーワード列3:「ブランドKファストフードレストラン−代理店フランチャイズ−フランチャイズホットライン」、

0096

・・・

0097

工程604では、検索キーワードのセットが受信される。

0098

この例において、ユーザが検索フィールドに入力した検索キーワードは、「代理店フランチャイズ」である。

0099

工程606では、受信された検索キーワードセットを含む格納された検索キーワード列において、入力検索キーワードセットの後にリストされた1または複数の検索キーワードセットが特定される。

0100

検索キーワード列1において「代理店フランチャイズ」の後にリストされた検索キーワードセットは、「ブランドAフランチャイズ加盟店」および「ブランドAモデルT50b商品」である。検索キーワード列2において「代理店フランチャイズ」の後にリストされた検索キーワードセットは、「アパレルブティックフランチャイズ」および「フランチャイズホットライン」である。検索キーワード列3において「代理店フランチャイズ」の後にリストされた検索キーワードセットは、「フランチャイズホットライン」である。

0101

工程608において、推薦検索キーワードセットが、工程606で決定された検索キーワードセットの位置に基づいて決定される。以下を含む様々な技術を用いて、その決定を行うことができる。

0102

1.様々なカテゴリの業界の語彙項目を有する予め格納されたセット(例えば、アパレル商品タイプ語彙項目セット、電子機器商品タイプ語彙項目セットなど)に基づいて、検索キーワード列において入力検索キーワードの後にリストされた検索キーワードセットから、入力検索キーワードと同じ業界カテゴリの検索キーワードセットを選択し、これらを推薦検索キーワードとみなす

0103

2.後にリストされた後続リスト検索キーワードセット全体の中に異なる後続リスト検索キーワードセットが出現する確率を計算し、その確率に基づいて、推薦検索キーワードの所定の数に達するまで、最も出現の可能性が高い検索キーワードセットを選択し続ける。

0104

例えば、以下を仮定する。「代理店フランチャイズ」が出現する合計100個の検索キーワード列がある。これらの検索キーワード列の内の50個において、「フランチャイズホットライン」が「代理店フランチャイズ」の後にリストされる。これらの検索キーワード列の内の15個において、「アパレルブティック」が「代理店フランチャイズ」の後にリストされる。これらの検索キーワード列の内の15個において、「フランチャイズ加盟店トレーニング」が「代理店フランチャイズ」の後にリストされる。これらの検索キーワード列の内の20個において、「フランチャイズ利益分配」が「代理店フランチャイズ」の後にリストされる。その結果、「フランチャイズホットライン」が出現する確率は0.5になり、「フランチャイズ利益分配」が出現する確率は0.2になり、「アパレルブティック」が出現する確率は0.15になり、「フランチャイズ加盟店トレーニング」が出現する確率は0.15になる。したがって、確率の高低順に並べた推薦順序は、「フランチャイズホットライン」−「フランチャイズ利益分配」−「アパレルブティック」−「フランチャイズ加盟店トレーニング」である。1つの検索キーワードが推薦される必要がある場合、「フランチャイズホットライン」が推薦検索キーワードとして機能する。

0105

いくつかの実施形態において、上述の技術の両方を組み合わせて用いることもできる。例えば、まず、後続リスト検索キーワードをフィルタリングして、入力検索キーワードと同じカテゴリの業界語彙項目セットに属する後続リスト検索キーワードを選択する。次いで、フィルタリングによって特定された検索キーワードから、最も高い出現確率を有する検索キーワードを推薦検索キーワードとしてさらに選択する。

0106

本願の実施形態によって提供される検索キーワード推薦スキームにおいては、まず、ユーザによって入力された検索キーワードに対して検索意図の特定を実行して、検索キーワードが明らかな検索意図を有するか否かを特定する。明らかな検索意図を欠くユーザ入力検索キーワードについては、第1の所定の推薦方法が、推薦検索キーワードを決定する主要な方法として用いられ、他の推薦方法が、検索キーワードを決定する補助的な方法として用いられる。第1の所定の推薦方法は知識ベースシステムの推薦方法またはセッション相関ベースの推薦方法であるため、明らかな検索意図を持たないユーザによって入力された検索キーワードに対して、より良好な検索キーワード推薦を達成することができる。その方法は、検索キーワードを推薦する際に用いられる業界分野を拡張するため、現行のログベースのキーワード推薦方法において分野が狭くなるという問題を回避する。したがって、検索キーワード推薦結果を向上させることができる。知識ベースシステムの推薦方法またはセッション相関ベースの推薦方法は、明らかな検索意図を持たないユーザによって入力された検索キーワードを扱う際に、現行のログベースの推薦方法を合理的に補うことができる。

0107

いくつかの実施形態において、さらに良好な推薦結果を得るために、上述の意図特定ベースの検索キーワード推薦スキームを検索キーワードの業界特定カテゴリと組み合わせることもできる。「業界特定カテゴリ」とは、業界カテゴリに従って検索ログの検索キーワードを予め分類し(例えば、電子機器農産物、アパレル商品などのカテゴリに検索を分類し)、各業界カテゴリに対応させて検索キーワードセットを格納することに関する。少なくとも2つの業界カテゴリに対応する検索キーワードセットが、ユーザによって入力された検索キーワードセットを含む場合、入力検索キーワードセットが各カテゴリに属する確率が決定される。確率は、各業界カテゴリに対応する検索キーワードセットのクリック因子パラメータ値に従って決定される。さらに、決定された確率と、推薦検索キーワードの総数に基づいて、対応する各業界カテゴリについて推薦される必要のある検索キーワードの数も決定される。各業界カテゴリに対して、上述の処理300の工程304で決定された推薦戦略を利用することができる。

0108

図7は、検索キーワードを推薦するための処理の一実施形態を示すフローチャートである。処理300の工程302〜306および処理700の工程702〜706は、並列で実行されてもよい。

0109

工程702では、予め格納された検索キーワードセットと、それらに対応する業界カテゴリに基づいて、受信された検索キーワードセットに対応する関連業界カテゴリが決定される。

0110

入力検索キーワード「リンゴ」を例に取る。アパレル業界カテゴリに対応する検索キーワードセットおよび農産物カテゴリに対応する検索キーワードセットはいずれも、入力検索キーワード「リンゴ」を含む。したがって、「リンゴ」に対応する業界カテゴリセットSは、{アパレル業界カテゴリ、農産物カテゴリ}である。

0111

工程704では、各関連業界カテゴリについて、受信された検索キーワードセットのクリック因子属性値が決定される。

0112

例えば、最も単純な状況では、各業界カテゴリに対応する検索キーワードセット内の検索キーワードのクリック因子属性値は、検索キーワードに応じて得られた検索結果のクリック数である。例えば、アパレル業界カテゴリに対応する検索キーワードセット内の検索キーワード「リンゴ」に対する検索結果のクリック数が20である場合、対応するクリック因子属性値は20である。農産物カテゴリに対応する検索キーワードセット内の検索キーワード「リンゴ」に対する検索結果のクリック数が80である場合、対応するクリック因子属性値は80である。

0113

工程706では、決定済みのクリック因子属性値に少なくとも部分的に基づいて、受信された検索キーワードセットが関連業界カテゴリに属する確率が計算される。

0114

いくつかの実施形態において、決定済みの業界カテゴリ内の入力検索キーワードのクリック因子属性値が正規化される。正規化の結果は、入力検索キーワードが決定済みの業界カテゴリに属する確率と見なされる。すなわち、検索キーワード「リンゴ」が農産物カテゴリに属する確率は80%であり、アパレル業界カテゴリに属する確率は20%である。

0115

工程708では、確率と、推薦される必要のあるキーワードの数に少なくとも部分的に基づいて、各関連業界カテゴリに対応する推薦キーワード数が計算される。

0116

推薦される必要のある検索キーワード総数が10である場合、農産物カテゴリに対応する推薦対象キーワードの数は10×80%=8であり、アパレル業界カテゴリに対応する推薦対象キーワードの数は10×20%=2である。

0117

工程710では、各関連業界カテゴリについて、以前に決定された推薦方法(例えば、工程306で以前に決定した方法)が、業界カテゴリに対応する検索キーワードセットに基づいて実行され、関連業界カテゴリの推薦検索キーワードが決定される。

0118

工程712では、各業界カテゴリの推薦検索キーワードが、要求者(例えば、ユーザ)に送信される。推薦検索キーワードは、工程706において決定された確率に従って順位付けされることが好ましい。例えば、より高い確率値を有する業界カテゴリについて推薦された検索キーワードが、より低い確率値を有する業界カテゴリについて推薦された検索キーワードよりも先にリストおよび表示される。

0119

図8は、検索キーワードを推薦するためのデバイスの一実施形態を示すブロック図である。この例において、デバイス800は、入力検索キーワードを受信するための受信ユニット81と、受信ユニット81によって受信された検索キーワードを、所定の不明確意図ワードセット内のサンプル単語および所定の明確意図ワードセット内のサンプル単語と比較するための比較ユニット82と、複数の推薦方法から1または複数の推薦方法を選択し、選択した推薦方法を実行するための第1の推薦ユニット83と、を備える。受信された検索キーワードが不明確意図ワードセット内のサンプル単語を含むが明確意図ワードセット内のサンプル単語を含まない場合、第1の推薦方法(知識ベースの推薦方法および/またはセッション相関ベースの推薦方法であってよい)が、推薦検索キーワードを決定する主要な方法として選択され、他の推薦方法が、検索キーワードを決定する補助的な方法として用いられる。

0120

比較ユニット82によって取得された比較結果により、受信された検索キーワードが不明確意図ワードセット内のサンプル単語を含まないと示された場合、第2の所定の推薦方法が、推薦検索キーワードを決定する主要な方法として用いられ、第2の所定の推薦方法以外の推薦方法が、検索キーワードを決定する補助的な方法として用いられる。

0121

いくつかの実施形態において、上述の第1の推薦ユニット83は、受信ユニット81によって受信された検索キーワードに含まれる語彙項目が見出される語彙項目セットを決定するためのセット決定モジュールであって、同一の語彙項目セットに含まれる語彙項目は論理的対応を有し、各々の語彙項目タイプが同一であるが、異なる語彙項目セットに対応する語彙項目タイプは異なっている、セット決定モジュールと、様々な語彙項目タイプの優先順位配列を含む格納された複数のルールから、セット決定モジュールによって決定されたセットに含まれる語彙項目の語彙項目タイプが配列内の最初の項目になっている優先順位配列を含むルールを選択するためのルール選択モジュールと、ルール選択モジュールによって選択された各ルールについて、ルールに含まれる優先順位配列内の最初の項目に続く語彙項目のタイプを決定し、論理的対応に従って、決定された語彙項目タイプに対応するセットから、受信された検索キーワードに含まれる語彙項目と論理的に対応する語彙項目を、決定済みの推薦検索キーワードとして選択するための選択モジュールと、を備える。

0122

第1の所定の推薦方法がセッション相関ベースの推薦方法である場合、第1の推薦ユニット83は、具体的に、以下の機能的モジュールに分割できる。すなわち、各検索処理に対応する予め格納された検索キーワード列から、受信ユニットによって受信された検索キーワードの後に位置する検索キーワードを決定するための第1の決定モジュールと、第1の決定モジュールによって決定された検索キーワードに基づいて、推薦検索キーワードを決定するための第2の決定モジュール、である。ここで、検索キーワード列は、検索ログにおいて同一ユーザによって用いられた隣接する検索キーワードの間のクリック関係および時間間隔に基づいて決定され、任意の検索キーワード列は少なくとも2つの検索キーワードを含む。

0123

上述のユニットおよびモジュールは、1または複数の汎用プロセッサ上で実行されるソフトウェアコンポーネントとして、特定の機能を実行するよう設計されたプログラム可能論理デバイスおよび/または特定用途向け集積回路などのハードウェアとして、もしくは、それらの組み合わせとして実装することができる。いくつかの実施形態において、ユニットおよびモジュールは、コンピュータデバイス(パーソナルコンピュータサーバネットワーク装置など)に本発明の実施形態に記載された方法を実行させるための複数の命令など、不揮発性記憶媒体光学ディスクフラッシュ記憶装置携帯用ハードディスクなど)に格納することができるソフトウェア製品の形態で具現化されてよい。ユニットおよびモジュールは、単一のデバイス上に実装されてもよいし、複数のデバイスにわたって分散されてもよい。ユニットおよびモジュールの機能は、互いに統合されてもよいし、複数のサブユニットサブモジュールにさらに分割されてもよい。

0124

業者であれば、適切なハードウェアにプログラムから命令させることによって、上述の実施形態の実現に関与する工程の全部または一部を実現できることを理解できる。このプログラムは、ROM/RAM、磁気ディスク、光学ディスクなどの読み取り可能な記憶媒体に格納できる。

0125

明らかに、当業者は、本発明の精神および範囲から逸脱することなく、本願を変形および変更することができる。したがって、本願のこれらの変形例および変更例が、特許請求の範囲および等価の技術の範囲内にある場合、本願は、これらの変形例および変更例をも網羅するものである。

0126

上述の実施形態は、理解しやすいようにいくぶん詳しく説明されているが、本発明は、提供された詳細事項に限定されるものではない。本発明を実施する多くの代替方法が存在する。開示された実施形態は、例示であり、限定を意図するものではない。

ページトップへ

この技術を出願した法人

この技術を発明した人物

ページトップへ

関連する挑戦したい社会課題

関連する公募課題

ページトップへ

技術視点だけで見ていませんか?

この技術の活用可能性がある分野

分野別動向を把握したい方- 事業化視点で見る -

(分野番号表示ON)※整理標準化データをもとに当社作成

ページトップへ

おススメ サービス

おススメ astavisionコンテンツ

新着 最近 公開された関連が強い技術

  • オムロン株式会社の「 マッチング処理装置」が 公開されました。( 2019/08/08)

    【課題・解決手段】利活用対象のセンシングデータによる容易なセンサマッチングを行うマッチング処理部50が提供される。マッチング処理部50は、提供側端末11により入力された提供側センシングデータを取得する... 詳細

  • オムロン株式会社の「 検索用データ生成装置」が 公開されました。( 2019/08/08)

    【課題・解決手段】センサの検索精度を向上させることができる検索用データ生成装置が提供される。検索用データ生成装置50は、入力された、センシングデバイス20に関連する検索条件301から検索用データを取得... 詳細

  • 三菱電機株式会社の「 情報処理装置および情報処理方法」が 公開されました。( 2019/08/08)

    【課題・解決手段】情報処理装置(10)は、時系列データである入力データを取得するデータ取得部(101)と、時系列データである学習データから抽出した部分列である複数の学習部分列の中で類似する学習部分列を... 詳細

この 技術と関連性が強い技術

関連性が強い 技術一覧

この 技術と関連性が強い人物

関連性が強い人物一覧

この 技術と関連する社会課題

関連する挑戦したい社会課題一覧

この 技術と関連する公募課題

関連する公募課題一覧

astavision 新着記事

サイト情報について

本サービスは、国が公開している情報(公開特許公報、特許整理標準化データ等)を元に構成されています。出典元のデータには一部間違いやノイズがあり、情報の正確さについては保証致しかねます。また一時的に、各データの収録範囲や更新周期によって、一部の情報が正しく表示されないことがございます。当サイトの情報を元にした諸問題、不利益等について当方は何ら責任を負いかねることを予めご承知おきのほど宜しくお願い申し上げます。

主たる情報の出典

特許情報…特許整理標準化データ(XML編)、公開特許公報、特許公報、審決公報、Patent Map Guidance System データ