Re: 複数の検索クエリがある場合のスニペットの取得対象について＜Groonga＞ (groonga-dev,02067) - Groonga - fulltext search engine.

お世話になっております。村上です。


> 詳細の説明ありがとうございます。
> この件については、フルスペックなスニペット関数を別途追加したほうが
> 方向性として良いのではないかという感じです。
>
> 1. snippet_htmlはHTMLに特化して便利に使えるようにする(現状)
> 2. snippet_XXXではタグ名とかスニペットの取得件数とかもろもろ指定してコントロールできるようにする
>
>
もちろん、それで大丈夫です！フルスペックのは、いろいろ検討事項もあると
思うので、追々で大丈夫です！

スニペットAPI（と、grn_expr_snip）でコントロールできる部分であれば、proc.c
のところで手前で適当にいじって対応しているのですが、
スニペットの取得対象となる検索クエリのワードを絞る方法は、判りませんでした。

Normalizerの方は、snip.c側でハードコードされており、また、検索につかった
Normalizerを取得する方法がわかりませんでした。


> で、1.と2.の中間層を用意して1.ほどガチガチじゃないけど、ご要望の要件を満たせるようなのを
> 提供するというのがありかなぁ、という気がしています。
> 中間層をどう提供するのがいいのか、というのはもう少し検討してみます。
>
>
フルスペックは追々として、この件と、検索で使ったNormalizerが
使えるようになると、非常に嬉しいです。

特にこの件は、英語の文献を検索するときに非常に問題になります。
タグの値がAとかいう絞り込み条件もありまして、それで本文のスニペットが取られてしまうので、
そのような絞り込み条件の場合、まともなスニペットが取得できるほうが稀です。。

以上、よろしくお願いします。

Groonga - fulltext search engine.

[groonga-dev,02067] Re: 複数の検索クエリがある場合のスニペットの取得対象について＜Groonga＞