[Senna-dev 473] Re: Senna0.9.0

Back to archive index

Katsuya Utada utada****@themi*****
2007年 2月 22日 (木) 19:54:14 JST


うただです

 |GB単位の文書を1テーブルに格納するのは厳しくはないと思います。
 |おそらく、Senna 0.9.0のバグに遭遇していると予想されます。
 |Sennaの開発版では問題が修正されている可能性があります。

開発版で試したところMySQLが落ちなくなりました。
ありがとうございます。

1GB程の文書を1テーブルでテストしていて
ヒット件数が多いキーワードでorder byを併用すると
応答が遅い場合があるのですが、order by(とlimit)を併用しても
高速化する方法はないでしょうか?

mysql> select num from test where match(title,text) against('アメリカ');
(snip)
| 597717 | 
| 597733 | 
+--------+
45076 rows in set (1 min 5.43 sec)


mysql> select num from test where match(title,text) against('アメリカ') 
       order by num limit 45070,2;
+--------+
| num    |
+--------+
| 597670 | 
| 597671 | 
+--------+
2 rows in set (41.09 sec)

mysql> select num from test where match(title,text) against('アメリカ') 
       limit 45070,2
;
+--------+
| num    |
+--------+
| 262130 | 
| 393203 | 
+--------+
2 rows in set (0.19 sec)

order byにはこの場合PKを指定しています。
(MySQL5.0.24a+Rev290+2indpatch)



On Mon, 05 Feb 2007 20:38:22 +0900, Tasuku SUENAGA wrote:
 |ブラジルの末永です。
 |
 |>  |0.9系の新規インデックスで、追加のみを行っているのであれば
 |>  |新しいインデックス作成部分に未知のバグが存在する可能性があります。
 |> 
 |> MySQL-5.0.24a+Senna-0.9.0(ngram)
 |> で大きなテーブルをテストしているのですが、当方でもselect時に
 |> 語彙によってmysqlがリスタートを起こしたり、応答が遅くなる現象に
 |> 当たってしまいます。
 |> 
 |> 300万レコード程のinsert後、fulltext selectをしています。(updateはなし)
 |> ...
 |> GB単位の文章を1テーブルは厳しいでしょうか。
 |> もしご参考になりましたら幸いです。
 |
 |GB単位の文書を1テーブルに格納するのは厳しくはないと思います。
 |おそらく、Senna 0.9.0のバグに遭遇していると予想されます。
 |Sennaの開発版では問題が修正されている可能性があります。
 |
 |別途メールを差し上げたとおり、
 |実データをお借りできれば問題の再現が容易なのですが、
 |なかなかデータをお借りするのは難しいと思います。
 |
 |問題の再現ができるデータセットを作成いただければ、
 |原因の追究・修正ができると思います。
 |
 |---
 |Tasuku SUENAGA <a****@razil*****>
 |_______________________________________________
 |Senna-dev mailing list
 |Senna****@lists*****
 |http://lists.sourceforge.jp/mailman/listinfo/senna-dev
 |
 |

---
Katsuya Utada <utada****@themi*****>




Senna-dev メーリングリストの案内
Back to archive index