2008-02-18

最近想找些关于全文检索的资料

关键字: rails
这几天想找找跟全文检索相关的资料。看了Robbin几个人的文章发现都只是点到为止。提到了几种方法solr,sphinx ,ferret 。具体请看这里 robbin 的文章。其中讲到了全文检索中中文分词的一些难题。因为还是初学者,很多东西不是很了。找了些国外的资料发现很多国外的网站也开始从ferret转移到用sphinx。
以下是一些对ferret的一些评论:
引用
In past projects I’ve had some limited success, and spectacular failure, with Ferret, a Ruby port of the Java based Lucene search. It was slow, leaked memory and generally caused more pain than it should.

引用
Ferret is unstable in production. Segfaults, corrupted indexes
> galore. We've switched around 40 clients form ferret to sphinx and
> solved their problems this way. I will never use ferret again after
> all the problems I have seen it cause peoples production apps.

虽然这些评论并非都很可观,但也说明了ferret确实存在某些问题。所以决定先学学sphinx。

但是sphinx相关文档少的可怜(可能是我不太会找)。在官方网站上发现了这篇sphinx速成指南.
还有几篇rails结合sphinx使用的文章。 Rails searching with Sphinx

Using Sphinx search engine in Ruby on Rails

还有一篇也是robbin的JavaEye3.0开发手记之三 - 狮身人面
过几天有时间在来研究下中文分词。
评论
发表评论

您还没有登录,请登录后发表评论

genki
搜索本博客
博客分类
最近加入圈子
最新评论