首页 行业资讯 宠物日常 宠物养护 宠物健康 宠物故事

关于java搜索引擎

发布网友

我来回答

5个回答

热心网友

lucene的效率没有问题,你可以100W条记录的索引放在一台机器上,用nutch分开检索的算法,或者用hadoop存储索引,自己写一个indexsearcher,但是需要注意各个机器上的结果是本地最优不是全局最优的结果,如果想全局最优的结果还得采用全局频率计数(Nutch现在有没有我不清楚),或者放开各个机器返回结果的数量,从算法理论的角度上最大可能的获得最优解。100W记录的响应我测试过,应该可以满足要求。等你遇到什么问题,可以再联系,lucene后面的基准测试你也可以看看。
老吴

热心网友

http://www.me.lv/jse/

这里有个免费的,按理说应该C++,这个是多层的结构不是mvc结构

热心网友

lucene就足够了.

主要看检索的复杂度, 单纯检索来说lucene比数据库高的多

Servlet只是做交互的, 不是做检索的.

热心网友

Heritrix或者Nutch

其实Lucence没啥不好的,不过根据Lz的需求,我的提议未尝不是一个好的解决方案

你持久层不用Hibernate可以试验下Ibatis+Resin

热心网友

lucene有个 neuth 的项目,可以做搜索

全文检索是肯定要的,数据库自带的向来不被看好。

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com