发布网友
共5个回答
热心网友
lucene的效率没有问题,你可以100W条记录的索引放在一台机器上,用nutch分开检索的算法,或者用hadoop存储索引,自己写一个indexsearcher,但是需要注意各个机器上的结果是本地最优不是全局最优的结果,如果想全局最优的结果还得采用全局频率计数(Nutch现在有没有我不清楚),或者放开各个机器返回结果的数量,从算法理论的角度上最大可能的获得最优解。100W记录的响应我测试过,应该可以满足要求。等你遇到什么问题,可以再联系,lucene后面的基准测试你也可以看看。
老吴
热心网友
http://www.me.lv/jse/
这里有个免费的,按理说应该C++,这个是多层的结构不是mvc结构
热心网友
lucene就足够了.
主要看检索的复杂度, 单纯检索来说lucene比数据库高的多
Servlet只是做交互的, 不是做检索的.
热心网友
Heritrix或者Nutch
其实Lucence没啥不好的,不过根据Lz的需求,我的提议未尝不是一个好的解决方案
你持久层不用Hibernate可以试验下Ibatis+Resin
热心网友
lucene有个 neuth 的项目,可以做搜索
全文检索是肯定要的,数据库自带的向来不被看好。