什么是最简单的搜索引擎工具?

问题描述 投票:0回答:2

我想构建一个搜索引擎,该引擎将搜寻一个网站,例如recipe.com,或者列出某种产品或服务的网站,对相关信息进行索引,然后能够执行多面搜索。

我曾尝试使用Nutch和Solr,但是我只能索引相关信息而不是整个网页并在字段中对其进行索引。我现在正尝试使用Nutch plugin来解析html页面,但是我对Web的知识并不擅长,我想知道是否有更简便的方法。

我不是在寻找最佳解决方案。

indexing web-crawler search-engine facet
2个回答
0
投票

抓取python工具将有助于抓取和抓取。您可以将产品刮到json结构,然后在elasticsearch中建立索引。大多数OSS工具都需要您动手(即编程)。

P.S:您需要的不仅仅是搜索:请编辑标题“最容易抓取,抓取,索引和搜索的工具是什么”。


-1
投票

Windows已经内置了搜索引擎。从NT4到WinXP都有索引服务,从WinXP到Win8都有Windows桌面搜索,它们都可以配置为索引任意内容,包括远程站点。您要做的就是配置源,确保索引已完成,然后使用查询引擎进行搜索。

或者,MSSQL服务器自2005年以来就内置了全文本搜索。自MSSQL 2008起,已经内置了HTML过滤器。

或者,如果您不喜欢Windows,则有很多第三方解决方案,包括免费的和商业的。 Here’s the comparison.我没有任何经验,因此无法推荐。

© www.soinside.com 2019 - 2024. All rights reserved.