使用linkGrabber在python中从Google搜索中获取“ href”

Question

好，所以我要做的就是在第一个Google搜索中获得第一个链接。我尝试使用beautifoulsoup，但是它根本没有用，我似乎找不到找到链接的方法。我尝试使用linkGrabber，所以现在我得到了google搜索中的所有网址（我将结果限制为每页仅1个）。我的代码是：

import re
import linkGrabber
import urllib

input = str(input('Give movie name:  '))
input = urllib.parse.quote_plus(input)
imdb_s = '+imdb+review'
n = 1
g_s = 'https://www.google.com/search?q='+ input + imdb_s +'&num=' + str(n)
links = linkGrabber.Links(g_s)
gb = links.find(pretty=True)
print(gb)

但是，当我打印时，我会得到15个来自google的链接，这些链接我不想使用，我只想专注于一个特定的href，就可以了。谁能帮我吗？

Answer 1

您可以使用Google搜索库-我认为请点子安装Google。该库还依赖于精美的汤，但适合仅返回搜索结果。问题在于，当您搜索时google返回的页面上有广告和其他不是实际搜索结果的链接。

您也可以将查询更改为“ site：imdb.com +”，仅在imbd上进行搜索。

就是说，我已停止将其用于谷歌搜索需求，因为它违反了Google的服务条款。我没有在讲什么，但现实是我似乎无法获得太多的可靠性，因为Google一直在嗅探机器人并重新捕获它们。

正确的方法是使用Google的自定义搜索API-这也仅适用于返回您所需的信息，而且每天免费进行100次搜索。

使用linkGrabber在python中从Google搜索中获取“ href”

问题描述投票：0回答：1

1个回答

最新问题

使用linkGrabber在python中从Google搜索中获取“ href”

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1