使用linkGrabber在python中从Google搜索中获取“ href”

问题描述 投票:0回答:1

好,所以我要做的就是在第一个Google搜索中获得第一个链接。我尝试使用beautifoulsoup,但是它根本没有用,我似乎找不到找到链接的方法。我尝试使用linkGrabber,所以现在我得到了google搜索中的所有网址(我将结果限制为每页仅1个)。我的代码是:

import re
import linkGrabber
import urllib

input = str(input('Give movie name:  '))
input = urllib.parse.quote_plus(input)
imdb_s = '+imdb+review'
n = 1
g_s = 'https://www.google.com/search?q='+ input + imdb_s +'&num=' + str(n)
links = linkGrabber.Links(g_s)
gb = links.find(pretty=True)
print(gb)

但是,当我打印时,我会得到15个来自google的链接,这些链接我不想使用,我只想专注于一个特定的href,就可以了。谁能帮我吗?

python beautifulsoup
1个回答
0
投票

您可以使用Google搜索库-我认为请点子安装Google。该库还依赖于精美的汤,但适合仅返回搜索结果。问题在于,当您搜索时google返回的页面上有广告和其他不是实际搜索结果的链接。

您也可以将查询更改为“ site:imdb.com +”,仅在imbd上进行搜索。

就是说,我已停止将其用于谷歌搜索需求,因为它违反了Google的服务条款。我没有在讲什么,但现实是我似乎无法获得太多的可靠性,因为Google一直在嗅探机器人并重新捕获它们。

正确的方法是使用Google的自定义搜索API-这也仅适用于返回您所需的信息,而且每天免费进行100次搜索。

© www.soinside.com 2019 - 2024. All rights reserved.