urllib 相关问题

Python模块提供了一个高级接口,用于通过万维网获取数据。 urllib2的前身。在Python 3中,urllib2和urllib已经重新组织并合并到urllib中。

Python:需要等待 BeautifulSoup 和 Urllib 才能解析网站

我正在尝试实时获取当前世界人口,但是当网页首次加载时,需要几秒钟来检索数据。当我运行程序时,我得到加载...而不是

回答 2 投票 0

如何在 Google URL 请求中指定日期范围?

我正在尝试在 Google 新闻 URL 请求中指定日期范围,虽然当我将它粘贴到 Chrome 中时它有效,但 urllib 只检索所有最新文章,所以我不确定问题是什么。 ...

回答 2 投票 0

urllib.error.URLError: <urlopen error unknown url type: https>

您好,我正在尝试学习网页抓取。我在 Windows 10 中安装了 Anaconda3。Conda 版本 4.5.12。 Python 版本 3.7.1。 我编写了以下产生上述错误的脚本。 进口BS4 f...

回答 6 投票 0

使用 python 从按钮按下解析 csv 文件

我有以下网址 https://pubmed.ncbi.nlm.nih.gov/?term=IBD 我想从中解析数据 (我发现他们没有反对抓取的东西),该网站是公开的,有一个“导出”按钮

回答 0 投票 0

解析GET参数

我有一个 REST API,其中的 url 如下所示: RRervice 类(pyrestful.rest.RestHandler): @get('/指标/{rparms}') def RR(self, rparms): 打印(rparms) ...

回答 1 投票 0

\ufeff 标识符中的无效字符

我有以下代码: 导入 urllib.request 尝试: url = "https://www.google.com/search?q=test" 标题 = {} usag = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.6; rv:25.0) Gecko/

回答 5 投票 0

urllib 带来的不带网站中的所有元素

我正在尝试使用此代码进行抓取: 从 bs4 导入 BeautifulSoup open_url = urllib.request.urlopen('https://en.wikipedia.org/wiki/Guitar') 吉他 = open_url.read() 汤 = BeautifulSoup(g...

回答 2 投票 0

如何使用urllib发送cookie

我正在尝试连接到一个网站,该网站要求您拥有特定的 cookie 才能访问它。对于这个问题,我们将 cookie 称为“required_cookie”,并将值称为“required_value ...

回答 2 投票 0

在“urllib.request.urlopen”中使用变量会引发错误

我想使用python3从NCBI网站获取数据。当我使用 fp = urllib.request.urlopen("https://www.ncbi.nlm.nih.gov/gene/?term=50964") mybytes = fp.read() mystr = mybytes.decode...

回答 2 投票 0

ssl.CertificateError: hostname 'example.com' doesn't match either of 'exampleserver.com'?

当我试图用urllib库打开一个网站时,我得到了这个错误。我不明白为什么会出现这个错误,目前我使用的是python 3.6版本,是版本问题吗?是版本的问题吗? url = 'https:/...

回答 1 投票 0

错误,"urljoin "的类型变量 "AnyStr "的值在mypy中不能为" Optional[str]"。在mypy中,"urljoin "的类型变量 "AnyStr "的值不能是 "Optional[str]"

我有这样一条语句: import os from urllib.parse import urljoin ES_SEARCH_URL = urljoin(base=os.getenv("ELASTICSEARCH_URL"), url="index_search") 我试过给很多类型的......

回答 1 投票 0

Python 如何从一个字符串中解析出 2 个 URL,然后将其映射回来?

我在pandas数据框中有一列,其中一些值是这样的格式。"From https:/......com?gclid=.... to https:/......com"。我想要的是只解析第一个URL,这样一来......

回答 1 投票 0

在Pycharm IDE中,Python Http请求无法工作

我在这里有点疯狂,觉得我一定是错过了一些明显的东西。我试图使用python和urllib3从一个网站上刮取数据。我的代码看起来像>>>import urllib3 >>&...。

回答 1 投票 0

如何用Python下载这个图片?

我有一个这样的直接链接:https:/picjumbo.comdownload?d=cow.jpg&n=cow&id=1。但是我不能用urllib.request.urlretrieve()下载,因为当我访问这个url时,浏览器 ...

回答 1 投票 -2

我不能从IDLE或cmd中运行python。

我的Python工作得很完美。从一天到另一天,我试着运行一个程序来报废,它开始给我以下错误。"没有名为irllib的模块 "请注意,我写的是irllib(带i)。我的...

回答 1 投票 0

为什么第二次线程就不能用了?

我是python的业余爱好者 我正在使用tkinter和urllib.request创建这个下载程序 我已经建立了一个没有任何线程的程序 当我下载一个文件时,它会冻结,直到...

回答 1 投票 0

Ip地址检查器不输出IP地址。

按照这里的代码,我得到了一个IP地址检查器。但是它没有输出IP地址,而是输出[]。代码:import urllib.request import re print("我们将尝试打开这个url,..."。

回答 1 投票 0

如何用urllib打开一个自定义协议的url?

我使用chrome Momentum扩展来定制我的浏览器新标签,并想写一个python脚本来获取它的每日仪表盘壁纸,现在我知道我可以通过url达到所需的页面......

回答 1 投票 0

无法从带有特殊字符的链接中下载文件。

很简单,我可以用urllib.request.urlretrieve下载一个文件,没有任何问题。但是,如果链接中有*这样的特殊字符,则无法下载。有什么办法可以绕过特殊 ...

回答 1 投票 0

如何才能获得比网站第一张表更多的请求?

import bs4 as bs import urllib.request link = urllib.request.urlopen('https:/www.health.pa.govtopicsdiseasecoronavirusPagesCases.aspx') soup = bs.BeautifulSoup(link, 'lxml') table = soup.find('...'。

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.