screen-scraping 相关问题

屏幕抓取(也称为网络抓取或数据抓取)是一种用于从用户界面收集和解析信息的软件技术。如果您的问题是关于从网站或Web-API进行抓取,请使用[web-scraping]标记。

如何将情绪词典导入R中以进行Kickstarter的数据抓取

我正在尝试使用R创建一个模型来测量文本中的情感。基本上,使用带有情感词的词典,我只想从大量的URL中提取“p”(段落)。我是 ...

回答 1 投票 1

Python请求模块无法从Web服务器获取最新数据

在下面的代码片段中,您可以看到我正在尝试从NCAA Men's Basketball网站上搜集一些数据。导入请求url =“https://www.ncaa.com/scoreboard/basketball-men/d1/”...

回答 3 投票 6

如何通过字符串解析查找特定的单词/数字并在找到时显示它们

我已经写了一些相当可疑的代码我确定,但它似乎做了这个工作。问题是它正在将数据打印到电子表格和我希望找到车辆的列中......

回答 1 投票 2

VBA刮刮多个网页

所以,我有以下代码来废弃网站上的数据,它没有任何问题。我的“问题”现在是我需要运行多个网页的代码,因为我的网站...

回答 1 投票 0

从网页上抓取youtube链接

我一直试图从网页上抓取youtube链接,但没有任何效果。这是我一直试图抓住的图片。这是我最近尝试过的代码:youtube_link = soup ....

回答 1 投票 0

刮不止一页

我试图从这个网站https://aabalat.com/wine/country/france scape数据(名称,品种,格式和价格)。我已经通过名称$ urls创建了一个数组,并且我推送了数组中的每个链接。对于每个新...

回答 1 投票 0

VBA Web Scraping脚本返回下标超出范围

问题:我一直在尝试从WebSite中删除数据,但它总是给我一个错误下标OutOf Range我不知道为什么,我使用完全相同的代码用于另一个WebSite并且它完美地运行...

回答 1 投票 4

VBA WebScraping没有任何回报

我一直试图从WebSite中删除数据,正如我之前的问题所示。由于社区,我能够弄清楚我的问题是什么,但现在我面临另一个问题。我没有得到任何......

回答 1 投票 0

来自file_get_contents的变量响应'https://en.wikipedia.org/wiki/Category:Upcoming_singles'

的file_get_contents( 'http://en.wikipedia.org/wiki/Category:Upcoming_singles');返回不同的结果(2个产品),而使用Chrome访问同一地址返回4个产品。在......

回答 4 投票 4

使用beautifulsoup通过Python抓取网页的问题

我使用下面的参考代码从网站上删除一些项目名称:# - * - coding:cp1252 - * - import csv import urllib2 import sys import from bs4 import BeautifulSoup page = urllib2.urlopen('...

回答 1 投票 -1

bs4 scraping:下载图像并将其保存在具有所需名称的本地文件夹中

我有代码打印我要下载的所有image_url接下来我想将它们保存在一个本地文件夹中,其中folder_name = scrap_images,所需的image_name = uni_name也在输出中...

回答 1 投票 -1

VBA WebScraping返回空值

我有以下代码来废弃网站上的数据,问题是它没有抓取任何数据,它没有显示任何错误,但也没有给我任何结果... Option Explicit Public ...

回答 1 投票 1

试图刮掉嵌套在标签中的一个元素

我试图仅捕获“其他”文本,实质上是提取强标记元素 &...

回答 2 投票 0

之后提取文本 tag in BeautifulSoup

我有一个从页面中提取数据的脚本。我可以抓大部分内容但是在“hr”标签之后会出现一些文字;我不知道怎么刮。 HTML代码如下:

回答 1 投票 0

如何在python3中的csv文件中写一次列

我正在从新闻网站抓取数据并保存到标题,新闻和img变量然后写入csv文件,但我得到了每个抓行的列名重复,我只想打印...

回答 2 投票 -1

我可以在app.run中抓取或提取数据吗?

我正在使用python和beautifulsoup,我需要在app.run下提取一些数据({“data”:Id“:”124330049“,”stock“:83})。当我试图找到这些值时,它返回一个空使用查找列表。我可以......

回答 1 投票 0

Python:刮擦分类广告网站。如何仅返回上次运行的最新条目?

我想留意一个分类广告列表页面,并在新的东西出现时让它为我。我在bs4中构建了一个相当天真的刮刀,它抓住了一个页面并刮擦了物品,价格......

回答 1 投票 0

我如何从BeautifulSoup中取出CData

我有一个我正在抓的网站,其结构如下。我希望能够从CData块中获取信息。我正在使用BeautifulSoup从页面中提取其他信息,...

回答 5 投票 6

Python BeautifulSoup返回的网页与我看到的网页不同

如果这是一个愚蠢的问题,我对web scraping或python都很新,所以请提前道歉。 URL = HTTPS://infoweb.newsbank.com/apps/news/results排序= YMD_date%3AD&P = AWNB&T =的maxResults = ...

回答 1 投票 2

Goutte按类型获取脚本元素

我正在尝试使用Goutte来获取页面的内容,在查看源代码时,有一个脚本我想要获取所有代码的内容......“@ ...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.