问题是如何使用cheerio获取具有沙箱元素的iframe的src

问题描述 投票:0回答:1

Hello devs,

我正在尝试从iframe中获取src,但无法获取该url。显然,iframe具有sandbox元素,不允许我看到src。

[我正在使用cloudcracraper库,该库可帮助我绕过cloudflare块

没有办法获取src值吗?

非常感谢您的帮助!

这里是示例代码

const cloudscraper = require('cloudscraper');
const cheerio = require('cheerio');


const main = async() =>{
  let url = "https://playerhost.net/show/vikings/01-01?watching=R9rz2SEFDoimDILGkMSwQMtxB";
  let res = await cloudscraper(url , {method: 'GET'});
  let $ = cheerio.load(res);
  const iframeURL = $('iframe').attr('src');
  console.log(iframeURL)
};

main();

javascript iframe web-scraping cheerio
1个回答
0
投票

使用操纵up的解决方案

const requestIframeWithAttrSandBox = async(url) =>{
  const browser = await puppeteer.launch();
  const page = await browser.newPage();
  await page.goto(url);

  const urls = await page.$$eval('iframe', el=> [].map.call(el, d => d.src));
  await browser.close();

  const _url = urls[0];
  return _url
}

最新问题
© www.soinside.com 2019 - 2024. All rights reserved.