Node.js-无法使用Cheerio存储期望的数据

问题描述 投票:1回答:3

我正在尝试抓取网站,但输出存在很大问题。

我希望在站点上恢复一个名称,它会找到我的数据,但是当我尝试存储该值时,我只能存储值“ null”。

我是编程的初学者,我还没有研究promise,回调和异步,但是我认为这与问题密切相关。

这是我使用.text()时的Node.js代码>>
const http = require('follow-redirects/http');
const https = require('follow-redirects/https');
const cheerio = require('cheerio');

https.get('https://www.example.com/search?q=' + entreprise, response => {
  response.on('data', chunk => {
    const $ = cheerio.load(chunk, {
      xmlMode : false
    });

    domaine = $('div#presentationlien.FichePresentation__link.mt-13 p.fs-12 a.Link').text()

    JSON.parse(JSON.stringify(domaine))

    console.log(domaine);

  });

}).on('error', err => {
  console.error(err);
});

HTML:
    ...
    <div id="synthese" class="break-word mt-29">
        <p class="fs-12">
            <a class="lien" href="/societe/renault-sas-780129987.html">RENAULT SAS</a>, soci&#xFFFD;t&#xFFFD; par actions simplifi&#xFFFD;e est active depuis 48 ans.<br>Localis&#xFFFD;e &#xFFFD; BOULOGNE-BILLANCOURT (92100), elle est sp&#xE9;cialis&#xE9;e dans le secteur d&apos;activit&#xFFFD; de la construction de v&#xFFFD;hicules automobiles. Son effectif comprends plus de 10 000 salari&#xE9;s.
        </p>


        <div id="presentationlien" class="FichePresentation__link mt-13"> 
            <p class="fs-12">Sur l&apos;ann&#xE9;e 2018 elle r&#xE9;alise un chiffre d&apos;affaires de <span class="synthesenumber">48333000000,00  EU</span>.</p>
            <p class="fs-12">Le total du bilan a augment&#xE9; de 0,97 % entre 2017 et 2018.</p>


            <p class="fs-12">Societe.com recense <a class="Link" href="#etab"><span id="synthnbetab" class="synthesenumber">219</span> &#xE9;tablissements <span id="synthnbetabexact"></span></a> et 4 <a class="Link" href="#event">&#xE9;v&#xE9;nements</a> notables depuis un an.</p>



            <p class="fs-12">
            <a class="Link" href="https://dirigeant.societe.com/dirigeant/Jean-Dominique.SENARD.69230073.html">Jean-Dominique SENARD</a>, est pr&#xFFFD;sident de la soci&#xFFFD;t&#xFFFD; RENAULT SAS.
            </p>



        </div>



    </div>
...

我想获取的数据:

Jean-Dominique SENARD

<p class="fs-12">
            <a class="Link" href="https://dirigeant.societe.com/dirigeant/Jean-Dominique.SENARD.69230073.html">Jean-Dominique SENARD</a>, est pr&#xFFFD;sident de la soci&#xFFFD;t&#xFFFD; RENAULT SAS.
            </p>

输出控制台:

219 établissements événementsJean-Dominique SENARD

但是,当我尝试将“ Jean-Dominique SENARD”数据存储在变量中以进行操作时,我不能,因为它返回“ undefined”或“ null”。

您能帮我吗?谢谢。

我正在尝试抓取网站,但输出存在很大问题。我希望在站点上恢复一个名称,它会找到我的数据,但是当我尝试存储该值时,我只能存储值“ null”。 ...

javascript node.js asynchronous web-scraping cheerio
3个回答
1
投票

我建议使用基于承诺的方法,这将提供最易读的代码恕我直言。


0
投票

有2个类别为p.fs-12 a.Link的元素。因此,如果要选择第二种方法,则应使用另一种方法。


0
投票

谢谢大家的帮助,只有发现的结果为空...

© www.soinside.com 2019 - 2024. All rights reserved.