使用Cheerio格式化数据

问题描述 投票:0回答:1

我想从网站获取IP列表并将其添加到数组中。该网站显示如下数据:

<tbody><tr role="row" class="odd">
<td>131.108.216.44</td>
<td>47267</td>
<td>BR</td>
<td class="hm">Brazil</td>
<td>elite proxy</td>
<td class="hm">no</td>
<td class="hx">yes</td>
<td class="hm">2 minutes ago</td>
</tr>
<tr role="row" class="even">
<td>85.173.165.36</td>
<td>46330</td>
<td>RU</td>
<td class="hm">Russian Federation</td>
<td>elite proxy</td>
<td class="hm">no</td>
<td class="hx">yes</td>
<td class="hm">2 minutes ago</td>
</tr>
</tbody>

这实际上是一个非常长的列表,包含100个表,但是格式相同。

我所做的是:

var c = new Crawler({
maxConnections: 1,
callback: function (error, res, done) {
    if (error) {
        console.log(error)
    } else {
        var $ = res.$;
        $('tbody>tr>td').each((i, el) => {
            const item = $(el)
            console.log(item.text());

        })


    }
    done();
}
})

c.queue({
uri: 'https://free-proxy-list.net/'
})

我想保留网站上的前10个IP,并将它们添加到数组中。

node.js web-scraping web-crawler cheerio
1个回答
0
投票
前十个看起来像这样:
© www.soinside.com 2019 - 2024. All rights reserved.