使用jsoup java排除“ No image url”

问题描述 投票:0回答:1

我具有以下代码,它们可以很好地从网页上获取图像URL,然后下载该URL。但是在某个地方找不到图像,它存储了一个虚拟png。我希望如果“没有可用的图像”,那么它不应下载图像并跳过它。

        Document document = Jsoup.connect(webpageURL).userAgent("Mozilla/17.0").get();
        Elements elements = document.select("div.img-container.ratio-11-10");

        for (Element e : elements) {
            Element imageElement = e.getElementsByTag("img").first();

            String imageURL = imageElement.attr("abs:src");
            InputStream inputStream = new URL(imageURL).openStream();

            Files.copy(inputStream, Paths.get("src/main/resources/" + ID + ".jpg"));
         }

从中提取imageURL的示例HTML代码

img src =“ https://www.bbcgoodfood.com/sites/default/files/styles/recipe/public/sites/all/themes/bbcw_goodfood/images/dummy-content/member-recipe-icon.png” alt =“没有可用的图像” title =“没有可用的图像”>

我如何修改我的代码,以便在存在“无可用图像”的情况下跳过它?谢谢

java jsoup
1个回答
0
投票

获得imageElement后,检查属性值,然后继续下一个元素:

if(imageElement.attr("alt").equals("No image available")){
    continue;
}
© www.soinside.com 2019 - 2024. All rights reserved.