如何按]排序HTML元素> 日期并按 in Java?删除重复项 我有一个需要在Java中进行更改的HTML代码段,我一直在使用JSOUP进行解析,但是我觉得它可能没有效率。我在这里上传了我要寻找的图片。从TD新闻的日期到最早的日期进行排序,如果有重复,则将href整体删除。我也有将包含给定div的arraylist ObservableList<String> names; 我认为一种方法可能是遍历列表并从该名称中一直获取直到div被击中?我觉得这是一个简单的问题,我想不通,谢谢您的帮助! foreach(String name: names) {} Before example Sorted without duplicates example HTML(无重复项:] <div>CHTR</div> <td width="130" align="right" style="white-space:nowrap">Mar-04-20 08:54AM&nbsp;&nbsp;</td> </br> <a sname='CHTR' href="https://test.com/news/why-charter-chtr-stock-might-135401270.html" target="_blank" class="tab-link-news">Why Charter (CHTR) Stock Might be a Great Pick</a></br> <td width="130" align="right">Mar-04-20 08:53AM&nbsp;&nbsp;</td> </br> <a sname='CHTR' href="https://test.com/news/charter-offers-senior-unsecured-notes-135400843.html" target="_blank" class="tab-link-news">Charter Offers Senior Unsecured Notes</a>. </br> <div>PEGI</div> <td width="130" align="right" style="white-space:nowrap">Mar-04-20 12:49 PM&nbsp;&nbsp;</td> </br> <a sname='PEGI' href="www.test.com/news/3548648-pattern-energy-low-odds-of-competing-bid-raymond-james-says">Pattern Energy has low odds of competing bid, Raymond James says</a></br> <div>CHTR</div> <td width="130" align="right" style="white-space:nowrap">Mar-04-20 12:39 PM&nbsp;&nbsp;</td> </br> <a sname='CHTR' href="www.test.com/news/3548649-charter-offering-senior-notes">Charter offering more senior notes</a></br> <div>PEGI</div> <td width="130" align="right" style="white-space:nowrap">Mar-04-20 12:49 PM&nbsp;&nbsp;</td> </br> <a sname='PEGI' href="www.test.com/news/3548648-pattern-energy-low-odds-of-competing-bid-raymond-james-says">Pattern Energy has low odds of competing bid, Raymond James says</a></br> <td width="130" align="right" style="white-space:nowrap">Mar-04-20 08:40 AM&nbsp;&nbsp;</td> </br> <a sname='PEGI' href="www.test.com/news/greatbuy">Great buy with PEGI</a></br> 我有一个需要在Java中更改的HTML代码段,我一直在使用JSOUP进行解析,但是我觉得它可能没有效率。我在这里上传了我要寻找的图片。 ...

问题描述 投票:0回答:2

我有一个需要在Java中进行更改的HTML代码段,我一直在使用JSOUP进行解析,但是我觉得它可能没有效率。我在这里上传了我要寻找的图片。从TD新闻的日期到最早的日期进行排序,如果有重复,则将href整体删除。我也有将包含给定div的arraylist

java html html-table jsoup attr
2个回答
0
投票

也许我们可以在html字符串中插入一些内容,以便可以利用Collections.sort?


0
投票

[不确定我是否理解正确,但是将HTML解析为HashMap以获取键值对会怎样?至少可以消除重复。然后,您可以执行以下操作:

© www.soinside.com 2019 - 2024. All rights reserved.