从URL中提取表中数据的最佳方法是什么?
简而言之,我需要从以下两个表中获取实际数据:http://www.oddsportal.com/sure-bets/
在此示例中,数据将为“Paddy power”和“3.50”。请参阅此图像:
(很抱歉发布这样的图像,但我仍然需要声誉,我稍后会编辑)http://img837.imageshack.us/img837/3219/odds2.png
我试过Jsoup,但我不知道这是不是最好的方法?而且我似乎无法正确地向下导航,我尝试过这样的事情:
tables = doc.getElementsByAttributeValueStarting("class", "center");
link = doc.select("div#col-content > title").first();
String text1 = doc.select("div.odd").text();
表格似乎得到了一些数据,但不包括表格中的文字
对不起。要检索的第二个字段由JavaScript填充。 Jsoup不执行JavaScript。要选择第一行的标题,您可以使用:
Document doc = Jsoup.connect("http://www.oddsportal.com/sure-bets/").get();
Elements tables = doc.select("table.table-main").select("tr:eq(2)").select("td:eq(2)");
System.out.println(tables.select("a").attr("title"));
链选择用于可视化。