在我的程序中,我使用jsoup来解析url并生成一个html文档。我从中获取数据的网站只是一大块明文,并且没有元素或其他功能。我需要查看这个文档,并创建以特定字符模式开头和结尾的字符串。我一直在研究正则表达式。
目前,我认为实现目标的最佳方式是将HTML文档转换为字符串。我想要创建的每个子字符串都以“{”world“:”“开头,并以”“}结尾,但这些块之间的信息可以更改,并且具有可变长度。
我需要知道如何使用正则表达式来检测这些字符串并从中创建字符串,或者如果有更好的方法来完成我想要做的事情,
您可以使用String.split来分割字符串。如果您想要的部分由}{"world":""
分隔,那么您可以使用类似的东西作为分隔符:
String string = "{\"world\":\"whatever\"}{\"world\":\"something\"}";
String[] parts = string.split("}{\"world\":");
String part1 = parts[0]; // {"world":"whatever"
String part2 = parts[1]; // "something"}
然后我想你可以使用String.replace从每个部分切出你不想要的部分:
String part1Cut = part1.replace("{\"world\":", ""); // "whatever"
String part2Cut = part2.replace("}", ""); // "something"
我确信有一种更清晰的方法可以做到这一点(我没有太多操作字符串的经验),但我只是想把这些方法带给你,以防你不知道它们。