在获取页面后,我只需要保留其正文内容。以下代码不起作用(即,从日志中可以看到html
变量在.replace
代码行之后没有更改)。怎么了?
var response = UrlFetchApp.fetch('https://stackoverflow.com/questions/58049531/another-importxml-returning-empty-content');
var html=response.getContentText();
html=html.replace(/.*(<body[^>]*)/m, '$1');
html=html.replace(/<\/body>.*/m, '</body>');
Logger.log(html);
尝试一下:
function getBody(html) {
var body=html.slice(html.indexOf('<body')+'<body>'.length,html.indexOf('</body'));
Logger.log(body);
return body;
}