javascript如何找到包含文本的DOM节点?

问题描述 投票:0回答:2

给定一个获取的 html 页面,我想找到包含一部分文本的特定节点。我想最困难的方法是逐一迭代所有节点,尽可能深入,并针对每种情况进行搜索,例如

.includes()

但是明智的做法是怎样的呢?一定有什么东西,但我无法正确谷歌到它

    response = axios.get(url);
    let parsedHtml = parser.parseFromString(response.data, 'text/html');
    for (let i = 0; i < parsedHtml.children.length; i++)
       if (parsedHtml.children[i].textContent.includes('hello'))
          console.log(parsedHtml.children[i])

*这不起作用

*示例代码

<html>
 <body>
  <div>dfsdf</div>
  <div>
   <div>dfsdf</div>
   <div>dfsdf</div>
  </div>
  <div>
   <div>
    <div>hello</div>
   </div>
  </div>
  <div>dfsdf</div>
 </body>
 </html>

我想检索

<div>hello</div>
作为节点元素

javascript dom html-parsing domparser
2个回答
2
投票

几乎确信我必须以经典方式遍历 DOM 后,我在这里找到了这个 Javascript:如何循环遍历页面上的所有 DOM 元素?这确实很棒:

    let nodeIterator = document.createNodeIterator(
        parsedHtml,
        NodeFilter.SHOW_ELEMENT,
        (node) => {
            return (node.textContent.includes('mytext1')
                || node.textContent.includes('mytext2'))
                && node.nodeName.toLowerCase() !== 'script' // not interested in the script
                && node.children.length === 0 // this is the last node
                ? NodeFilter.FILTER_ACCEPT : NodeFilter.FILTER_REJECT;
        }
    );
    let pars = [];
    let currentNode;

    while (currentNode = nodeIterator.nextNode())
        pars.push(currentNode);
    console.log(pars[0].textContent); // for example

0
投票

您可以像这样使用 jQuery 的

:contains()
选择器

$(":contains('hello')")

请注意,这也会计算恰好包含相同文本的所有父节点。如果您的 DOM 结构允许,最好定位您正在查找的节点的type(即类选择器),然后检查该类型的元素是否包含您正在查找的文本。

CodePen 中的演示

曾考虑将 CSS 中的

:contains 作为 CSS 3 中的内容选择器,但已被放弃。

进一步阅读

© www.soinside.com 2019 - 2024. All rights reserved.