使用PHP获取DOM元素

问题描述 投票:0回答:2

我正在努力理解如何在 PHP 中使用 DOMElement 对象。我找到了这段代码,但我不确定它是否适用于我:

$dom = new DOMDocument();
$dom->loadHTML("index.php");

$div = $dom->getElementsByTagName('div');
foreach ($div->attributes as $attr) {
     $name = $attr->nodeName;
     $value = $attr->nodeValue;
     echo "Attribute '$name' :: '$value'<br />";
}

基本上我需要的是在 DOM 中搜索具有特定

element
id
,之后我需要提取一个非标准的
attribute
(即我用 JS 编写并添加的),所以我可以看到它的价值。原因是我需要
$_GET
中的一部分和基于重定向的 HTML 中的一部分。如果有人可以解释我如何使用 DOMDocument 来实现此目的,那将会很有帮助。我真的很难理解正在发生的事情以及如何正确实施它,因为我显然做得不对。

编辑(我基于评论的位置):

这是我的代码第 4-26 行供参考:

<div id="column_profile">
    <?php
        require_once($_SERVER["DOCUMENT_ROOT"] . "/peripheral/profile.php");            
        $searchResults = isset($_GET["s"]) ? performSearch($_GET["s"]) : "";

        $dom = new DOMDocument();
        $dom->load("index.php");

        $divs = $dom->getElementsByTagName('div');
        foreach ($divs as $div) {
            foreach ($div->attributes as $attr) {
              $name = $attr->nodeName;
              $value = $attr->nodeValue;
              echo "Attribute '$name' :: '$value'<br />";
            }
        }
        $div = $dom->getElementById('currentLocation');
        $attr = $div->getAttribute('srckey');   
        echo "<h1>{$attr}</a>";
    ?>
</div>

<div id="column_main">

这是我收到的错误消息:

Warning: DOMDocument::load() [domdocument.load]: Extra content at the end of the document in ../public_html/index.php, line: 26 in ../public_html/index.php on line 10

Fatal error: Call to a member function getAttribute() on a non-object in ../public_html/index.php on line 21
php html dom tags
2个回答
22
投票

getElementsByTagName
返回一个元素列表,因此首先需要循环遍历元素,然后遍历它们的属性。

$divs = $dom->getElementsByTagName('div');
foreach ($divs as $div) {
    foreach ($div->attributes as $attr) {
      $name = $attr->nodeName;
      $value = $attr->nodeValue;
      echo "Attribute '$name' :: '$value'<br />";
    }
}

就您而言,您说您需要一个特定的 ID。这些应该是唯一的,所以要做到这一点,您可以使用(注意

getElementById
可能不起作用,除非您先调用
$dom->validate()
):

$div = $dom->getElementById('divID');

然后获取你的属性:

$attr = $div->getAttribute('customAttr');

编辑

$dom->loadHTML
仅读取文件的内容,不执行它们。
index.php
不会这样运行。你可能需要做类似的事情:

$dom->loadHTML(file_get_contents('http://localhost/index.php'))

2
投票

如果重定向来自外部服务器,您将无法访问 HTML。让我这样说:在您尝试解析 DOM 时,该 DOM 并不存在。您可以做的是将文本传递给 DOM 解析器,然后以这种方式操作元素。或者更好的方法是将其添加为另一个 GET 变量。

编辑:您是否也知道客户端可以更改 HTML 并让它传递他们想要的任何内容? (使用Firebug等工具)

© www.soinside.com 2019 - 2024. All rights reserved.