whois脚本没有获得某些域名

问题描述 投票:1回答:2

我正在尝试使用此函数获取whois数据:

function getDomain()
$domain = 'stackoverflow.com';
$whois = '';
$connection = @fsockopen('whois.internic.net', 43);
if ($connection) {
    @fputs($connection, $domain ."\r\n");
    while (!feof($connection)) {
        $whois .= @fgets($connection, 128);
    }
}
fclose($connection);
return $whois;
}

它适用于某些领域,但当我尝试“apple.com”,“cnn.com”或“google.com”得到这个:

APPLE.COM.ZON.COM
APPLE.COM.WWW.ZON.COM
APPLE.COM.WWW.BEYONDWHOIS.COM
APPLE.COM.WAS.PWNED.BY.M1CROSOFT.COM
APPLE.COM.MORE.INFO.AT.WWW.BEYONDWHOIS.COM
APPLE.COM.IS.OWN3D.BY.NAKEDJER.COM
APPLE.COM.IS.0WN3D.BY.GULLI.COM
APPLE.COM.DENIS.DA.DOIDE.DA.PIEM.UNIX-BG.COM
APPLE.COM.BEYONDWHOIS.COM
APPLE.COM.AT.WWW.BEYONDWHOIS.COM
APPLE.COM
php whois
2个回答
2
投票

您的脚本仅查询

whois.internic.net

记住全世界有几个域/ IP提供商。

像大多数Linux发行版中提供的那些完整的工具知道尝试几个不同的服务器然后检查所有这些服务器中的数据以确定哪个服务器是权威服务器。

从记忆中我相信有5个全球权威区域,你已经拥有的内在区域加上:

whois.afrinic.net
whois.lacnic.net
whois.arin.net
whois.apnic.net

成熟(我们在欧洲使用的中央登记处)也有一个,但它并不像你期望的那样'whois.ripe.net'而且我现在没时间查阅它了。

现在,除了我上面所说的,你可能想要考虑以下几点。如果他们认为您在24小时内提出了太多请求,那么大多数whois权限会限制(甚至阻止)您的流量,而您可能需要考虑登录到上述任何提供商的ftp站点并下载各个位然后编写(或查找)您自己的脚本来处理它们。

我目前使用我自己的一个服务器来做这件事,它使用以下shell脚本连接(每24小时一次):

#!/bin/bash
rm -f delegated-afrinic-latest
rm -f delegated-lacnic-latest
rm -f delegated-arin-latest
rm -f delegated-apnic-latest
rm -f delegated-ripencc-latest
rm -f ripe.db.inetnum
rm -f apnic.db.inetnum
rm -f ripe.db.inetnum.gz
rm -f apnic.db.inetnum.gz
wget ftp://ftp.afrinic.net/pub/stats/afrinic/delegated-afrinic-latest
wget ftp://ftp.lacnic.net/pub/stats/lacnic/delegated-lacnic-latest
wget ftp://ftp.arin.net/pub/stats/arin/delegated-arin-latest
wget ftp://ftp.apnic.net/pub/stats/apnic/delegated-apnic-latest
wget ftp://ftp.ripe.net/ripe/stats/delegated-ripencc-latest
wget ftp://ftp.ripe.net/ripe/dbase/split/ripe.db.inetnum.gz
ftp -n -v ftp.apnic.net <<END
user anonymous [email protected]
binary
passive
get /apnic/whois-data/APNIC/split/apnic.db.inetnum.gz apnic.db.inetnum.gz
bye
END
gunzip ripe.db.inetnum
gunzip apnic.db.inetnum

然后,我有一个自定义编写的程序,将文件解析为自定义数据库结构,然后我的服务器从中进行查询。

由于所有服务器都相互镜像数据,因此您应该能够从一台服务器获取完整的数据集,但如果不是,则修改上述shell脚本以从其他服务器下载数据并不需要太多,所有他们回应'ftp。????'并具有相同的通用文件夹结构。

我无法帮助你使用解析器,因为它包含专有代码,但文件格式(特别是如果你得到拆分文件)与你在典型的whois输出中看到的相同,所以它很容易使用。

通过下载和处理您自己的数据,您可以解决提供商施加的任何限制,结果是查询自己的数据存储最有可能比每次从服务器向查询服务器发出请求更快有人输入IP地址。

UPDATE

有很多甚至更多的whois服务器,而不仅仅是我在这里列出的那些,而不是在这个页面上列出所有这些,这个链接:

https://jfreewhois.googlecode.com/git/JFreeWhois/src/uk/org/freedonia/jfreewhois/etc/serverlist.xml

将带您到一个XML文件,该文件是Google代码项目的一部分,返回的XML文件将为您提供所有可用服务器的相当大的列表,以及每个服务器提供的TLD列表,使您能够调整脚本根据输入的地址与正确的服务器通信。


0
投票

使用=标记(例如=example.com而不仅仅是域名)为您的查询添加前缀,您将看不到额外的结果。

长期以来,默认情况下,whois服务器执行前缀搜索,并返回存储在注册表中的每个对象,其名称以您在查询中提供的名称开头。而且,尽管鲜为人知,名称服务器是存储在注册表中的对象,很久以前注册无用的名称服务器只是为了“恶作剧”无辜的观察者进行查询并将结果作为你的结果回归,这可能被一些人解释不知道细节是“哦,天哪,XXXX被黑了,看到这个结果......”,因为你基本上可以添加任何单词作为标签(在两个点之间),只要你完成一个.COM / .NET你持有的域名。当然,这与攻击无关。

通过在前缀中使用相等的字符串,可以强制完全匹配而不是前缀匹配。请注意,纯粹主义者可以添加,即使在这种情况下,您可能会看到两个记录,因为您可以注册一个名称服务器,其名称是域名的名称(这比使用更令人困惑,但它可能会发生)。

对于.COM域名,您应该使用相关的注册表whois服务器,即whois.verisign-grs.com。同样适用于其他顶级域名。请注意,根据您搜索的内容,每个域可能需要2个whois查询,因为.COM / .NET(目前)仍然是一个瘦注册表。有关这一点的更多详细信息,请参阅我在https://unix.stackexchange.com/a/407030/211833的回答。

© www.soinside.com 2019 - 2024. All rights reserved.