如何使用Nokogiri从HTML代码获取邮件地址?我正在考虑使用正则表达式,但不知道这是否是最佳解决方案。
示例代码:
<html>
<title>Example</title>
<body>
This is an example text.
<a href="mailto:[email protected]">Mail to me</a>
</body>
</html>
如果不是在某些标记之间,则Nokogiri中是否存在一种获取邮件地址的方法?
您可以使用xpath提取电子邮件地址。
首先,我对Nokogiri一无所知。但是我只是去了他们的网站,看了看文档,看起来很酷。
CSS选择器现在(最终)可以在参数开头找到文本:
尝试获取整个html页面并使用正则表达式。