php结合正则批量抓取网页中邮箱地址
投稿:hebedich
目前在做一个项目,需要提取一个小型网站的所有邮箱地址,度娘了一下,方法还挺多,这里给大家总结几个比较实用的,分享给大家。
php如何抓取网页中邮箱地址,下面我就给大家分享一个用php抓取网页中电子邮箱的实例。
<?php $url='https://www.jb51.net'; //要采集的网址 $content=file_get_contents($url); //echo $content; function getEmail($str) { //$pattern = "/([a-z0-9]*[-_\.]?[a-z0-9]+)*@([a-z0-9]*[-_]?[a-z0-9]+)+[\.][a-z]{2,3}([\.][a-z]{2})?/i"; $pattern = "/([a-z0-9\-_\.]+@[a-z0-9]+\.[a-z0-9\-_\.]+)/"; preg_match_all($pattern,$str,$emailArr); return $emailArr[0]; } print_r( getEmail($content)); ?>
方法2:
<?php $url='https://www.jb51.net'; //当页已留邮箱 $content=file_get_contents($url); //获取页面内容 function getEmail($str) { //匹配邮箱内容 $pattern = "/([a-z0-9\-_\.]+@[a-z0-9]+\.[a-z0-9\-_\.]+)/"; preg_match_all($pattern,$str,$emailArr); return $emailArr[0]; } print_r( getEmail($content)); ?>
以上所述就是本文的全部内容了,希望大家能够喜欢。