/**
Obtenemos el primer [1] parámetro "argv" pasado al script
*/
$stio_web = $_SERVER["argv"][1];
//Creamos socket para establecer conexión con el servidor remoto
$socket = socket_create(AF_INET, SOCK_STREAM, SOL_TCP);
if(!@socket_connect($socket, $sitio_Web, 80)){
return -1;
}
//Formato de la petición a realizar.
$http =
"GET / HTTP/1.1\\r\\n".
"Host: $sitio_web\\r\\n".
"User-Agent: Mozilla/5.0 (Windows; U; Windows NT 6.1; es-ES; rv:1.9.2.2) Gecko..."
"Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8\\r\\n".
"Accept-Language: es-es,es;q=0.8,en-us;q=0.5,en;q=0.3\\r\\n".
"Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7\\r\\n".
"Keep-Alive: 115\\r\\n".
"Connection: keep-alive\\r\\n\\r\\n";
//Enviamos petición
socket_send($socket, $http, strlen($http), 0);
//Obtenemos datos de 1kb en 1kb
$html = "";
do{
$buffer = @socket_read($socket, 1024);
$html .= $buffer;
}while($buffer != "");
//Desconectamos
@socket_close($socket);
/**
Tratamiento de datos para buscar emails en el documento actual.
Finalizada la búsqueda, buscamos enlaces (links) para rastrear
recursivamente el sitio web repitiendo el proceso anterior...
*/