sábado, 30 de noviembre de 2013

Código en php para extraer los links de una pagina

Con este ejemplo vamos a extraer el enlace y el texto dentro del enlace.

El codigo va a cargar el contenido de una pagina y va a buscar las etiquetas a, de ahi va  a obtener los atributos href y el contenido del enlace

<a href="atributohref"> contenido del enlace </a>

Codigo PHP:

<?php
echo "empezamos";
 ?>
<html>
<body>

<?php
$html = file_get_contents("http://www.URL_de_donde_quieres_extraer_los_links.com");
$dom = new DomDocument();
@$dom->loadHTML($html);
$urls = $dom->getElementsByTagName('a');

foreach ($urls as $url)
{
$attributes = $url->attributes;
    echo "<br>el texto del enlace es $url->nodeValue";
   
    foreach ($url->attributes as $a)
    {
        echo "<br>$a->name es $a->value";
    }
    echo "<br>";
}


?>
<body>
</html>

No hay comentarios:

Publicar un comentario