Feed on
Posts
Comments
  1. $html=file_get_contents (‘http://www.popsu.net’);
  2. $url=‘popsu.net’;
  3. $vnut=array();
  4. $vnech=array();
  5. preg_match_all(‘~<a [^<>]*href=[\’"]([^\’"]+)[\’"][^<>]*>(((?!~si’,$html, $matches);
  6. foreach ($matches[1] as $val) {
  7. if (!preg_match("~^[^=]+://~", $val) || preg_match("~^[^://]+://(www\.)?".$url."~i", $val)) { $vnut[]=$val; }
  8. else $vnech[]=$val;
  9. }
  10. $vnut=array_unique ($vnut);
  11. $vnech=array_unique ($vnech);
  12.  
  13. print_r ($vnut);
  14. print_r ($vnech);
  15.  
  16. </a>

в массиве $vnut только ссылки внутренние
в массиве $vnech только ссылки внешние

источник nulled.ws/showthread.php?t=47975

2 Responses to “Парсер, который бы получал все ссылки из данной страницы?”

  1. on 11 Mar 2008 at 1:12 am Парсер : Блог Молчуна

    […] Парсер на PHP, который бы получал все ссылки из данной страницы? Дальше […]

  2. on 23 Aug 2008 at 6:34 pm Desvil

    спс за статью, очень позновательна

Trackback URI | Comments RSS

Leave a Reply

Stocking Club’s Blog © 2008 | MistyLook made free by Reef Sandals