Отбор ссылок для парсинга PHP
Как правильно сделать условие для отбор ссылок при парсинге, чтобы исключить ссылки с другими доменами и ссылки включающие символ # или ?.
Код
$html = file_get_contents("https://google.com/");
$dom = new DOMDocument;
$internalErrors = libxml_use_internal_errors(true);
$dom->loadHTML($html);
libxml_use_internal_errors($internalErrors);
foreach ($dom->getElementsByTagName('a') as $link) {
echo $link->getAttribute("href")."<br/>\n";
}