Поиск URL в коде HTML с помощью регулярного выражения
Необходимо в коде html страницы, полученного с помощью curl найти urlы. Есть следующие условия.
- Искать нужно, начиная с определенного места. В моем случае после
header_nav_menu b - urlы являются значением аттрибута href и должны оканчиваться на .html (т.е. href="javascript:void(0) нужно отсечь)
- В итоге нужно сохранить только сами urlы, имеющие вид типа
/usluga-takaya-to-1.html
У меня получается вот такое безобразие regex101. Тут явно что то с ретроспективной проверкой.