Регулярные выражения для удаления блоков контента

При парсинге HTML получается довольно грязный код, который включает блоки рекламы, анонсы и т.д. В настройках парсера можно указывать пути XPATH, классы CSS и регулярки.

Планирую с помощью replace() удалять ненужные блоки примерно такой вложенности:

<div class="ads">
<span> Покупайте наших слонов</span>
... Куча тегов и текста
</div> 

Вопрос 1. Имеет ли значение вложенность и теги внутри, если мне нужно удалить абсолютно всё содержимое внутри дива (и сам див тоже)?

Вопрос 2. Как быть, если речь не о <div>, а, скажем, о <script>?


Ответы (0 шт):