Парсер на Python. Как вытащить значение title с помощью xpath
Подскажите, как при помощи xpath выдернуть текстовое значение title?
Вот кусок сайта для примера.
<a id="bx_3966226736_564931_pict"
href="/catalog/polubotinki_i_mokasiny/p078_1u_bezh_polubotinki_muzhskie_39_44_8/"
class="bx_catalog_item_images"
style="background-image: url('/upload/resize_cache/iblock/93f/220_220_2/93fbbce7cd5fe0c3b38b5b9f24375804.jpg')"
title="P078-1U беж Полуботинки мужские (39-44)/8">
</a>
Сейчас xpath выглядит вот так (скопирован с самого сайта):
xpath('/html/body/div[3]/div[3]/div[2]/div[3]/div[3]/div[1]/div/a[2]/text()')
Ответы (1 шт):
xpath('/html/body/div[3]/div[3]/div[2]/div[3]/div[3]/div[1]/div/a[2]/@title')
/html/body — это начало xpath выражения, которое говорит о том, что мы начинаем с корня документа и переходим в тег body.
/div[3]/div[3]/div[2]/div[3]/div[3]/div[1] — это последовательность тегов, которые мы проходим, чтобы добраться до нужного элемента. Мы переходим в третий div, затем еще раз в третий div, затем во второй div, затем в третий div, затем в третий div и, наконец, в первый div.
/a[2] — это указание на то, что мы хотим выбрать второй элемент a.
@title — это выделение атрибута title у элемента a.
Итого, данное xpath выражение находит второй элемент a на странице и выделяет его атрибут title.