Парсинг данных через сервис может потребоваться в самых разных случаях – в том числе и когда нам требуется проанализировать или проработать какую-то конкретную информацию на сайте.
Разберем это на примере парсинга по категориям и изображениям через сервис Screaming Frog.
Видеоинструкция
Как парсить любой элемент в Screaming Frog Seo Spider
Кликаем на изображение правой клавишей мыши и выбираем пункт «Просмотреть код» в выпадающем меню.

Находим адрес изображения и копируем его, выбирая пункты Copy, а затем Copy full XPath в выпадающем списке.

Переходим в Screaming Frog. Выбираем в верхнем меню пункт Configuration, затем, в выпадающем списке, кликаем по пункту Custom и далее – Extraction («Выгрузка данных»).

В открывшемся окне нажимаем на Add в правом нижнем углу.

В левой верхней строчке с надписью Extractor 1 вводим название раздела для сбора данных. Присвоить можно любое.
Выбираем тип выгрузки XPath в списке рядом.

Копируем адрес XPath в строчку справа от него.

В следующем выпадающем списке выбираем Extract HTML Element и нажимаем OK.

Пример настройки.

Возвращаемся в Screaming frog и выбираем в меню пункт «Mode»-«List».

Затем нажимаем кнопку Upload вверху и загружаем скопированные нами URL.


Когда парсинг завершится, переходим в меню Overview справа и ищем в списке раздел Custom Extraction.

Если все сработало верно, в разделе появится пункт с нашим названием раздела и количество собранных элементов. В основном окне будет отображаться список URL и адреса всех изображений, которые сервис обнаружил по заданным нами параметрам.
После этого можно удалить теги и все лишнее – и останется только список адресов нужных нам фото.
Алгоритм парсинга по категориям будет такой же. Таким же образом вы можете парсить любые нужные вам данные, включая цены, наименования, характеристики, описания и так далее.
Подписывайтесь на наш канал в Яндекс.Дзен
Подписывайтесь на наш Telegram-канал
Подписывайтесь на наш Youtube-канал
Подписывайтесь на нашу группу ВКонтакте