Парсинг данных через сервис может потребоваться в самых разных случаях – в том числе и когда нам требуется проанализировать или проработать какую-то конкретную информацию на сайте.
Разберем это на примере парсинга по категориям и изображениям через сервис Screaming Frog.
Видеоинструкция
Как парсить любой элемент в Screaming Frog Seo Spider
Кликаем на изображение правой клавишей мыши и выбираем пункт «Просмотреть код» в выпадающем меню.
![Переход в код страницы в браузере](https://seopulses.ru/wp-content/uploads/2023/10/1-3-1024x791.jpg)
Находим адрес изображения и копируем его, выбирая пункты Copy, а затем Copy full XPath в выпадающем списке.
![Копирование полного пути XPath](https://seopulses.ru/wp-content/uploads/2023/10/2-3-1024x773.jpg)
Переходим в Screaming Frog. Выбираем в верхнем меню пункт Configuration, затем, в выпадающем списке, кликаем по пункту Custom и далее – Extraction («Выгрузка данных»).
![Переход в Custom Extraction в Screaming Frog Seo Spider](https://seopulses.ru/wp-content/uploads/2023/10/3-3-1024x602.jpg)
В открывшемся окне нажимаем на Add в правом нижнем углу.
![Добавление нового кастомного парсинга в Screaming Frog](https://seopulses.ru/wp-content/uploads/2023/10/12-1024x654.png)
В левой верхней строчке с надписью Extractor 1 вводим название раздела для сбора данных. Присвоить можно любое.
Выбираем тип выгрузки XPath в списке рядом.
![Выбираем в парсинг кастомных данных тип XPath](https://seopulses.ru/wp-content/uploads/2023/10/4-3-1024x647.jpg)
Копируем адрес XPath в строчку справа от него.
![Вводим в парсинг кастомных данных полный путь XPath](https://seopulses.ru/wp-content/uploads/2023/10/5-3-1024x647.jpg)
В следующем выпадающем списке выбираем Extract HTML Element и нажимаем OK.
![Выбираем в парсинге кастомных данных выгрузку всего элемента HTML](https://seopulses.ru/wp-content/uploads/2023/10/6-3-1024x645.jpg)
Пример настройки.
![Настройки парсинга кастомных данных в Screaming Frog Seo Spider](https://seopulses.ru/wp-content/uploads/2023/10/7-3-1024x649.jpg)
Возвращаемся в Screaming frog и выбираем в меню пункт «Mode»-«List».
![Переход режим List в Screaming Frog](https://seopulses.ru/wp-content/uploads/2023/10/8-3-1024x600.jpg)
Затем нажимаем кнопку Upload вверху и загружаем скопированные нами URL.
![Открытия списка URL для парсинга в Screaming Frog](https://seopulses.ru/wp-content/uploads/2023/10/9-3-1024x604.jpg)
![Ввод списка URL для парсинга в Screaming Frog](https://seopulses.ru/wp-content/uploads/2023/10/10-3-1024x595.jpg)
Когда парсинг завершится, переходим в меню Overview справа и ищем в списке раздел Custom Extraction.
![Итог парсинга через кастомные данные в Screaming Frog](https://seopulses.ru/wp-content/uploads/2023/10/11-3-1024x602.jpg)
Если все сработало верно, в разделе появится пункт с нашим названием раздела и количество собранных элементов. В основном окне будет отображаться список URL и адреса всех изображений, которые сервис обнаружил по заданным нами параметрам.
После этого можно удалить теги и все лишнее – и останется только список адресов нужных нам фото.
Алгоритм парсинга по категориям будет такой же. Таким же образом вы можете парсить любые нужные вам данные, включая цены, наименования, характеристики, описания и так далее.
Подписывайтесь на наш канал в Яндекс.Дзен
Подписывайтесь на наш Telegram-канал
Подписывайтесь на наш Youtube-канал
Подписывайтесь на нашу группу ВКонтакте