Парсинг дополнительных данных поисковой выдачи дает возможность получить больше информации о том, кто попадает в колдунщики или как часто тот или иной блок появляется в поиске Яндекс и Google. Дополнительно можно обогатить свой сайт доп информацией, например, спарсим расстояние с выдачи или любую другую инфрмацию. Данная инструкция покажет как быстро и легко спарсить нужный блок с поисковой выдачи Яндекс и Google.
Как парсить элементы и данные из поисковой выдачи Яндекс и Google: пошаговая инструкция
Содержание статьи:
Составление регулярного выражения для парсинга
В первую очередь нужно зайти в выдачу и найти запрос, где мы видим нужный блок. В примере мы будем парсить время проезда на автомобиле с выдачи Google, для чего вводим запрос «путь Москва Тбилиси».

Видим, что нужный нам блок появился теперь выбираем элемент для парсинга, например, время проезда на автомобиле.

Теперь кликаем правой клавишей мыши и выбираем «Посмотреть код».

Далее находим нужный нам элемент в коде.

Копируем обрамляющие его классы или ID.

Важно! Надо проверить чтобы, данный класс больше не повторялись на странице.
После этого переходим в A-Parser и открываем вкладку «Инструменты»-«Конструктор регулярных запросов».

Теперь копируем в основное диалоговое окно весь код с выдачи.

Вводим в значениях «Перед группой» и «После группы» скопированный ранее код класса, между которыми находился нужный элемент.

Нажимаем на «Тест» и видим, что в результатах выдало именно то, что требовалось спарсить с выдачи.

Значит, все готово, регулярное выражение найдено.

Его можно скопировать в блоке «Выражение».
Создание задания на парсинг нужных элементов в выдаче
Переходим в «Редактор заданий» и открываем парсер нужной поисковой системы:

Далее нажимаем «Использовать регулярное выражение».

Выбираем в блоке «Применить к» пункт «$pages.$i.data — Raw data» (означает парсинг) и вводим ранее скопированное регулярное выражение.

После вводим название массива и переменной. (если несколько переменных, то вводим нужное количество).

Добавляем в качестве результата вводим название массива и вид переменной:

$p1.rass.format(‘$query — $ras1\n’)
Вводим запросы и запускаем тест.

Извлекаем полученные данные в нужном формате.




