Россия

Парсинг каталога товаров с сайта kamaz.ru

Исходные данные:
Файл экспорта товаров поставщика в csv, и сам сайт kamaz.ru.

Требуется:
Загрузить каталог товаров на сайт omskdizel.ru.

Решение:
В файле экспорта нет значений некоторых свойств, из-за того, что тип свойства был не строковой и не списочный, а была привязка к элементам или разделам. Поэтому, основную часть данных берем из csv, а недостающие данные парсим с сайта.

Пишем скрипт импорта из csv, которым создаем товары в нужных разделах, создаем строковые и списочные свойства и устанавливаем у них значения.

Парсим недостающие блоки с сайта. Для этого, из csv-файла берем ссылки DETAIL_PAGE_URL на карточки товаров сайта поставщика. После этого, делаем запросы к сайту, берем нужный контент и загружаем его в свойства инфоблока.


Семен Голиков.