Скрипт для автоматического сбора цен на товары с сайта Ozon. Использует библиотеку DrissionPage, которая эффективно обходит защиту и позволяет работать в «быстром» режиме без загрузки лишнего мусора (картинок и рекламы).
- Двойной поиск: сначала ищет цену в интерфейсе, а если Ozon сменил дизайн — лезет в скрытый JSON внутри кода страницы.
- Анти-капча: если Ozon выкинет проверку, скрипт встанет на паузу и подождет, пока ты решишь её в браузере.
- Экономия трафика: отключена загрузка изображений для ускорения работы.
- Кроссплатформенность: работает на Windows и macOS.
git clone https://github.com/Shipovmax/parser\_ozon.git
cd parser_ozon
Убедитесь, что у вас установлен Python 3.8+.
Windows:
pip install -r requirements.txt
macOS:
pip3 install -r requirements.txt
Создайте в папке со скриптом файл test.txt и вставьте туда ссылки на товары Ozon (каждая ссылка с новой строки).
Windows:
python main.py
macOS:
python3 main.py
Скрипт автоматически найдет установленный Google Chrome. Если у вас портативная версия или Chrome установлен в нестандартную папку, раскомментируйте строку co.set_browser_path в коде и укажите путь к chrome.exe.
Для корректной работы убедитесь, что Chrome установлен в папку /Applications. Скрипт настроен на стандартный путь поиска бинарного файла.
После завершения работы скрипт создаст файл ozon_prices.json, в котором будут лежать данные в формате:
[
{
"id": "12345678",
"price": "1599",
"url": "https://www.ozon.ru/product/..."
}
]
Если при запуске вы видите окно браузера с капчей — просто решите её руками. Скрипт автоматически продолжит работу, как только страница обновится.