Парсим реальные сайты. Урок_2.zip — Яндекс.Диск

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


2022-05-03 08:46

разработка по

Парсим реальные сайты.

Решение урока 2. Задание на урок 3.

Прошлым уроком распарсили сайт //pizza-tk.ru. Сегодня выкладываем решение по разбору сайта //пиццапицца.рф/#Pizza.

Все решения выполнены в двух вариантах, с использованием библиотек: phpQuery и Simple HTML. Кто не в теме - вот ссылка на итоговый пост по парсингу локального сайта библиотеками.

Следующее задание - разобрать и вывести данные сайта http://xn---24-6cd2bb2cns8aas.xn--p1ai/catalog/category/pizza.

Конечная цель - распарсим несколько сайтов доставки пиццы и выведем на одну страницу в виде агрегатора доставщиков пиццы.

Повторюсь, многие сайты предпочитают ставить защиту от подобных действий извне. На момент опубликования поста, предлагаемые сайты разрешали синтаксический анализ, что будет по истечении времени - это нам неведомо.

Но у меня все больше зреет сомнение... Одно дело взять трех-четырех студентов и разобрать с ними анализ сайтов на реальных примерах. Другое дело выкладывать такие эксперименты в общий доступ.

Склоняюсь к тому, что возьму трех студентов, заставлю создать одностраничники по той же пицце (да все равно чему). Разместим эти сайты в локалке и будем учиться. Вот такие моральные терзания...

Но сейчас главная идея это понять смысл, поэкспериментировать, приобрести полезный навык. Если вы педагог, можно нарезать своих примеров для изучения парсинга локальных ресурсов.

P.S. Парсить можете любой из библиотек. Дело вкуса. Для тех, кто захочет парсить с использованием phpQuery, напоминаю, необходимо понизить PHP до версии 7.3.

Впереди парсер с использованием DOM XPath. Тоже ничего себе штука...

Хорошего всем парсинга ?!


Источник: disk.yandex.ru

Комментарии: