parser

Парсинг сайта заключается в получении удаленной страницы, разбор содержимого, сохранение информации.

Для парсинга сайтов можно использовать библиотеку PHP Simple HTML DOM Parser. Она легкая в понимании, принцип селекторов как и в jQuery 🙂 Также к PHP Simple HTML DOM Parser имеется неплохая документация. В дополнении вместе с библиотекой идут несколько простых примеров.

С помощью PHP Simple HTML DOM Parser есть возможность обращаться к элементам и атрибутам элементов, искать определенного уровня вложенные элементы, фильтровать их, искать текст и комментарии.

Теги: php, parser

Запись опубликована в рубрике Без рубрики. Добавьте в закладки постоянную ссылку.