3 инструмента для парсинга на WordPress

E-Planet

Иногда нет смысла тратить время на самостоятельное написание контента для сайта WordPress. Этот случай не касается блогов и инфосайтов, так как доход на них формируется как раз благодаря размещенным постам.

А речь идет об интернет-магазинах, сайтах компаний и новостных порталах, не рассчитанных на органический трафик. Вот для таких ресурсов уникальные материалы — это не так важно, как их постоянное обновление.

Чтобы сделать автонаполняемый сайт, вам понадобится настроить парсер новостей для вашего проекта. Для начала необходимо найти подходящие площадки, с которых вы будете парсить. Они должны соответствовать тематике вашего проекта, иначе нет смысла дублировать с них информацию. Если это так, тогда необходимо приступить ко второй части решения вопроса парсинга — это каким образом вы будете клонировать контент с другого сайта. Самый примитивный и неудобный способ — это ручное копирование. Но куда разумнее воспользоваться одним из приведенных в данной статье плагином, чтобы активировать удачный парсер новостей и контента.
blog-parser-your-wordpress

WP-O-Matic

Весьма популярный модуль для WordPress, который позволит вам настроить функциональный парсер новостей с других площадок. Устанавливается инструмент самым простым способом: либо через загрузку напрямую в папку на хостинге, либо через вкладку «Плагины».

Далее вам предстоит настроить работу плагину, если хотите обеспечить парсинг контента. Для этого достаточно четыре раза нажать «Next» и в конце «Submit». Таким образом, вы подтвердите согласие с правилами пользования данным модулем WordPress. В частности, согласитесь с тем, что только вы несете ответственность за кражу чужих материалов, содержания контента других сайтов и т. д.

Если кроме текстовой составляющей вас еще интересуют картинки, тогда необходимо создать в папке с плагином директорию под названием Cache. Установите особые права доступа к этой папке. Далее вам предстоит вернуться в админку WordPress. Зайдите в настройки плагина и внимательно посмотрите, нет ли галочки около пункта Unix cron. Вам необходимо утвердительно отметить пункт Cache Image, чтобы парсер новостей и контента также копировал и картинки к вам на ресурс.

Модуль WP-O-Matic хорош тем, что работает на любой странице сайта. Вы сможете добавить отдельную рубрику, если хотите, чтобы список новостей и контента, который предоставил парсер, отображался именно там. Для этого предварительно создайте необходимую рубрику. Затем в адмике WordPress в настройках инструмента WP-O-Matic нажмите Add Campaign. В строке Categories отметьте галочкой созданную вами специальную рубрику. А в форме Feeds пропишите RSS ленты, которую вы собрались парсить. Вы сможете прописать сразу несколько URL для лент, чтобы парсер новостей и контента собирал информацию сразу с трех или даже четырех ресурсов.

И еще один огромный плюс в сторону плагина WP-O-Matic — это автоматическая публикация материала. Вам не придется ежечасно заходить в админку WordPress, чтобы менять статус постов на «Опубликованный». Модуль сделает это самостоятельно. И если пожелаете, он может уникализировать текст через специальный механизм синонимизации. В этом ключевое отличие данного инструмент от его конкурента — плагина FeedWordPress.

Datacol

Это функциональный граббер, который подходит не только для движка WordPress. Это не просто парсер новостей и контента — это умное приложение, которое позволяет фильтровать копируемый материал. К примеру, вы сможете размещать только статьи, в которых есть определенные ключевые слова. Сможете дублировать новости прямо из Яндекса. Клонированные материалы будут экспортироваться в одном из 15 доступных форматов. Сервис соберет не только текст, но и заголовки, фотографии, дату публикации, ссылки и прочие важные данные.

Но Datacol распространяется на платной основе. Однако, он куда дешевле, чем если бы вы заказывали контент на сайт через биржи. Стоит приложение меньше 500 рублей и его можно использовать практически для любого движка. Есть демо-версия.

FDE Grabber

Еще один платный парсер с большим числом функций. Это уже из разряда дорогих грабберов, так как обойдется он примерно в 90 долларов. Но использовать его можно будет сразу на 10 серверах, то есть в теории разные вебмастера могут скинуться по 9 долларов, удешевив таким образом покупку.

FDE Grabber — это не совсем плагин для WordPress. Разработчики называют свое творение автономной системой, которая работает независимо от типа CMS, установленной на сайте. Основные возможности этой системы парсинга:

  • выкачка полномасштабных новостей или отдельных фрагметов;
  • автоматическая загрузка в дубли материала фотографий;
  • можно планировать публикации;
  • если хотите уникализировать дублируемый материал, есть встроенная функция синонимайза;
  • можно работать через прокси-серверы;
  • парсинг способен обходить редиректы, которые для других плагинов могут стать проблемой;
  • можно автоматически скачать все содержимое с сайта и переместить на вашу площадку (если дело касается не новостных порталов);

Вы сможете настроить парсинг полностью по собственному усмотрению, так как у программы есть возможность внедрения микропрограмм для коррекции работы. К примеру, так можно настроить особенности выравнивания и оформления копируемого материала. Также вы сможете добавить параметры noindex и nofollow для всех ссылок, которые будут в контенте. Парсер даже позволяет копировать и автоматически переводить статьи с иностранных ресурсов. Это отличный способ создать постоянный поток контента на сайт, который со временем начнет привлекать посетителей!
fde-grabber

comments powered by HyperComments