Универсальный парсер контента Datacol, WP UniParser

Парсер контента

Представляю вашему вниманию универсальный парсер контента – Datacol. Вообще Datacol это больше чем просто парсер контента, Datacol это это универсальная программа для получения любых данных, доступных в Интернете.

Datacol это десктопная программа, написанная на C#. Программа умеет экспортировать сохраненные данные в формат CSV, Excel, файл импорта для таких CMS как DLE и WordPress, (а также фришные блоги на платформе wordpress.com).

Автор неплохой программист, так что с ним можно договориться про доработку программы, чтобы она могла экспортировать данный в другие форматы и CMS.

В программе Datacol можно создавать профили настроек, и комбинируя разные опции Datacol вы сможете запросто делать следующее:

Указываете список страниц, указываете — где находится контент, которые необходимо спасристь. Если у вас возникнут проблемы то в этом разделе, вы найдете всю необходимую информацию.

Далее приведу список того, что умеет делать данный парсер.

Как видете возможности очень полезные и весьма разнообразные, так что если у вас будет этот парсер, то вы сможете решить много вопросов, и сэкономить массу времени.

Парсер стоит 80$, если его покупать напрямую. Я являюсь дилером по продаже этого парсера контента, так что через меня вы можете купить Datacol за 65$. Если вы укажите что пришли с блога anokalintik.ru, то вам продадут Datacol со скидкой.

Купить парсер можно здесь.

Парсер-плагин для wordpress — WP UniParser

Итак, прошу любить и жаловать — WP UniParser – универсальный парсер контента в виде плагина под WordPress. Для начала, несколько слов об основных (и, на мой взгляд, действительно полезных) функциях парсера.

Парсер контента WP UniParser

Во-первых, WP UniParser можно настроить для парсинга контента практически с любых сайтов. Таким образом, вам теперь не нужно искать отдельно парсер блогов, парсер статей, парсер RSS и т.д. Можно просто потратить 5-10 минут, чтобы настроить плагин для работы с любыми вебресурсами (в независимости от их верстки).

Во-вторых, WP UniParser умеет на лету автоматически переводить контент с помощью сервиса Google Translate. На данный момент поддерживается двухсторонний перевод с самых популярных языков: русский, английский, немецкий, французский, польский, чешский, украинский и болгарский. При необходимости автор обещает добавить любой нужный пользователю язык.

У плагина есть множество других полезных функций и настроек, о которых можно почитать на сайте автора универсального парсера. Там же можно найти ссылки на форумные темы с отзывами покупателей. Автор говорит, что больше всего было отзывов на серче (около 8-9), но тема была удалена модераторами из-за несоответствия правилам.

Теперь скажу о личных впечатлениях. Мне универсальный парсер положительно понравился. Конечно же, это далеко не единственный и не самый навороченный парсер контента. Тем не менее, сочетание цены, качества и функциональности очень приличное. Кроме того, по отзывам покупателей видно, что автор не бросает их в беде, если появляются какие-либо проблемы (или просто сложности) при использовании скрипта. Что касается индексации сайтов, наполненных парсером, то Гоша и Яша их кушают на ура (автора скидывал несколько примеров, если интересно – обращайтесь напрямую к нему).

И напоследок, об одном очень полезном дополнении к универсальному парсеру. Недавно автор разработал плагин, который называется WordPress-DLE конвертер. Название говорит само за себя. Скрипт позволяет экспортировать категории, посты из этих категорий, комментарии к этим постам и пользователей из базы данных блога на WordPress в базу данных сайта на DLE. По сути, в комплекте с WP UniParser данный плагин позволяет получить полноценный универсальный парсер для DLE.

Вот, наверное, и все, что я хотел сказать о WP UniParser. Теперь жду ваших комментариев и отзывов о продукте.



No related posts.


Трекбеки и пинги

[...] информация, именно поэтому вебмастера используют парсеры контента чтобы собирать полезный контент с выдачи поисковых [...]


Отзывы

Ну DLE-контент (как правило, варез) можно еще спарсить, но контент с блогов — ни за что чье-то авторское право нарушать! Долой ГС!

А на Joomla он будет работать

Универсальные парсеры это тема, избавиться от которой будет в ближайшее время сложно.

Но как сообщают с фронтов новый АГС 35 будет выщелкивать такие сайты. Говорят, что научились такое вычислять.

А я не пользовался парсерами. Но после прочтения статьи подумал — а почему бы и нет?

Zerohold, вы как бы правы, только при тестировании подобных алгоритмов будут улетать в бан еще и тысячи СДЛов

я так понимаю за денежку продается этот продукт?)

Все эти парсеры оставляют явные следы в коде страницы так что поисковикам их и вычислять не потребуется .достаточно поставить фильтр и сайт никогда не будет успешным .

да за денежку...сыр можно купить в мышеловке

Легче свой парсер создать для отдельного сайта, и то быстрее будет работать.

Попробовал скачать демку датакула. Впечатляющая махина, но сложновато разобраться. Хотя видно, что возможности богатые

Вышла вторая версия Datacol AutoTune. Теперь настройка полей для парсинга будет визуальной — просто кликаете во встроенном браузере по элементу и автоматически получаете код для его парсинга. Также добавлена возможность прямого экспорта в удаленную mysql базу данных.

Спасибо за обзор, пока писала все вручную, но уже не хватает сил и времени, очень подробно все изложили... Похоже придется испытать обе, потому что блоги на разных платформах...

тоже буду обе тестить, автору спасибо за старания!Ё

Ваш отзыв

*

*


Подписаться, не комментируя

MAXCACHE: 0.88MB/0.00045 sec