документацию на VSParser

реклама
Инструкция по пользованию программы VSParser.
Пока Вы не оплатили лицензию на использование программы, программа будет работать в полной
функциональности, за исключением того, что нельзя сохранить результаты парсинга.
Другими словами, Вы можете сделать парсинг и увидеть результат, но сохранить не сможете.
Как регистрировать лицензию на использование программы:
Процесс парсинга происходит в три этапа:
Первый этап - формирование списка ссылок страниц категорий. Т.е. страниц, которые содержат
ссылки на страницы товаров.
Наберите или вставьте ссылку на сайт донор во вкладке "Category list" и нажмите кнопку "Link", чтобы
загрузить страницу сайта во встроенный браузер программы.
1
Используя встроенный браузер найдите ссылку на страницу категорий. Красная рамка покажет тот
элемент страницы, над которым в данный момент находится курсор мышки.
Вкладка в программе "Preview" покажет минимальные данные по данному элементу, чтобы
идентифицировать именно то, что Вы хотите выбрать.
Чтобы зафиксировать для парсера выбранный элемент, удерживая курсор мышки на элементе,
нажмите левую кнопку мышки, вызвав контекстное меню или кнопку Ctrl на клавиатуре. Появится
контекстное меню со списком элементов от выбранного и далее по родительской цепочке.
2
Перейдите по строке в конец и в раскрывающемся списке выберите нужный Вам.
На следующей картинке показано, что выбранный первоначально элемент имеет родственника,
который также находится в списке справа. Можно выбрать любой из них, при этом, красная рамка во
время перехода по списку элементов будет переходить на элемент на странице, который находится в
данный момент под курсором мышки.
3
Выбирать можно любой элемент в иерархии, вплоть до списка, который в самом низу.
Переход на более высокого родителя будет выбирать более высокого родителя на странице.
При выборе нужный Вам элемент со списка, данные по этому элементу будут занесены в активную
вкладку программы.
На основе полученных данных надо указать программе для однозначного идентифицирования
элемента. Это делается путем выставления галочек в чекбоксах.
ВАЖНО: Не отмечайте пустые значения.
При выборе каждого значения, программа парсер автоматически тестирует выбор и отмечает
зеленой рамкой найденные при таком выборе элементы на странице сайта. Дополнительно, в
программе указывается количество найденных элементов.
4
Отмечая или убирая галочки на данных, можно подобрать такое сочетание, которое Вам нужно.
ВАЖНО: Следует делать выбор от верхних значений к нижним, т.е. от частного к общему. Но, если
надо выбрать не один элемент, как будет показано дальше, а несколько, то не обязательно начинать
с самого верхнего ряда.
В данном примере по одному идентификатору выбраны все верхние ссылки на страницы категорий.
Поля HREF, SRC и Content показывают данные по первому элементу из списка.
5
ВАЖНО: Если есть занесенные данные в поле HREF, то всегда можно перейти по данной ссылке,
нажав на кнопку "Click". Будет использоваться ссылка из активной владки.
Теперь, можно начать формировать список ссылок на страницы категорий, нажав кнопку "Auto add to
list".
Если список на момент нажатия кнопки пустой или нет не выделенных строк списка, то программа
парсер начнет парсить ссылки с текущей страницы встроенного браузера. Если есть не выделенные
строки в списке, то программа начнет автоматический переход по страницам в списке. При
добавлении в список новых ссылок, они добавляются не выделенными, а поэтому, программа
автоматически начнет переходить и на добавленные ссылки и делать парсинг на них. Таким образом,
программа сможет спарсить все одинаковые по выбранным данным элементы на всех страницах
сайта.
Нажмите Стоп на той же кнопке, чтобы остановить автоматический парсинг ссылок.
Также, можно нажать кнопку ручного добавления ссылки. Будет добавлена текущая ссылка с поля
HREF.
Вот так выглядит полученный список ссылок.
6
Данный список можно сохранить и позже загрузить при наличии оплаченной лицензии на домен
ссылок.
Составление списка ссылок страниц категорий заканчивается первый этап парсинга сайта.
Иногда требуется спарсить данные со страниц категорий или данные не связаны с товарами. То есть
достаточно этого списка, чтобы парсить данные, так как необходимые данные находятся на этих
страницах. В этом случае можно сохранить этот список и загрузить его в список товаров, который
находится ниже.
7
Если же необходимо составить отдельно список товаров на основе списка страниц категорий, то
переходим ко второму этапу парсинга - составление списка страниц товаров.
Процесс нахождения и выделения элементов страницы аналогичен описанному процессу, за
исключением того, что действия надо производить при активной вкладке "Product list".
В результате, будет сформирован список страниц товаров в нижней таблице программы.
8
На следующей картинке показано как выделить все ссылки на страницы товаров на странице
категорий.
Нажав кнопку автоматического добавления в список, программа начнет переходить по списку
страниц категорий, находить все ссылки на странице и добавлять их в список страниц товаров.
Полученный список страниц товаров показан на следующей картинке.
9
10
Скачать