Источник
Спарсить аудиторию из Facebook сложно. Но ничего невозможного в этом нет. Стоит сказать сразу: администрация социальной сети выступает против этого. И если вы будете использовать полученную аудиторию при создании рекламных кампаний, то, скорее всего, получите бан. Дело в том, что настраивать рекламу на конкретных пользователей через их ID можно только в том случае, если они до этого контактировали с вашим аккаунтом, группой или приложением.
Для чего тогда парсить пользователей из FB?
Облачные сервисы. При использовании таких решений вся работа проходит на стороне сервиса, вам достаточно задать настройки и дождаться выполнения задачи. К таким сервисам можно, например, отнести Pepper.Ninja. Для Facebook он предлагает два инструмента: поиск групп по ключевому слову с парсингом их участников, а также сбор аудитории, лайкнувших определённую страницу. Однако из-за ограничений социальной сети итоговый список может составлять до 80% от реального числа аудитории группы.
Скачиваемое ПО. При использовании самостоятельных программ вам понадобится время (зависит от мощности вашего ПК и объёмов поставленных задач). Приведём в пример Datacol. Программа собирает данные пользователей, состоящих в одной группе с вашим аккаунтом. Поэтому перед парсингом стоит завести отдельный профиль и вступить во все интересующие вас группы. Из недостатков –– никакой защиты от бана по IP. Поэтому рекомендуется использовать ПО с прокси, VPN или антидетект-браузером.
Скрипты и утилиты. По сути, данный вариант предполагает самостоятельное написание небольшой программы, выполняющей задачу по парсингу. Это можно сделать, например, на языке Python, используя библиотеки beautiful soup, pyinstaller и selenium decoder. Вы создаёте небольшой скрипт, который потребует ввода логина и пароля от профиля FB* и ссылки на сообщество. После этого скрипт автоматически переходит в список участников, проматывает страницу до конца и копирует нужные данные из кода страницы. Чтобы не писать самостоятельно, вы можете разместить задание на написание подобного скрипта на бирже фриланса.
*Запрещенная в РФ организация
Спарсить аудиторию из Facebook сложно. Но ничего невозможного в этом нет. Стоит сказать сразу: администрация социальной сети выступает против этого. И если вы будете использовать полученную аудиторию при создании рекламных кампаний, то, скорее всего, получите бан. Дело в том, что настраивать рекламу на конкретных пользователей через их ID можно только в том случае, если они до этого контактировали с вашим аккаунтом, группой или приложением.
Для чего тогда парсить пользователей из FB?
- Получение трафика через массовые подписки, лайки, добавления в друзья или приглашения в группы.
- Поиск групп по ключевому запросу. Это поможет увидеть пользователей, которым потенциально интересен ваш оффер.
- Анализ конкурентов: вы сможете посмотреть, с какой аудиторией работают ваши конкуренты, и настроить рекламную кампанию на неё.
Способы парсинга пользователей Facebook
Социальная сеть постоянно закрывает возможности для парсеров, поэтому способы сбора данных периодически перестают работать. Однако и сегодня есть несколько методов парсинга. Что можно выбрать?Облачные сервисы. При использовании таких решений вся работа проходит на стороне сервиса, вам достаточно задать настройки и дождаться выполнения задачи. К таким сервисам можно, например, отнести Pepper.Ninja. Для Facebook он предлагает два инструмента: поиск групп по ключевому слову с парсингом их участников, а также сбор аудитории, лайкнувших определённую страницу. Однако из-за ограничений социальной сети итоговый список может составлять до 80% от реального числа аудитории группы.
Скачиваемое ПО. При использовании самостоятельных программ вам понадобится время (зависит от мощности вашего ПК и объёмов поставленных задач). Приведём в пример Datacol. Программа собирает данные пользователей, состоящих в одной группе с вашим аккаунтом. Поэтому перед парсингом стоит завести отдельный профиль и вступить во все интересующие вас группы. Из недостатков –– никакой защиты от бана по IP. Поэтому рекомендуется использовать ПО с прокси, VPN или антидетект-браузером.
Скрипты и утилиты. По сути, данный вариант предполагает самостоятельное написание небольшой программы, выполняющей задачу по парсингу. Это можно сделать, например, на языке Python, используя библиотеки beautiful soup, pyinstaller и selenium decoder. Вы создаёте небольшой скрипт, который потребует ввода логина и пароля от профиля FB* и ссылки на сообщество. После этого скрипт автоматически переходит в список участников, проматывает страницу до конца и копирует нужные данные из кода страницы. Чтобы не писать самостоятельно, вы можете разместить задание на написание подобного скрипта на бирже фриланса.
Пример парсинга
Разберём пример сбора пользователей группы на примере Datacol. Даже в демо-режиме программа предоставляет первые 25 результатов парсинга. В собранной базе данных будут указаны: название группы, имя пользователя, ссылка на страницу. Кроме того, вы можете самостоятельно добавить или убрать собираемые данные.- Скачайте и установите Datacol.
- Запустите VPN или прокси, войдите в свой профиль на FB* и подпишитесь на интересующие вас группы.
- Запустите Datacol и выберите «social-parsers» в древе кампаний.
- В выпадающем списке выберите кампанию «facebook.com-members-of-group-by-list.par».
- В дереве быстрой настройки кликни 2 раза на «плагин». Откроется окно с настройками кампании.
- Укажите логин и пароль своего аккаунта FB*, нажмите «Сохранить и выйти».
- В поле «Входные данные» вставьте ссылку на группу, на которую подписан ваш аккаунт.
- Нажмите «Запуск» и дождитесь окончания работы. Полученные данные можно выгрузить в форматах .csv, .txt, .xlsx.
Вывод
Парсить данные пользователей Facebook –– задача вполне реализуемая. В зависимости от нужной информации вы можете пользоваться как дешёвыми, так и дорогими решениями. При этом надо помнить, что социальная сеть выступает против парсинга, поэтому в обязательном порядке держите под рукой запас аккаунтов (если работаете вручную), а также не забывайте, что полученные данные не всегда будут точными.*Запрещенная в РФ организация
Последнее редактирование: