Если ваша data-команда планирует выход на латиноамериканский рынок, Бразилия — первая остановка. Экономика свыше 2 трлн долларов, 160+ млн интернет-пользователей, крупнейший e-commerce в LATAM. Но есть проблема: бразильские платформы агрессивно блокируют иностранные IP, показывают регион-зависимые каталоги и оценивают всё в реалах (BRL). Без бразильских прокси ваши данные будут неполными, неточными или просто недоступными.
Это руководство охватывает: почему BR-IP критичны, какие платформы скрейпить, как соблюдать LGPD, учитывать pt-BR и платёжные потоки (Boleto, Pix, parcelas), и как настраивать геотаргетинг на уровне Сан-Паулу и Рио-де-Жанейро.
Почему бразильские IP-адреса имеют критическое значение
Бразильские сайты e-commerce активно используют геолокацию для определения контента. Вот что происходит с иностранным IP:
- Другие каталоги — Mercado Livre показывает разные категории и рекомендации в зависимости от региона пользователя.
- Искажённые цены — иностранные IP часто перенаправляются на международные версии с ценами в USD, не отражающие реальные локальные цены.
- Агрессивные блокировки — OLX Brasil и Americanas блокируют или throttling-уют доступ с известных зарубежных диапазонов IP.
- Разная доступность — многие товары доступны только в определённых штатах из-за логистических ограничений.
Если вы собираете данные о ценах, наличии товаров или конкурентной разведке с не-бразильского IP — вы получаете искажённую картину. Brazilian proxies решают эту проблему, предоставляя IP-адреса реальных бразильских пользователей.
Ключевые платформы для сбора данных
Mercado Livre — Amazon LATAM
Mercado Livre (mercadolivre.com.br) — крупнейший маркетплейс Бразилии с 90+ млн активных пользователей. При Mercado Livre scraping критически важно:
- Отслеживать цены в реалах с учётом parcelas (рассрочки)
- Мониторить ставки продавцов и условия доставки по штатам
- Собирать рейтинги и отзывы для конкурентного анализа
Americanas
Americanas (americanas.com) — один из крупнейших бразильских ритейлеров, объединяющий онлайн и офлайн-продажи. Ключевые точки данных: цены, наличие на складах, промо-акции включая «Black Friday Brasil».
Magazine Luiza (Magalu)
Magalu (magazineluiza.com.br) — уникальная гибридная модель: маркетплейс + сеть физических магазинов + программа лояльности «Lu». Для рыночной разведки важны: динамическое ценообразование, связки онлайн-офлайн, региональные акции.
OLX Brasil
OLX Brasil (olx.com.br) — доминирует на рынке объявлений C2C. Ключевые данные: цены подержанных товаров, объём объявлений по категориям, региональные тенденции спроса.
Casas Bahia
Casas Bahia (casasbahia.com.br) — исторический лидер в сегменте электроники и мебели с агрессивной моделью рассрочки. Важно отслеживать: условия «parcelas sem juros» (беспроцентная рассрочка), привязку к кредитным картам.
Сравнение бразильских маркетплейсов
| Платформа | Тип | Модель цен | Ключевая сложность |
|---|---|---|---|
| Mercado Livre | Маркетплейс | BRL + parcelas + купоны | Динамические цены, анти-бот |
| Americanas | Ритейлер + маркетплейс | BRL + промо-коды | Региональная доступность |
| Magazine Luiza | Гибрид | BRL + программа лояльности | Связки онлайн/офлайн |
| OLX Brasil | Объявления C2C | BRL, цены договорные | Высокая защита от ботов |
| Casas Bahia | Ритейлер | BRL + parcelas sem juros | Зависимость от способа оплаты |
LGPD: бразильский GDPR и скрейпинг публичных данных
Lei Geral de Proteção de Dados (LGPD) — бразильский закон о защите данных, действующий с 2020 года. Аналог GDPR, но с нюансами для скрейпинга.
Что разрешено:
- Сбор публично доступных данных (цены, описания товаров, рейтинги продавцов) — законен при соблюдении заявленных целей
- Агрегация рыночных данных без персональной идентификации
- Академические и журналистские цели имеют дополнительные исключения
Что запрещено:
- Сбор персональных данных без согласия (имена, CPF, номера телефонов)
- Профилирование отдельных лиц без правового основания
- Нарушение robots.txt для доступа к закрытым данным
Практические рекомендации:
- Соблюдайте robots.txt — это защита от юридических рисков
- Не собирайте персональные данные, если они не нужны для анализа
- Ограничьте частоту запросов, чтобы не перегружать серверы
- Аннотируйте данные как агрегированные рыночные данные
Важно: LGPD и GDPR имеют схожий подход к публичным данным, но LGPD не требует обязательного назначения DPO для компаний за пределами Бразилии. При скрейпинге публичных цен и каталогов LGPD, как правило, не создаёт препятствий — при условии соблюдения robots.txt и разумной частоты запросов.
Языковые нюансы: pt-BR vs pt-PT
Бразильский португальский (pt-BR) — доминирующий язык контента на бразильских платформах. Различия с европейским португальским (pt-PT) существенны для скрейпинга:
| Аспект | pt-BR | pt-PT |
|---|---|---|
| Корзина | Carrinho | Cesto |
| Поиск | Buscar | Pesquisar |
| Скидка | Desconto | Desconto |
| Рассрочка | Parcelas | Prestações |
| Бесплатная доставка | Frete grátis | Portes grátis |
| Продавец | Vendedor | Vendedor |
Практический совет: При скрейпинге бразильских сайтов всегда используйте pt-BR для поиска и парсинга. Если ваш код ищет «Prestações» вместо «Parcelas» — вы не найдёте данные о рассрочке на Mercado Livre. Устанавливайте заголовок Accept-Language: pt-BR,pt;q=0.9 во всех запросах.
Платёжные потоки: почему Boleto, Pix и parcelas имеют значение
Бразильская платёжная экосистема уникальна. Если вы сравниваете цены без учёта местных платёжных методов — ваши данные неточны.
Boleto Bancário
Boleto — платёжный баркод-документ для оплаты в банкоматах, банках и лотерейных кассах. ~25% онлайн-покупок в Бразилии оплачиваются через Boleto. Многие продавцы дают скидку 5–15% за оплату через Boleto, так как это мгновенное подтверждение.
Pix
Pix — мгновенная платёжная система Бразилии, запущенная в 2020 году. К 2024 году Pix обрабатывает более 4 млрд транзакций в месяц. Многие продавцы предлагают «Pix discount» — скидку 3–10% за мгновенную оплату.
Parcelas (рассрочка)
Рассрочка — король бразильского e-commerce. «12x sem juros» (12 платежей без процентов) — стандартная акция. Реальная цена для потребителя может отличаться на 20–40% в зависимости от количества parcelas и наличия процентов.
Для точного сравнения цен скрейпите:
- Цену à vista (полная цена при оплате сразу)
- Цену com parcelas (цена в рассрочку)
- Количество parcelas и наличие juros (процентов)
- Скидки за Boleto и Pix
Геотаргетинг на уровне городов: São Paulo и Rio de Janeiro
Бразилия — континентальная страна с огромными региональными различиями. Цены и доступность товаров различаются между штатами и даже городами. Для точной разведки нужен IP из конкретного города.
São Paulo
Сан-Паулу — финансовый центр Бразилии и крупнейший потребительский рынок. Большинство продавцов предлагают лучшую логистику и цены для этого региона. Население 22+ млн в метрополии.
Rio de Janeiro
Рио — второй по величине рынок с отличной логистикой, но другими потребительскими паттернами и ценами. Население 13+ млн в метрополии.
С ProxyHat вы можете таргетировать конкретные города:
# São Paulo residential IP
http://user-country-BR-city-sao_paulo:pass@gate.proxyhat.com:8080
# Rio de Janeiro residential IP
http://user-country-BR-city-rio_de_janeiro:pass@gate.proxyhat.com:1080
Реализация: скрейпинг Mercado Livre с бразильским прокси
Python с requests и ProxyHat
import requests
from bs4 import BeautifulSoup
PROXY = "http://user-country-BR-city-sao_paulo:pass@gate.proxyhat.com:8080"
proxies = {"http": PROXY, "https": PROXY}
headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36",
"Accept-Language": "pt-BR,pt;q=0.9,en;q=0.8",
}
url = "https://lista.mercadolivre.com.br/smartphone"
response = requests.get(url, headers=headers, proxies=proxies, timeout=30)
soup = BeautifulSoup(response.text, "html.parser")
items = soup.select(".ui-search-layout__item")
for item in items:
title = item.select_one(".ui-search-item__title").text
price = item.select_one(".andes-money-amount__fraction").text
installments = item.select_one(".ui-search-installment")
if installments:
print(f"{title} — R$ {price} | {installments.text.strip()}")
else:
print(f"{title} — R$ {price}")
cURL для быстрой проверки
curl -x http://user-country-BR:pass@gate.proxyhat.com:8080 \
-H "Accept-Language: pt-BR,pt;q=0.9" \
"https://www.americanas.com.br/categoria/celulares-e-smartphones" \
-o americanas.html
Стратегии ротации IP для Бразилии
Ротация при каждом запросе
Для массового скрейпинга каталогов используйте ротацию при каждом запросе. ProxyHat автоматически назначает новый IP при каждом соединении:
# Per-request rotation (default)
PROXY = "http://user-country-BR:pass@gate.proxyhat.com:8080"
Sticky-сессии
Для скрейпинга корзины или многостраничных процессов используйте sticky-сессии, чтобы сохранить один IP на время сессии:
# Sticky session — same IP for up to 30 minutes
PROXY = "http://user-country-BR-session-abc123:pass@gate.proxyhat.com:8080"
Выбор типа прокси
| Тип прокси | Лучше всего для | Скорость | Надёжность |
|---|---|---|---|
| Резидентный | Скрейпинг e-commerce, обход блокировок | Средняя | Высокая |
| Дата-центр | Высокоскоростной мониторинг, API | Высокая | Средняя |
| Мобильный | Мобильные приложения, соцсети | Низкая-средняя | Очень высокая |
Подробнее о типах прокси и их применении — в нашем руководстве по сравнению прокси.
Лучшие практики для LATAM-разведки
- Всегда используйте pt-BR Accept-Language — это влияет на контент и цены, которые вы видите
- Соблюдайте robots.txt — юридическая защита и этика
- Ограничьте частоту запросов — 1–2 запроса в секунду для большинства платформ
- Кэшируйте данные — не запрашивайте одни и те же данные повторно
- Проверяйте цены с учётом parcelas — реальная стоимость для потребителя может быть выше
- Используйте sticky-сессии для многостраничных процессов — корзина, чекаут
- Мониторьте блокировки — при ответах 403 или 503 снизьте скорость
- Храните данные в BRL — конвертируйте в USD только для отчётов, не для сравнения
Ключевые выводы
- Бразильские IP обязательны для точной разведки — платформы показывают разные данные иностранным IP
- LGPD разрешает сбор публичных данных, но требует соблюдения robots.txt и ограничения частоты запросов
- pt-BR — единственный правильный язык для парсинга; используйте бразильские термины
- Parcelas, Boleto и Pix — ключевые элементы ценообразования, без которых данные о ценах неточны
- Геотаргетинг на уровне городов (São Paulo, Rio de Janeiro) критически важен для регионального анализа
- ProxyHat предоставляет резидентные, мобильные и дата-центр прокси с геотаргетингом по Бразилии
Готовы начать сбор данных с бразильских платформ? Изучите тарифы ProxyHat и получите доступ к резидентным прокси с геотаргетингом по Бразилии. Подробнее о вариантах использования — на странице web scraping и SERP tracking.






