Бразильские прокси для LATAM-разведки: полное руководство по e-commerce данным

Узнайте, как использовать бразильские прокси для сбора данных с Mercado Livre, Americanas и других платформ — с учётом LGPD, parcelas и геотаргетинга по городам.

Бразильские прокси для LATAM-разведки: полное руководство по e-commerce данным

Если ваша data-команда планирует выход на латиноамериканский рынок, Бразилия — первая остановка. Экономика свыше 2 трлн долларов, 160+ млн интернет-пользователей, крупнейший e-commerce в LATAM. Но есть проблема: бразильские платформы агрессивно блокируют иностранные IP, показывают регион-зависимые каталоги и оценивают всё в реалах (BRL). Без бразильских прокси ваши данные будут неполными, неточными или просто недоступными.

Это руководство охватывает: почему BR-IP критичны, какие платформы скрейпить, как соблюдать LGPD, учитывать pt-BR и платёжные потоки (Boleto, Pix, parcelas), и как настраивать геотаргетинг на уровне Сан-Паулу и Рио-де-Жанейро.

Почему бразильские IP-адреса имеют критическое значение

Бразильские сайты e-commerce активно используют геолокацию для определения контента. Вот что происходит с иностранным IP:

  • Другие каталоги — Mercado Livre показывает разные категории и рекомендации в зависимости от региона пользователя.
  • Искажённые цены — иностранные IP часто перенаправляются на международные версии с ценами в USD, не отражающие реальные локальные цены.
  • Агрессивные блокировки — OLX Brasil и Americanas блокируют или throttling-уют доступ с известных зарубежных диапазонов IP.
  • Разная доступность — многие товары доступны только в определённых штатах из-за логистических ограничений.

Если вы собираете данные о ценах, наличии товаров или конкурентной разведке с не-бразильского IP — вы получаете искажённую картину. Brazilian proxies решают эту проблему, предоставляя IP-адреса реальных бразильских пользователей.

Ключевые платформы для сбора данных

Mercado Livre — Amazon LATAM

Mercado Livre (mercadolivre.com.br) — крупнейший маркетплейс Бразилии с 90+ млн активных пользователей. При Mercado Livre scraping критически важно:

  • Отслеживать цены в реалах с учётом parcelas (рассрочки)
  • Мониторить ставки продавцов и условия доставки по штатам
  • Собирать рейтинги и отзывы для конкурентного анализа

Americanas

Americanas (americanas.com) — один из крупнейших бразильских ритейлеров, объединяющий онлайн и офлайн-продажи. Ключевые точки данных: цены, наличие на складах, промо-акции включая «Black Friday Brasil».

Magazine Luiza (Magalu)

Magalu (magazineluiza.com.br) — уникальная гибридная модель: маркетплейс + сеть физических магазинов + программа лояльности «Lu». Для рыночной разведки важны: динамическое ценообразование, связки онлайн-офлайн, региональные акции.

OLX Brasil

OLX Brasil (olx.com.br) — доминирует на рынке объявлений C2C. Ключевые данные: цены подержанных товаров, объём объявлений по категориям, региональные тенденции спроса.

Casas Bahia

Casas Bahia (casasbahia.com.br) — исторический лидер в сегменте электроники и мебели с агрессивной моделью рассрочки. Важно отслеживать: условия «parcelas sem juros» (беспроцентная рассрочка), привязку к кредитным картам.

Сравнение бразильских маркетплейсов

ПлатформаТипМодель ценКлючевая сложность
Mercado LivreМаркетплейсBRL + parcelas + купоныДинамические цены, анти-бот
AmericanasРитейлер + маркетплейсBRL + промо-кодыРегиональная доступность
Magazine LuizaГибридBRL + программа лояльностиСвязки онлайн/офлайн
OLX BrasilОбъявления C2CBRL, цены договорныеВысокая защита от ботов
Casas BahiaРитейлерBRL + parcelas sem jurosЗависимость от способа оплаты

LGPD: бразильский GDPR и скрейпинг публичных данных

Lei Geral de Proteção de Dados (LGPD) — бразильский закон о защите данных, действующий с 2020 года. Аналог GDPR, но с нюансами для скрейпинга.

Что разрешено:

  • Сбор публично доступных данных (цены, описания товаров, рейтинги продавцов) — законен при соблюдении заявленных целей
  • Агрегация рыночных данных без персональной идентификации
  • Академические и журналистские цели имеют дополнительные исключения

Что запрещено:

  • Сбор персональных данных без согласия (имена, CPF, номера телефонов)
  • Профилирование отдельных лиц без правового основания
  • Нарушение robots.txt для доступа к закрытым данным

Практические рекомендации:

  • Соблюдайте robots.txt — это защита от юридических рисков
  • Не собирайте персональные данные, если они не нужны для анализа
  • Ограничьте частоту запросов, чтобы не перегружать серверы
  • Аннотируйте данные как агрегированные рыночные данные
Важно: LGPD и GDPR имеют схожий подход к публичным данным, но LGPD не требует обязательного назначения DPO для компаний за пределами Бразилии. При скрейпинге публичных цен и каталогов LGPD, как правило, не создаёт препятствий — при условии соблюдения robots.txt и разумной частоты запросов.

Языковые нюансы: pt-BR vs pt-PT

Бразильский португальский (pt-BR) — доминирующий язык контента на бразильских платформах. Различия с европейским португальским (pt-PT) существенны для скрейпинга:

Аспектpt-BRpt-PT
КорзинаCarrinhoCesto
ПоискBuscarPesquisar
СкидкаDescontoDesconto
РассрочкаParcelasPrestações
Бесплатная доставкаFrete grátisPortes grátis
ПродавецVendedorVendedor

Практический совет: При скрейпинге бразильских сайтов всегда используйте pt-BR для поиска и парсинга. Если ваш код ищет «Prestações» вместо «Parcelas» — вы не найдёте данные о рассрочке на Mercado Livre. Устанавливайте заголовок Accept-Language: pt-BR,pt;q=0.9 во всех запросах.

Платёжные потоки: почему Boleto, Pix и parcelas имеют значение

Бразильская платёжная экосистема уникальна. Если вы сравниваете цены без учёта местных платёжных методов — ваши данные неточны.

Boleto Bancário

Boleto — платёжный баркод-документ для оплаты в банкоматах, банках и лотерейных кассах. ~25% онлайн-покупок в Бразилии оплачиваются через Boleto. Многие продавцы дают скидку 5–15% за оплату через Boleto, так как это мгновенное подтверждение.

Pix

Pix — мгновенная платёжная система Бразилии, запущенная в 2020 году. К 2024 году Pix обрабатывает более 4 млрд транзакций в месяц. Многие продавцы предлагают «Pix discount» — скидку 3–10% за мгновенную оплату.

Parcelas (рассрочка)

Рассрочка — король бразильского e-commerce. «12x sem juros» (12 платежей без процентов) — стандартная акция. Реальная цена для потребителя может отличаться на 20–40% в зависимости от количества parcelas и наличия процентов.

Для точного сравнения цен скрейпите:

  • Цену à vista (полная цена при оплате сразу)
  • Цену com parcelas (цена в рассрочку)
  • Количество parcelas и наличие juros (процентов)
  • Скидки за Boleto и Pix

Геотаргетинг на уровне городов: São Paulo и Rio de Janeiro

Бразилия — континентальная страна с огромными региональными различиями. Цены и доступность товаров различаются между штатами и даже городами. Для точной разведки нужен IP из конкретного города.

São Paulo

Сан-Паулу — финансовый центр Бразилии и крупнейший потребительский рынок. Большинство продавцов предлагают лучшую логистику и цены для этого региона. Население 22+ млн в метрополии.

Rio de Janeiro

Рио — второй по величине рынок с отличной логистикой, но другими потребительскими паттернами и ценами. Население 13+ млн в метрополии.

С ProxyHat вы можете таргетировать конкретные города:

# São Paulo residential IP
http://user-country-BR-city-sao_paulo:pass@gate.proxyhat.com:8080

# Rio de Janeiro residential IP
http://user-country-BR-city-rio_de_janeiro:pass@gate.proxyhat.com:1080

Реализация: скрейпинг Mercado Livre с бразильским прокси

Python с requests и ProxyHat

import requests
from bs4 import BeautifulSoup

PROXY = "http://user-country-BR-city-sao_paulo:pass@gate.proxyhat.com:8080"
proxies = {"http": PROXY, "https": PROXY}

headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36",
    "Accept-Language": "pt-BR,pt;q=0.9,en;q=0.8",
}

url = "https://lista.mercadolivre.com.br/smartphone"
response = requests.get(url, headers=headers, proxies=proxies, timeout=30)
soup = BeautifulSoup(response.text, "html.parser")

items = soup.select(".ui-search-layout__item")
for item in items:
    title = item.select_one(".ui-search-item__title").text
    price = item.select_one(".andes-money-amount__fraction").text
    installments = item.select_one(".ui-search-installment")
    if installments:
        print(f"{title} — R$ {price} | {installments.text.strip()}")
    else:
        print(f"{title} — R$ {price}")

cURL для быстрой проверки

curl -x http://user-country-BR:pass@gate.proxyhat.com:8080 \
  -H "Accept-Language: pt-BR,pt;q=0.9" \
  "https://www.americanas.com.br/categoria/celulares-e-smartphones" \
  -o americanas.html

Стратегии ротации IP для Бразилии

Ротация при каждом запросе

Для массового скрейпинга каталогов используйте ротацию при каждом запросе. ProxyHat автоматически назначает новый IP при каждом соединении:

# Per-request rotation (default)
PROXY = "http://user-country-BR:pass@gate.proxyhat.com:8080"

Sticky-сессии

Для скрейпинга корзины или многостраничных процессов используйте sticky-сессии, чтобы сохранить один IP на время сессии:

# Sticky session — same IP for up to 30 minutes
PROXY = "http://user-country-BR-session-abc123:pass@gate.proxyhat.com:8080"

Выбор типа прокси

Тип проксиЛучше всего дляСкоростьНадёжность
РезидентныйСкрейпинг e-commerce, обход блокировокСредняяВысокая
Дата-центрВысокоскоростной мониторинг, APIВысокаяСредняя
МобильныйМобильные приложения, соцсетиНизкая-средняяОчень высокая

Подробнее о типах прокси и их применении — в нашем руководстве по сравнению прокси.

Лучшие практики для LATAM-разведки

  1. Всегда используйте pt-BR Accept-Language — это влияет на контент и цены, которые вы видите
  2. Соблюдайте robots.txt — юридическая защита и этика
  3. Ограничьте частоту запросов — 1–2 запроса в секунду для большинства платформ
  4. Кэшируйте данные — не запрашивайте одни и те же данные повторно
  5. Проверяйте цены с учётом parcelas — реальная стоимость для потребителя может быть выше
  6. Используйте sticky-сессии для многостраничных процессов — корзина, чекаут
  7. Мониторьте блокировки — при ответах 403 или 503 снизьте скорость
  8. Храните данные в BRL — конвертируйте в USD только для отчётов, не для сравнения

Ключевые выводы

  • Бразильские IP обязательны для точной разведки — платформы показывают разные данные иностранным IP
  • LGPD разрешает сбор публичных данных, но требует соблюдения robots.txt и ограничения частоты запросов
  • pt-BR — единственный правильный язык для парсинга; используйте бразильские термины
  • Parcelas, Boleto и Pix — ключевые элементы ценообразования, без которых данные о ценах неточны
  • Геотаргетинг на уровне городов (São Paulo, Rio de Janeiro) критически важен для регионального анализа
  • ProxyHat предоставляет резидентные, мобильные и дата-центр прокси с геотаргетингом по Бразилии

Готовы начать сбор данных с бразильских платформ? Изучите тарифы ProxyHat и получите доступ к резидентным прокси с геотаргетингом по Бразилии. Подробнее о вариантах использования — на странице web scraping и SERP tracking.

Готовы начать?

Доступ к более чем 50 млн резидентных IP в 148+ странах с AI-фильтрацией.

Смотреть ценыРезидентные прокси
← Вернуться в Блог