Brazylia to największy rynek e-commerce w Ameryce Łacińskiej — ponad 210 milionów konsumentów i przychody online przekraczające 40 miliardów USD rocznie. Jeśli Twoja drużyna ds. rozwoju wchodzi na rynek LATAM, dane z brazylijskich platform to nie opcja, lecz fundament. Problem? Te platformy aktywnie blokują zagraniczne IP, pokazują inne katalogi i ceny dla adresów spoza Brazylii, a lokalne niuanse — od Boleto po język pt-BR — sprawiają, że zwykłe proxy to za mało.
W tym przewodniku pokazujemy, jak brazylijskie proxy pozwalają zbierać wiarygodne dane z Mercado Livre, Americanas, Magazine Luiza, OLX Brasil i Casas Bahia — z pełnym poszanowaniem LGPD i realistycznym podejściem do lokalnych specyfik.
Dlaczego brazylijskie adresy IP są niezbędne
Brazylijskie witryny e-commerce stosują agresywną geolokalizację. Oto co się dzieje, gdy łączysz się spoza Brazylii:
- Odmienny katalog produktów — wiele pozycji dostępnych tylko na rynku BR w ogóle się nie wyświetla dla IP z USA czy Europy.
- Ceny w USD lub EUR — zamiast reali w BRL, widzisz przeliczone ceny, które nie odzwierciedlają lokalnych promocji.
- Blokady i CAPTCHA — Americanas i Casas Bahia znane są z agresywnego rate-limitingu i blokad IP dla ruchu zagranicznego.
- Przekierowania — OLX Brasil często przekierowuje zagraniczne IP na globalną wersję OLX, pozbawioną brazylijskich ofert.
W praktyce: bez brazylijskiego IP Twoje dane są niepełne, zniekształcone lub po prostu niedostępne.
Kluczowe platformy e-commerce w Brazylii
Mercado Livre — latynoamerykański Amazon
Mercado Livre (Mercado Libre w hiszpańskojęzycznych krajach) to największy marketplace w LATAM. W Brazylii oferuje ponad 300 milionów aktywnych ofert, od elektroniki po usługi finansowe. Scraping Mercado Livre wymaga rotacji IP na poziomie żądań, ponieważ platforma szybko blokuje podejrzane sesje. Kluczowe dane: ceny w BRL, oceny sprzedawców, dostępność produktów, warunki parcelas (ratalne).
Americanas
Po fuzji B2W Digital, Americanas łączy marketplace z własną sprzedażą. Charakteryzuje się agresywną weryfikacją botów — Cloudflare i własne systemy. Często wymaga sticky sessions, aby utrzymać koszyk i śledzić ceny dynamiczne.
Magazine Luiza (Magalu)
Magalu to hybryda marketplace i platformy social-commerce. Unikalna cecha: integracja z programem afiliacyjnym i dynamiczne ceny zależne od regionu. Geo-targeting na poziomie stanu lub miasta jest kluczowy dla dokładnego monitorowania.
OLX Brasil
OLX dominuje w segmencie C2C — nieruchomości, pojazdy, elektronika używana. Struktura ofert jest mniej ustandaryzowana niż na marketplace'ach, co wymaga elastycznego parsowania. OLX aktywnie blokuje zagraniczne IP, przekierowując je na globalną stronę.
Casas Bahia
Kultowa sieć detaliczna z silnym naciskiem na sprzedaż ratalną (crediário). Casas Bahia pokazuje różne ceny i warunki kredytowe w zależności od stanu — geo-targeting na poziomie miasta jest tu absolutnie niezbodny.
Porównanie platform brazylijskich
| Platforma | Typ | Ochrona anti-bot | Geolokalizacja cen | Wymagany typ proxy |
|---|---|---|---|---|
| Mercado Livre | Marketplace | Umiarkowana | Tak (BRL vs USD) | Residential z rotacją |
| Americanas | Hybryda | Wysoka (Cloudflare) | Częściowa | Residential sticky |
| Magazine Luiza | Social-commerce | Umiarkowana | Tak (regionalna) | Residential + geo |
| OLX Brasil | C2C / ogłoszenia | Wysoka | Tak (przekierowanie) | Mobile / residential |
| Casas Bahia | Detal + ratalna | Umiarkowana | Tak (stanowa) | Residential sticky |
LGPD — brazylijskie prawo ochrony danych
Lei Geral de Proteção de Dados (LGPD) to brazylijski odpowiednik RODO. Obowiązuje od września 2020 i ma wiele wspólnego z europejskim GDPR:
- Wymaga legalnej podstawy przetwarzania (zgoda, wykonanie umowy, legitny interes, itp.).
- Uznaje prawa osób do dostępu, korekty i usunięcia danych.
- Stosuje się do danych osób fizycznych, nie dotyczy danych prawnych/osób prawnych.
Co to oznacza dla scrapingu?
Scraping publicznie dostępnych danych — cen, opisów produktów, dostępności — mieści się w ramach LGPD, podobnie jak w GDPR. Kluczowe zasady:
- Unikaj danych osobowych — nazwiska sprzedawców na Mercado Livre, numery telefonów na OLX, adresy e-mail to dane osobowe. Nie zbieraj ich bez podstawy prawnej.
- Szanuj robots.txt — choć nie jest wiążący prawnie, ignorowanie go może być argumentem przeciwko Tobie w sporze.
- Minimalizacja danych — zbieraj tylko to, co niezbędne do Twojego celu analitycznego.
- Przechowywanie — nie trzymaj danych dłużej niż wymaga tego cel analizy.
Praktyczna zasada: jeśli dane są widoczne dla każdego użytkownika bez logowania i nie są danymi osobowymi, scraping publiczny jest defensible pod LGPD. Zawsze skonsultuj się z prawnikiem.
Portugalski vs Brazylijski Portugalski (pt-BR)
To nie jest tylko kwestia akcentu. pt-BR i pt-PT różnią się znacząco w kontekście e-commerce:
- Terminologia produktów — "celular" (BR) vs "telemóvel" (PT), "geladeira" (BR) vs "frigorífico" (PT). Zapytania w pt-PT zwrócą gorsze wyniki na brazylijskich platformach.
- Nazwy kategorii — Mercado Livre używa "Eletrodomésticos", nie "Eletrodomésticos" (z akcentem), i ma unikalne podkategorie nieobecne w wersji europejskiej.
- Słowa kluczowe SEO — Brazylijczycy wyszukują "frete grátis" (darmowa dostawa), nie "envio gratuito". Monitorowanie właściwych terminów jest kluczowe dla dokładnej analizy konkurencji.
- Format waluty — BRL używa przecinka jako separatora dziesiętnej i kropki jako separatora tysięcy: R$ 1.299,90, nie R$1,299.90.
Twoje skrypty scrapujące muszą uwzględniać pt-BR w nagłówkach Accept-Language i w zapytaniach wyszukiwania.
Specyfika płatności: Boleto, Pix i parcelas
To jest element, który większość zagranicznych drużyn analitycznych ignoruje — a jest krytyczny dla porównywania cen w Brazylii.
Boleto Bancário
Boleto to bilet płatniczy generowany online, opłacany w banku, loterii lub bankomacie. Wciąż odpowiada za około 15-20% płatności e-commerce w Brazylii. Ceny dla Boleto mogą być wyższe niż dla karty (sprzedawcy doliczają opłatę). Jeśli scrapujesz tylko cenę karty, nie widzisz pełnego obrazu.
Pix
Instant payment system Brazylijskiego Banku Centralnego, uruchomiony w 2020. Pix jest teraz drugą najpopularniejszą metodą płatności online w Brazylii. Wiele sklepów oferuje desconto Pix — rabat 5-15% za płatność przez Pix. To często najniższa dostępna cena produktu.
Parcelas (raty)
Brazylijczycy rzadko płacą całą kwotę od razu. Typowe oferty: 10x sem juros (10 rat bez odsetek) lub 12x com juros. Na Mercado Livre i Casas Bahia cena wyświetlana to często cena ratalna, nie całkowita. Twój scraper musi obliczać cenę całkowitą: parcela × número de parcelas.
Bez uwzględnienia desconto Pix, dopłaty Boleto i cen ratalnych, Twoja analiza cenowa jest zniekształcona o 5-25% w stosunku do rzeczywistych kosztów dla konsumenta.
Geo-targeting na poziomie miast: São Paulo i Rio de Janeiro
Brazylia to kraj kontynentalnych rozmiarów — 8,5 mln km². Ceny, dostępność i warunki dostawy różnią się drastycznie między stanami i miastami.
São Paulo (SP)
Największy rynek e-commerce w LATAM. Większość centrów dystrybucyjnych znajduje się w stanie SP, co oznacza: — Szybsze i tańsze dostawy (często frete grátis) — Szerszy asortyment produktów — Niższe ceny ratalne w Casas Bahia i Magalu
Rio de Janeiro (RJ)
Drugi co do wielkości rynek miejski. Różnice względem SP: — Wyższe koszty dostawy — Ograniczona dostępność niektórych produktów — Inne promocje regionalne
Jak ustawić geo-targeting z ProxyHat
ProxyHat pozwala na geo-targeting na poziomie kraju i miasta poprzez flagi w nazwie użytkownika:
# São Paulo - HTTP
http://user-country-BR-city-sao_paulo:pass@gate.proxyhat.com:8080
# Rio de Janeiro - HTTP
http://user-country-BR-city-rio_de_janeiro:pass@gate.proxyhat.com:8080
# Sticky session dla São Paulo (przydatne przy Americanas)
http://user-session-sp01-country-BR-city-sao_paulo:pass@gate.proxyhat.com:8080
Sticky sessions są kluczowe, gdy musisz zachować koszyk lub śledzić dynamiczne ceny w ramach jednej sesji przeglądarkowej.
Implementacja: scraping Mercado Livre w Pythonie
Poniżej kompletny przykład scrapingu cen z Mercado Livre z brazylijskim residential proxy, uwzględniający pt-BR i format BRL:
import requests
from bs4 import BeautifulSoup
import re
PROXY = "http://user-country-BR-city-sao_paulo:pass@gate.proxyhat.com:8080"
PROXIES = {"http": PROXY, "https": PROXY}
HEADERS = {
"Accept-Language": "pt-BR,pt;q=0.9",
"User-Agent": (
"Mozilla/5.0 (Windows NT 10.0; Win64; x64) "
"AppleWebKit/537.36 (KHTML, like Gecko) "
"Chrome/125.0.0.0 Safari/537.36"
),
}
def parse_brl_price(text):
"""Konwersja 'R$ 1.299,90' na float 1299.90"""
cleaned = text.replace("R$", "").replace(".", "").replace(",", ".").strip()
return float(cleaned)
def scrape_mercado_livre(query, max_pages=3):
results = []
for page in range(1, max_pages + 1):
url = f"https://lista.mercadolivre.com.br/{query}_NoIndex_True_Page_{page}"
resp = requests.get(url, headers=HEADERS, proxies=PROXIES, timeout=15)
soup = BeautifulSoup(resp.text, "html.parser")
for item in soup.select("li.ui-search-layout__item"):
title_el = item.select_one("h2.ui-search-item__title")
price_el = item.select_one("span.andes-money-amount__fraction")
if not title_el or not price_el:
continue
title = title_el.get_text(strip=True)
price = parse_brl_price(price_el.get_text(strip=True))
# Sprawdź parcelas
installment_el = item.select_one("span.ui-search-installments")
installments = installment_el.get_text(strip=True) if installment_el else None
results.append({
"title": title,
"price_brl": price,
"installments": installments,
})
return results
data = scrape_mercado_livre("geladeira")
for d in data[:5]:
print(f"{d['title']}: R$ {d['price_brl']:.2f} | {d['installments']}")
Ten przykład używa residential proxy z São Paulo, nagłówka Accept-Language: pt-BR i poprawnie parsuje format BRL. Zauważ ekstrakcję parcelas — bez tego nie widzisz pełnej struktury cenowej.
Najlepsze praktyki dla LATAM market intelligence
- Rotuj IP między żądaniami — brazylijskie platformy szybko flagują powtarzające się IP. Używaj rotacji per-request dla list produktów i sticky sessions dla śledzenia koszyka.
- Używaj residential proxy, nie datacenter — brazylijskie ranges datacenter są dobrze znane i często blokowane. Residential IP wyglądają jak prawdziwi użytkownicy.
- Monitoruj desconto Pix osobno — wiele platform pokazuje cenę Pix dopiero na stronie produktu, nie na liście. Twój scraper musi wejść na stronę detalu.
- Szacuj cenę całkowitą z parcelas — zapisuj zarówno cenę ratalną, jak i całkowitą. Różnica może być znacząca przy porównywaniu ofert.
- Testuj geo-targeting — porównaj ceny z IP w SP i RJ, aby wykryć różnice regionalne. Różnice w darmowej dostawie mogą wpływać na pozycjonowanie cenowe.
- Szanuj rate limity — ogranicz się do 1-2 żądań na sekundę per IP. Agresywny scraping szybko aktywuje CAPTCHA.
Kiedy używać SOCKS5 zamiast HTTP
HTTP proxy na porcie 8080 wystarcza dla większości zadań scrapingu. SOCKS5 na porcie 1080 jest przydatny, gdy:
- Używasz narzędzi wymagających SOCKS5 (np. niektóre konfiguracje przeglądarkowe z Puppeteer).
- Potrzebujesz tunelowania UDP dla specyficznych protokołów.
- Omijasz firewalle, które blokują jawne nagłówki HTTP proxy.
# SOCKS5 z geo-targetingiem Rio de Janeiro
socks5://user-country-BR-city-rio_de_janeiro:pass@gate.proxyhat.com:1080
Najważniejsze wnioski
Kluczowe punkty do zapamiętania:
- Bez brazylijskiego IP Twoje dane z Mercado Livre, Americanas i OLX są niepełne lub zniekształcone — BR-origin IP to wymóg, nie opcja.
- LGPD pozwala na scraping publicznych danych, ale wymaga minimalizacji i unikania danych osobowych — traktuj ją jak GDPR.
- pt-BR różni się od pt-PT w terminologii e-commerce — używaj właściwych słów kluczowych i nagłówka Accept-Language.
- Desconto Pix, dopłaty Boleto i parcelas drastycznie wpływają na cenę końcową — scraper musi je uwzględniać.
- Geo-targeting na poziomie miast (São Paulo, Rio de Janeiro) jest kluczowy dla dokładnego monitorowania dostępności i kosztów dostawy.
Jeśli Twoja drużyna wchodzi na rynek LATAM, brazylijskie residential proxy od ProxyHat to narzędzie, które zamienia niedostępne dane w konkurencyjną przewagę. Sprawdź plany cenowe ProxyHat i zacznij zbierać wiarygodne dane z największego rynku LATAM.
Więcej o zastosowaniach proxy w analizie rynku przeczytasz w naszym przewodniku po web scrapingu oraz w analizie śledzenia SERP. Dostępne lokalizacje proxy sprawdzisz na stronie lokalizacji ProxyHat.






