ブラジルプロキシでLATAM市場インテリジェンスを制する完全ガイド

Mercado Livre、Magalu、Americanasなどブラジル主要ECのスクレイピングにBR発IPが不可欠な理由から、LGPD対応、Pix・Boleto決済の価格比較、都市別ジオターゲティングまで実践的に解説。

ブラジルプロキシでLATAM市場インテリジェンスを制する完全ガイド

なぜLATAM市場インテリジェンスにブラジルプロキシが必要なのか

ラテンアメリカ最大の経済圏ブラジルは、GDPで世界トップ10に入る巨大市場です。しかし、Mercado LivreやAmericanasなどの主要ECプラットフォームは、海外IPからのアクセスに対してカタログの差し替え・価格の非表示・アクセスブロックを行います。ブラジル国外から正確な市場データを取得するには、ブラジルプロキシ(Brazilian proxies)が不可欠です。

この記事では、LATAM展開を目指すデータ・グロースチームに向けて、ブラジルECスクレイピングの実践手法、LGPD(ブラジルデータ保護法)への対応、pt-BR言語の留意点、PixやBoletoなど独自決済フローの価格比較手法、そして都市別ジオターゲティングの活用まで解説します。

BR発IPが必須になる3つの理由

1. ブラジル専用カタログとReal建て価格

Mercado Livreは国別に独立したドメイン(mercadolivre.com.br)を運営しており、ブラジル国内IPにはBRL(レアル)建て価格・ブラジル在庫を表示します。海外IPでアクセスすると、通貨がUSDに変換されたり、そもそも商品が表示されないことがあります。正確な価格比較にはBR発IPが必須です。

2. 積極的な海外IPブロック

AmericanasやCasas Bahiaは、CloudflareやAkamaiを利用して海外IPからのスクレイピングを検知・ブロックしています。レジデンシャルプロキシであっても、ブラジル以外のIPではCAPTCHAが連続で表示されたり、HTTP 403が返されます。

3. 地域別の価格・在庫差異

ブラジルは連邦制のため、州ごとに消費税(ICMS)が異なり、同じ商品でも都市によって価格が変わるケースがあります。São PauloとRio de Janeiroで異なる価格を取得するには、都市単位のジオターゲティングが必要です。

ブラジル主要ECプラットフォームとスクレイピングの要点

以下は、LATAM市場インテリジェンスで押さえるべき主要プラットフォームの比較です。

プラットフォーム 月間訪問数(概算) スクレイピング難易度 主な取得データ 決済方式
Mercado Livre 3億+ 中〜高 商品価格・レビュー・出品者数 Pix・Boleto・カード・分割
Americanas 1.5億+ 商品価格・在庫状況・配送料 Pix・Boleto・カード・分割
Magazine Luiza (Magalu) 1億+ 価格・サブマーケット出品情報 Pix・Boleto・カード・分割
OLX Brasil 8,000万+ 中古品価格・地域別需給 直接取引が中心
Casas Bahia 6,000万+ 家電・家具価格・分割条件 Pix・Boleto・カード・長期分割

Mercado Livreスクレイピングのポイント

Mercado LivreはLATAM最大のマーケットプレイスであり、「Mercado Livre scraping」は価格監視・競合分析の基盤です。公開APIがありますが、レート制限が厳しく、取得できるデータも限定的です。大規模な価格監視にはプロキシ経由のウェブスクレイピングが現実的です。

  • レビュー取得:各商品の評価・レビュー数は需要予測に直結
  • 出品者分析:同一商品の出品者数と価格分散から競争強度を把握
  • カテゴリ別トレンド:季節商品の価格変動を追跡

OLX Brasil — 中古市場のインテリジェンス

OLX Brasilは中古車・不動産・家電などのC2C取引プラットフォームです。地域別の需給バランスを把握するのに不可欠で、都市単位のジオターゲティングと組み合わせることで、ローカル市場の価格差を検出できます。

LGPD — ブラジルデータ保護法とスクレイピング

ブラジルのLGPD(Lei Geral de Proteção de Dados)は、EUのGDPRと同様のデータ保護法です。2020年施行以降、公開データのスクレイピングにも影響を与えています。

LGPD下で安全なスクレイピング範囲

  • 公開価格データ:ECサイトに一般公開されている商品価格・在庫情報の収集は、LGPDの「個人データ」に該当しません。これはGDPRと同じ解釈です。
  • レビュー・評価:ユーザー名と結びつくレビューは「個人データ」の可能性があります。匿名化して集計するか、統計情報のみを取得してください。
  • robots.txtの尊重:LGPD違反と直接の関係はありませんが、ToS違反のリスクを減らすため、robots.txtを確認することが推奨されます。

実務的アドバイス:個人を特定可能なデータ(名前・メール・電話番号)の収集を避け、商品・価格・在庫などの非個人データに限定すれば、LGPDのリスクは最小限です。

pt-BR言語の留意点 — ポルトガル語との違い

ブラジルポルトガル語(pt-BR)と欧州ポルトガル語(pt-PT)は、語彙・スペル・表現において重要な違いがあります。LATAM市場データを正確に取得・解析するには、pt-BRを前提にスクレイピングを設計する必要があります。

主な違いとスクレイピングへの影響

  • 通貨表記:pt-BRでは「R$ 1.234,56」(カンマが小数点、ピリオドが桁区切り)。パーサーはこの形式に対応する必要があります。
  • 語彙差:pt-PTの「telemóvel」はpt-BRでは「celular」。検索クエリやCSSセレクタでpt-PTの語彙を使うと結果が0件になります。
  • Accept-Languageヘッダーpt-BRを指定しないと、一部サイトがpt-PTコンテンツや英語コンテンツを返すことがあります。

スクレイピングのHTTPリクエストでは、必ず以下を設定してください。

Accept-Language: pt-BR,pt;q=0.9,en-US;q=0.8

ブラジル決済フローの価格比較 — Pix・Boleto・Parcelas

ブラジルECの価格比較では、表示価格だけでは不十分です。決済方式によって最終価格が大きく異なるため、「本当の価格」を比較するには決済フローも考慮する必要があります。

Pix — 即時決済の主流

2020年に導入されたPixは、ブラジルで最も急速に普及した決済手段です。2024年時点でブラジルのオンライン決済の40%以上を占めています。Pix決済の場合、割引が適用されることが多く、表示価格より安くなるケースが頻繁にあります。

Boleto — 現金決済の代替

Boleto(ボレート)はバーコード付きの支払い票で、銀行窓口やコンビニで現金決済できる仕組みです。銀行口座を持たない層にも普及していますが、支払い期日を過ぎると無効になり、割引が適用されない場合があります。

Parcelas — 分割払いの実態

ブラジルでは「10x sem juros(10回払い手数料無料)」のような分割払いが一般的です。一見すると手数料無料ですが、一括払い価格より分割払い合計が高いケースや、逆にPix一括払いで大幅割引されるケースがあります。正確な価格比較には以下を取得する必要があります。

  • 一括払い価格(à vista)
  • Pix割引価格
  • 分割払い回数と1回あたりの金額
  • 分割払いの総額

Casas Bahiaなどは分割条件が複雑で、12回・24回・48回と複数プランを提示します。スクレイピング時には、各プランの総額を計算して比較してください。

都市別ジオターゲティング — São PauloとRio de Janeiro

ブラジルのECプラットフォームの中には、都市レベルで価格や在庫を変動させるものがあります。特に食料品・日用品カテゴリや、配送料込みの価格表示を行うプラットフォームで顕著です。

ProxyHatでの都市別ジオターゲティング

ProxyHatでは、ユーザー名にジオターゲティングフラグを追加して、特定都市のIPを指定できます。

# São PauloのIPを使用
http://user-country-BR-city-sao_paulo:pass@gate.proxyhat.com:8080

# Rio de JaneiroのIPを使用
http://user-country-BR-city-rio_de_janeiro:pass@gate.proxyhat.com:8080

都市別価格差の実例

  • São Paulo:人口1,200万、ブラジル最大の消費市場。競合が多く、価格競争が激しい傾向。
  • Rio de Janeiro:人口670万、観光需要の影響で一部カテゴリの価格が高い傾向。
  • その他都市:Salvador・Belo Horizonte・Brasíliaなども重要市場。ICMS税率が異なるため、実効価格が変わります。

実装ガイド — Pythonとcurlでブラジルプロキシを使う

Python(requests + ProxyHat)

import requests

# ProxyHat ブラジルレジデンシャルプロキシ設定
proxies = {
    "http": "http://user-country-BR:pass@gate.proxyhat.com:8080",
    "https": "http://user-country-BR:pass@gate.proxyhat.com:8080",
}

headers = {
    "Accept-Language": "pt-BR,pt;q=0.9",
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36",
}

# Mercado Livreの検索結果を取得
url = "https://lista.mercadolivre.com.br/celulares-smartphones"
response = requests.get(url, proxies=proxies, headers=headers, timeout=30)
print(f"Status: {response.status_code}")
print(f"Content length: {len(response.text)}")

curl — São Pauloジオターゲティング

curl -x "http://user-country-BR-city-sao_paulo:pass@gate.proxyhat.com:8080" \
  -H "Accept-Language: pt-BR,pt;q=0.9" \
  "https://www.americanas.com.br/categoria/celulares-e-smartphones"

セッション固定(Sticky Session)でログイン後データを取得

一部のデータはログイン後にしか表示されません。セッションIDを指定してIPを固定できます。

# セッションを30分間固定
proxies = {
    "http": "http://user-country-BR-session-my_session_01:pass@gate.proxyhat.com:8080",
    "https": "http://user-country-BR-session-my_session_01:pass@gate.proxyhat.com:8080",
}

セッションIDは任意の文字列を指定でき、同じIDを使い続ける限り同じIPが割り当てられます。ログイン→データ取得の流れでIPが変わるとセッションが切断されるため、この機能が必須です。

レジデンシャル vs データセンター — ブラジルでの選択基準

基準 レジデンシャルプロキシ データセンタープロキシ
ブロック回避率 高(ISP IPと同じ) 低(データセンターブロックされる)
速度 高速
コスト GB単位で高め 安価
推奨用途 Mercado Livre・Americanasスクレイピング APIアクセス・高速バッチ処理
ジオターゲティング 都市レベル対応 国レベルのみ

ブラジルECサイトの多くはデータセンターIPを即座にブロックするため、Mercado Livreスクレイピングにはレジデンシャルプロキシが実質必須です。価格監視を継続的に行う場合は、ProxyHatのレジデンシャルプランを検討してください。

Key Takeaways — ブラジルプロキシ活用の要点

  • BR発IPが必須:ブラジルECは海外IPをブロック・制限する。レジデンシャルプロキシでBR IPを取得することが第一歩。
  • 決済フローを含めた価格比較:Pix割引・Boleto条件・分割払い総額まで取得して「本当の価格」を比較する。
  • pt-BRを前提に設計:Accept-Languageヘッダー、通貨フォーマット(R$ 1.234,56)、語彙の違いに注意。
  • LGPDは公開データに限定すれば低リスク:個人データを収集せず、商品・価格・在庫データに留める。
  • 都市別ジオターゲティングを活用:São PauloとRio de Janeiroで価格差を検出し、ローカル戦略に活かす。
  • セッション固定でログイン後データを取得:ProxyHatのsticky session機能でIPを固定し、認証後のページを確実にスクレイピング。

ブラジル市場への本格参入や競合分析には、正確なローカルデータの継続取得が不可欠です。ProxyHatのウェブスクレイピング活用事例も併せてご覧ください。LATAM全域のSERP追跡が必要な場合は、SERPトラッキングのページも参照してください。

始める準備はできましたか?

AIフィルタリングで148か国以上、5,000万以上のレジデンシャルIPにアクセス。

料金を見るレジデンシャルプロキシ
← ブログに戻る