Shopify 스토어 스크래핑 개요
Shopify는 세계에서 가장 널리 사용되는 이커머스 플랫폼입니다. 경쟁사 분석, 가격 모니터링, 시장 조사를 위해 Shopify 스토어의 제품 데이터를 수집하는 것은 일반적입니다.
products.json API
Shopify 스토어는 기본적으로 /products.json 엔드포인트를 제공합니다:
import requests
def get_shopify_products(store_url, proxy=None):
url = f"{store_url}/products.json?limit=250"
proxies = {"https": proxy} if proxy else None
response = requests.get(url, proxies=proxies, timeout=30)
if response.status_code == 200:
return response.json()["products"]
return []
products = get_shopify_products("https://example-store.myshopify.com",
proxy="http://user:pass@gate.proxyhat.com:8080")
페이지네이션 처리
def get_all_products(store_url, proxy):
all_products = []
page = 1
while True:
url = f"{store_url}/products.json?limit=250&page={page}"
response = requests.get(url, proxies={"https": proxy}, timeout=30)
products = response.json().get("products", [])
if not products:
break
all_products.extend(products)
page += 1
return all_products
차단 방지
- Cloudflare로 보호된 스토어에는 레지덴셜 프록시 사용
- 요청 간 1-2초 간격 유지
- 실제 브라우저 헤더 사용
핵심 요약
- Shopify의
/products.json은 스크래핑에 편리한 기본 API입니다.- 대규모 모니터링에는 ProxyHat 프록시를 사용하십시오.






