Hindistan Proksileri ile Hindistan Pazarı Veri Toplama Rehberi

Flipkart, Amazon India, MakeMyTrip ve daha fazlası için Hintli IP'ler neden zorunlu? IT Act 2000, DPDP Act 2023 kapsamında public veri kazıma, Indic script handling ve şehir bazlı geo-targeting rehberi.

Hindistan Proksileri ile Hindistan Pazarı Veri Toplama Rehberi

Hindistan Proksileri Neden Kritik?

Hindistan, 1,4 milyarlık nüfusu ve hızla büyüyen dijital ekonomisiyle dünyanın en büyük pazarlarından biri. Ancak bu pazardan anlamlı veri toplamak, yurtdışı IP'lerle neredeyse imkânsız. Flipkart, Amazon India, MakeMyTrip ve benzeri platformlar; fiyatları, katalogları ve ödeme seçeneklerini coğrafi konuma göre dramatik şekilde değiştiriyor. Indian proxies kullanmadan Hindistan pazarına dair doğru veriye ulaşamazsınız.

Bu rehberde, Hindistan kaynaklı residential proxy'lerle veri toplamanın neden zorunlu olduğunu, hangi platformlarda ne tür veriler elde edebileceğinizi, IT Act 2000 ve DPDP Act 2023 kapsamındaki yasal çerçeveyi ve teknik uygulama detaylarını ele alacağız.

Hindistan Kaynaklı IP'ler Neden Zorunlu?

Fiyat ve Katalog Bölgesel Farklılıkları

Flipkart, Hindistan'ın farklı eyaletlerinde bile farklı fiyatlar gösterir. Delhi'den eriştiğinizde gördüğünüz indirim, Bangalore'den eriştiğinizde farklı olabilir. Bu durum şunlara dayanır:

  • Eyalet bazlı KDV farkları — GST oranları kategorilere göre değişir, bazı eyaletler ek vergi uygular.
  • Bölgesel kampanyalar — Flipkart'ın "Big Billion Days" ve benzeri kampanyaları şehirlere göre farklı zamanlanır.
  • Stok ve lojistik — Yerel depo stoklarına göre ürün görünürlüğü değişir.

ABD veya Avrupa IP'leriyle Flipkart'a eriştiğinizde ise karşılaşacağınız sorunlar:

  • Sayfa yavaş yüklenir veya timeout alırsınız.
  • Fiyatlar USD cinsinden gösterilir, Hindistan rupeesi yerine.
  • Bazı kategoriler tamamen gizlenir.
  • CAPTCHA sıkça tetiklenir.

Non-IN Trafiğe Kısıtlamalar

Amazon India, yurtdışı IP'lerden erişildiğinde uluslararası Amazon.com'a yönlendirme yapabilir. MakeMyTrip, yurtdışı trafiğe uluslararası uçuş fiyatlarını gösterirken iç hat fiyatlarını gizler. Naukri.com, bazı iş ilanlarını sadece Hintli IP'lerden görünür kılar. India residential proxies olmadan, bu platformların gerçek kullanıcı deneyimini göremezsiniz.

Temel Kullanım Senaryoları ve Platformlar

E-Ticaret: Flipkart ve Amazon India

Flipkart scraping, Hindistan e-ticaret veri toplamanın en yaygın hedefidir. Flipkart'ın dinamik fiyatlandırması ve bölgesel katalogları, fiyat karşılaştırma ve pazar analitiği için zengin veri sunar.

  • Ürün fiyatları ve indirimler — Şehir bazlı fiyat karşılaştırması.
  • Stok durumu — Hangi ürünlerin hangi bölgelerde tükenmekte olduğu.
  • Değerlendirmeler ve yorumlar — Rakip analizinde kritik.
  • Satıcı bilgileri — 3P satıcı ekosistemini anlama.

Amazon India ise Flipkart'a benzer bölgesel farklılıklar gösterir ve ek olarak Prime üyeliğe özel fiyatlandırma sunar. Her iki platform da bot koruması agresif şekilde uygular — residential proxy zorunludur.

Seyahat: MakeMyTrip ve Goibibo

Hindistan seyahat pazarı, dünyanın en rekabetçi pazarlarından. MakeMyTrip ve Goibibo, uçak, otobüs ve otel fiyatlarını dinamik olarak değiştirir.

  • Uçuş fiyat takibi — Delhi-Mumbai gibi popüler iç hat rotalarında fiyat dalgalanması.
  • Otel fiyat karşılaştırması — Aynı otelin farklı platformlardaki fiyatı.
  • Kampanya takibi — Festivallere özel indirimler (Diwali, Holi dönemi).

İş İlanları: Naukri ve InstaHyre

Naukri.com, Hindistan'ın en büyük iş arama platformu. InstaHyre ise teknoloji sektörüne odaklı. Her iki platform da:

  • Şirketlerin aktif iş ilanlarını gösterir.
  • Maaş aralıklarını bölgesel olarak belirtir.
  • Bazı ilanları sadece Hintli IP'lerden görünür kılar.

Gayrimenkul: 99acres ve MagicBricks

Hindistan gayrimenkul pazarı, şehirlere göre dramatik farklılıklar gösterir. Mumbai fiyatları Delhi'den 2-3 kat farklı olabilir.

  • Metrekare fiyatları — Şehir ve semt bazlı karşılaştırma.
  • Kiralık/satılık oranları — Pazar trendlerini anlama.
  • Yeni proje lansmanları — Geliştirici aktivitesi takibi.

Yasal Çerçeve: IT Act 2000 ve DPDP Act 2023

Hindistan'da veri kazıma, belirli yasal sınırlar içinde mümkündür. Ancak bu sınırları anlamak kritik.

IT Act 2000 (Bilgi Teknolojileri Yasası)

IT Act 2000, bilgisayar sistemlerine izinsiz erişimi suç sayar (Section 43, Section 66). Ancak:

  • Public veri — Herkese açık sayfalardan erişilebilen veri, bu yasanın kapsamında "izinsiz erişim" sayılmaz.
  • robots.txt — Bir platform robots.txt ile kazımayı yasaklamışsa, buna uymak iyi uygulama olarak kabul edilir.
  • Rate limiting — Aşırı istek sunucuyu zorluyorsa, "system impairment" nedeniyle yasal sorun çıkabilir.

DPDP Act 2023 (Dijital Kişisel Veri Koruma Yasası)

2023'te kabul edilen DPDP Act, Hindistan'ın GDPR benzeri yasasıdır. Kapsamı:

  • Kişisel veri — İsim, e-posta, telefon gibi tanımlayıcı bilgiler.
  • Consent gereksinimi — Kişisel veri işleme için açık rıza zorunlu.
  • Public veri istisnası — Kamuya açık kaynaktan elde edilen kişisel olmayan veri, rıza gerektirmez.
Pratik kural: Ürün fiyatları, stok durumu, iş ilanları ve gayrimenkul listeleri — kişisel veri değildir. Bu verilerin toplanması, IT Act ve DPDP Act kapsamında genellikle kabul edilebilir. Ancak kullanıcı yorumları kişisel veri içerebilir; bu nedenle yorum metnini değil, yalnızca puan ve tarih bilgisini toplamak daha güvenlidir.

Indic Script Handling: Hindi, Tamil, Bengali

Hindistan 22 resmi dili olan bir ülke. E-ticaret ve iş platformlarında Hindi, Tamil, Bengali, Telugu ve diğer Indic dillerde içerik yaygın. Veri toplarken bu dillerin Unicode handling'i kritik.

Unicode Best Practices

  • UTF-8 encoding — Tüm pipeline'ınızda UTF-8 kullanın. Latin-1 veya ASCII fallback yapmayın.
  • Devanagari (Hindi) — U+0900-U+097F aralığı. Bağlayıcı harfler (conjunct consonants) doğru render edilmeli.
  • Tamil — U+0B80-U+0BFF aralığı. Virama işareti handling'i dikkat gerektirir.
  • Bengali — U+0980-U+09FF aralığı. Bağlayıcı formalar doğru sıralanmalı.

Python'da Indic script handling için:

import requests
from urllib.parse import quote

# ProxyHat ile Hindi içerikli Flipkart sayfasını kazıma
proxies = {
    "http": "http://user-country-IN-city-mumbai:pass@gate.proxyhat.com:8080",
    "https": "http://user-country-IN-city-mumbai:pass@gate.proxyhat.com:8080"
}

headers = {
    "Accept-Language": "hi-IN,en;q=0.9",
    "Accept-Charset": "utf-8"
}

url = "https://www.flipkart.com/search?q=" + quote("मोबाइल फोन")
response = requests.get(url, proxies=proxies, headers=headers)

# UTF-8 decode garantile
content = response.content.decode("utf-8")
print(content[:500])

Normalizasyon

Indic script'lerde Unicode normalizasyon kritik. Aynı kelime farklı Unicode formlarda yazılabilir:

import unicodedata

# NFC normalizasyon — Indic script'ler için önerilen
normalized = unicodedata.normalize("NFC", raw_text)

# Karşılaştırma için NFKC kullanın
compare_ready = unicodedata.normalize("NFKC", raw_text)

Ödeme Akışı Farklılıkları: UPI, COD, EMI

Hindistan e-ticaretinde ödeme yöntemleri, "checkout price" kavramını tamamen değiştirir. Bu, fiyat kazıyan ekipler için kritik bir farkındalık gerektirir.

UPI (Unified Payments Interface)

Hindistan'ın anlık ödeme sistemi. 2024'te aylık 10+ milyar işlem. UPI ile ödemede ek masraf yok — görüntülenen fiyat, ödenen fiyattır. Ancak bazı platformlar UPI indirimleri sunar.

COD (Cash on Delivery)

Hindistan e-ticaretinin %40-60'ı hâlâ COD. COD siparişlerinde genellikle ₹40-100 ek ücret uygulanır. Bu, kazınan fiyat ile gerçek ödeme arasındaki farkı oluşturur.

EMI (Equated Monthly Installment)

Özellikle elektronik ürünlerde yaygın. "No-cost EMI" aslında ürün fiyatına dahil edilmiş faiz demektir. Flipkart'ta bir akıllı telefon ₹15,000 olarak görünür, ancak 3 ay EMI ile toplamda ₹15,750 ödenir. Bu bilgiyi product page'den kazımak, gerçek fiyat karşılaştırması için zorunludur.

Ödeme Yöntemi Fiyat Etkisi Kazıma Zorluğu
UPI Ek masraf yok, bazen indirim Düşük — ürün sayfasında görünür
COD ₹40-100 ek ücret Orta — checkout sayfasında belirir
EMI Toplamda %3-15 fazla ödeme Yüksek — EMI tablosu ayrı ayrı kazınmalı
Kredi Kartı Banka kampanyaları değişken Orta — banka bazlı indirimler dinamik

Şehir Bazlı Geo-Targeting

Hindistan'ın büyük şehirleri arasında fiyat, stok ve kampanya farklılıkları önemli. ProxyHat ile şehir bazlı targeting mümkün.

Mumbai

Hindistan'ın finans başkenti. E-ticaret penetrasyonu en yüksek şehir. Premium ürün kategorilerinde en geniş seçenek. Gayrimenkul fiyatları ülkenin en yüksekleri.

# Mumbai IP'si ile Flipkart erişimi
curl -x "http://user-country-IN-city-mumbai:pass@gate.proxyhat.com:8080" \
     -H "Accept-Language: en-IN" \
     "https://www.flipkart.com/mobiles/pr?sid=tyy%2C4io"

Delhi (NCR)

Ulusal başkent bölgesi. En büyük tüketici pazarlarından. Flipkart ve Amazon India'nın en agresif kampanyaları Delhi NCR'de. Kış sezonu ürünlerinde belirgin farklılık.

Bangalore

Teknoloji merkezi. Elektronik ve IT ürünlerinde en rekabetçi fiyatlar. Naukri ve InstaHyre'de en fazla teknoloji iş ilanı.

Chennai

Güney Hindistan'ın en büyük pazarı. Tamil dilli içerik yoğun. Otomotiv ve tekstil kategorilerinde güçlü yerel pazar.

# Chennai IP'si ile MakeMyTrip uçuş araması
curl -x "http://user-country-IN-city-chennai:pass@gate.proxyhat.com:8080" \
     -H "Accept-Language: ta-IN,en;q=0.9" \
     "https://www.makemytrip.com/flights/"

Şehir Karşılaştırma Tablosu

Şehir Proxy Hedef Öne Çıkan Kategori Dil Önceliği
Mumbai city-mumbai Premium e-ticaret, gayrimenkul Marathi, Hindi, English
Delhi NCR city-delhi Kampanyalı e-ticaret, iş ilanları Hindi, English
Bangalore city-bangalore Teknoloji ürünleri, IT iş ilanları Kannada, English
Chennai city-chennai Otomotiv, seyahat Tamil, English

Proxy Türleri Karşılaştırması: Hindistan İçin Hangisi?

Proxy Türü Hindistan Performansı Anti-Bot Geçiş Kullanım Önerisi
Residential Orta latency (200-400ms) Yüksek — gerçek ISP IP'leri Flipkart, Amazon India, MakeMyTrip
Mobile Daha yüksek latency En yüksek — mobil ISP IP'leri Mobil uygulama API'leri, sosyal medya
Datacenter Düşük latency (50-100ms) Düşük — tespit edilme riski Düşük korumalı siteler, SERP tracking

Öneri: Flipkart ve Amazon India için residential proxy zorunludur. SERP tracking için datacenter proxy yeterli olabilir. Mobil uygulama API'lerine erişim için mobile proxy gerekebilir. ProxyHat'ın lokasyon sayfasından Hindistan proxy seçeneklerini inceleyebilirsiniz.

Uygulama: ProxyHat ile Hindistan Proxy Kurulumu

Python ile Flipkart Ürün Kazıma

import requests
from bs4 import BeautifulSoup

# ProxyHat residential proxy - Mumbai lokasyonu
proxies = {
    "http": "http://user-country-IN-city-mumbai:pass@gate.proxyhat.com:8080",
    "https": "http://user-country-IN-city-mumbai:pass@gate.proxyhat.com:8080"
}

headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36",
    "Accept-Language": "en-IN,hi;q=0.9",
    "Accept": "text/html,application/xhtml+xml"
}

def scrape_flipkart_price(product_url):
    response = requests.get(
        product_url,
        proxies=proxies,
        headers=headers,
        timeout=30
    )
    soup = BeautifulSoup(response.content.decode("utf-8"), "html.parser")
    
    # Fiyat elementini bul
    price_el = soup.select_one(".Nx9bqj")  # Flipkart fiyat sınıfı
    title_el = soup.select_one(".B_NuCI")    # Ürün başlığı
    
    return {
        "title": title_el.get_text(strip=True) if title_el else None,
        "price": price_el.get_text(strip=True) if price_el else None,
        "city": "Mumbai",
        "currency": "INR"
    }

result = scrape_flipkart_price(
    "https://www.flipkart.com/samsung-galaxy-s24/p/itm3..."
)
print(result)

Node.js ile Şehir Bazlı Fiyat Karşılaştırma

const axios = require("axios");
const cities = ["mumbai", "delhi", "bangalore", "chennai"];

async function comparePrices(productPath) {
  const results = {};
  
  for (const city of cities) {
    const proxy = `http://user-country-IN-city-${city}:pass@gate.proxyhat.com:8080`;
    
    try {
      const response = await axios.get(
        `https://www.flipkart.com${productPath}`,
        {
          proxy: {
            host: "gate.proxyhat.com",
            port: 8080,
            auth: { username: `user-country-IN-city-${city}`, password: "pass" }
          },
          headers: { "Accept-Language": "en-IN,hi;q=0.9" },
          timeout: 30000
        }
      );
      
      results[city] = response.data.length;  // Basit kontrol
      console.log(`${city}: response received`);
    } catch (err) {
      results[city] = null;
      console.error(`${city}: ${err.message}`);
    }
  }
  
  return results;
}

comparePrices("/mobiles/pr?sid=tyy,4io");

Anti-Bot ve CAPTCHA Stratejileri

Hindistan platformları agresif anti-bot önlemleri kullanır. Flipkart, Arkose Labs ve custom CAPTCHA kullanır. Başarı oranını artırmak için:

  • Residential proxy zorunlu — Datacenter IP'ler Flipkart'ta hızla bloklanır.
  • Sticky session kullanın — Login gerektiren sayfalar için aynı IP'yi 10-30 dakika boyunca koruyun.
  • Rate limiting — Saniyede 1-2 istekten fazlası CAPTCHA tetikler.
  • Header rotasyonu — User-Agent, Accept-Language header'larını rotasyonla değiştirin.
  • Accept-Language — Hindi (hi-IN) veya Tamil (ta-IN) eklemek gerçek kullanıcıyı taklit eder.

Key Takeaways

  • Indian proxies olmadan Hindistan verisi toplayamazsınız — Flipkart, Amazon India, MakeMyTrip hepsi bölgesel içerik gösterir ve yurtdışı trafiği kısıtlar.
  • Şehir bazlı targeting kritik — Mumbai, Delhi, Bangalore, Chennai arasında fiyat ve stuk farklılıkları önemli.
  • Ödeme yöntemleri fiyatı değiştirir — COD ücreti, EMI farkı ve banka indirimleri "checkout price" kavramını karmaşıklaştırır.
  • Indic script handling zorunlu — UTF-8 pipeline ve NFC normalizasyon olmadan Hindi, Tamil, Bengali içerik bozulur.
  • Yasal çerçeve uygun — IT Act 2000 ve DPDP Act 2023, public veri kazımaya izin verir; kişisel veriden kaçının.
  • Residential proxy en güvenli seçim — Anti-bot sistemlerini geçmek için gerçek ISP IP'leri gereklidir.

ProxyHat ile Hindistan residential proxy'lerini hemen kullanmaya başlayın. Fiyatlandırma sayfamızdan planınızı seçin ve bu rehberi referans olarak uygulamanıza entegre edin. Sorularınız için destek ekibimize ulaşabilirsiniz.

Başlamaya hazır mısınız?

148+ ülkede 50M+ konut IP'sine AI destekli filtreleme ile erişin.

Fiyatlandırmayı GörüntüleKonut Proxy'leri
← Bloga Dön