Scrapoxy proxy toplayıcısına genel bakış

Yorumlar: 0

Scrapoxy, web kazıma sürecinin verimliliğini ve güvenliğini artıran bir proxy yönetim aracıdır. Kendisi bir kazıyıcı veya proxy sağlayıcı değildir, ancak proxy sunucularını yönetmede ve veri toplama çabalarını optimize etmek için istekleri bunlar arasında dağıtmada çok önemli bir rol oynar.

image19.png

Scrapoxy kullanarak web kazıma prensibi üç temel adım içerir:

  1. Veri toplama sürecinde kullanılacak proxy sunucularının parametrelerini ayarlayarak toplayıcının yapılandırılması;
  2. Yapılandırma dosyalarını veya bağlantı parametrelerini kullanarak Scrapoxy'yi kazıyıcıya bağlama;
  3. Scrapoxy'nin istekleri proxy sunucuları arasında otomatik olarak dağıtacağı kazıma işlemini başlatmak.

Scrapoxy ile web kazıma yeteneklerinizi geliştirmek için çeşitli çerçeveleri ve kütüphaneleri entegre edebilirsiniz:

  • BeautifulSoup, HTML ve XML belgelerinden veri ayıklamak için tasarlanmış bir Python kütüphanesidir;
  • Scrapy, verimliliği ve çok yönlülüğü ile bilinen Python'da sağlam ve esnek bir web kazıma çerçevesidir;
  • Puppeteer, Chrome veya Chromium'u kontrol etmek için bir API sunan bir Node.js kütüphanesidir, bu da onu web kazıma ve otomasyon görevleri için popüler bir seçim haline getirir.

Daha sonra, Scrapoxy'nin nasıl çalıştığını daha derinlemesine inceleyeceğiz ve sunduğu özellikleri keşfedeceğiz.

Scrapoxy'nin Özellikleri

Scrapoxy, daha verimli ve güvenli veri toplama görevleri sağlayarak kazıma yazılımının yeteneklerini geliştirir. Bir proxy toplayıcısı olarak, proxy sunucularını yönetmek için birkaç önemli özellik ile karakterize edilen güçlü bir araçtır:

Tüm proxy türleri için destek

Scrapoxy hem dinamik hem de statik IP adreslerini destekleyerek bir araç olarak esnekliğini göstermektedir. Aşağıdakiler de dahil olmak üzere çeşitli proxy türlerinin yapılandırılmasına izin verir:

  • Datacenter IPv4/IPv6 proxy'leri;
  • ISP proxy'leri;
  • Konut vekilleri;
  • Mobil proxyler.

Bu çok yönlülük, Scrapoxy'yi çok çeşitli web kazıma ve trafik yönetimi görevleri için mükemmel bir seçim haline getirir. Ayrıca, çeşitli HTTP/HTTPS ve SOCKS protokollerini destekleyerek Scrapoxy'yi projenizin özel ihtiyaçlarını etkin bir şekilde karşılayacak şekilde özelleştirmenize olanak tanır.

Otomatik proxy rotasyonu

Scrapoxy otomatik proxy rotasyonunu destekler, anonimliği artırır ve web kazıma faaliyetleri sırasında engelleme riskini azaltır. Proxy rotasyonu, kullanımdaki proxy'leri düzenli olarak değiştirmeyi ve hedef web sitelerinden tespit ve kısıtlamaları önlemek için istekleri çeşitli IP adreslerine dağıtmayı içerir.

Bu özellik sadece trafiğin izlenmesini zorlaştırmak ve engellenme olasılığını azaltmakla kalmaz, aynı zamanda yükü farklı proxy'ler arasında eşit olarak dağıtır. Scrapoxy'de otomatik rotasyonun sorunsuz bir şekilde uygulanması, özellikle büyük bir IP adresi havuzunu yönetirken değerli olan kullanıcı dostu bir deneyim sağlar.

Trafik izleme ve yönetimi

Scrapoxy, web kazıma görevleri sırasında gelen ve giden trafiğin kapsamlı bir şekilde izlenmesini sağlayarak kullanıcının oturumuna ayrıntılı bir genel bakış sunar. Bu özellik, birkaç önemli metriğin yakından izlenmesine olanak tanır:

  • Oturum sırasında yapılan talep sayısı;
  • Kullanılan aktif proxy sayısı;
  • Her proxy tarafından işlenen ortalama talep sayısı;
  • Geçerli veri toplama hızı;
  • Proxy sunucuları üzerinden alınan ve gönderilen toplam veri miktarı.

Tüm bu veriler sürekli olarak güncellenir ve Scrapoxy'nin metrikler bölümünde kaydedilir. Bu özellik, kullanıcıların belirli proxy sunucularını kullanarak kazıma projelerinin kalitesini ve verimliliğini değerlendirmelerini ve kapsamlı analiz ve inceleme için bilgileri uygun bir şekilde düzenlemelerini sağlar.

Engellenen proxy'lerin yönetimi

Scrapoxy, engellenen proxy sunucularını izlemek ve otomatik olarak tespit etmek için bir özellik içerir. Bir proxy kullanılamaz hale gelirse veya arızalanırsa, Scrapoxy onu engellenmiş olarak işaretleyecektir. Bu, proxy'nin kazıma için tekrar kullanılmasını önler ve kesintisiz veri toplanmasını sağlar.

Engellenen proxy'leri yönetmek için, kullanıcılar hem Scrapoxy web arayüzü hem de API aracılığıyla seçeneklere sahiptir. Web arayüzünde, kullanıcılar proxy sunucularının bir listesini ve mevcut durumlarını görüntüleyebilir ve gerekirse bir proxy'yi manuel olarak engellenmiş olarak işaretleyebilir. Alternatif olarak, Scrapoxy API bu sürecin otomasyonuna olanak tanıyarak proxy sunucularının daha verimli bir şekilde yönetilmesini sağlar.

Scrapoxy uygulama arayüzü

Scrapoxy, ana işlevlerini yönetmek için kullanıcı dostu bir görsel web arayüzü sağlar. Bu arayüze erişmek için öncelikle Docker veya Node.js kullanarak Scrapoxy'yi yüklemeniz gerekir.

image9.png

Projeler

Bu sekme, oluşturulmuş olan tüm projelerin bir listesini görüntüler. Henüz hiçbir proje mevcut değilse, ayarlar sekmesine giderek doğrudan bu bölümden bir proje oluşturma seçeneğiniz vardır. Her proje girişi temel bilgileri içerir ve daha ayrıntılı görüntüleme ve yapılandırma değişikliklerine izin verir.

image5.png

Bu listedeki bir proje, her biri farklı bir operasyonel durumu gösteren birkaç durum görüntüleyebilir:

  • KAPALI: proje durdurulur ve proje için kullanılan proxy'ler silinir.
  • CALM: proje "uyku" durumundadır ve yalnızca proje ayarlarında belirtilen minimum proxy sayısını korur.
  • HOT: proje aktif, proxy'ler şu anda çalışıyor ve operasyonel.

    image11.png

Kimlik Bilgileri

Proje kurulduktan sonra, satıcı, unvan ve token gibi ayrıntıları içeren bir hesap oluşturulur. Hesaplar, bulut sağlayıcılarına bağlanırken kimlik doğrulama ve yetkilendirme için gerekli bilgileri içerir. Bu ayrıntılar girildikten sonra, program verilerin geçerliliğini doğrular. Doğrulama başarılı olduktan sonra ayarlar kaydedilir ve kimlik bilgileri bu sekmede görüntülenir. Burada proje adını, bulut sağlayıcısını ve daha ayrıntılı hesap ayarlarına erişmenizi sağlayan bir düğmeyi görebilirsiniz.

NEW1.png

Bağlayıcılar

Bu sekme, Scrapoxy'nin proxy sunucuları oluşturmak ve yönetmek için çeşitli bulut sağlayıcılarıyla etkileşime girmesini sağlayan modüller olan tüm bağlayıcıların bir listesini görüntüler.

Bir bağlayıcı kurarken belirtmeniz gerekir:

  • Önceki bölümde belirtildiği gibi kimlik bilgileri;
  • Konnektör için benzersiz bir ad;
  • Kullanılacak proxy sayısı;
  • Proxy zaman aşımı, etkin olmayan bir proxy'nin çalışmıyor olarak kabul edildiği süredir.

Eklenen tüm konektörler "Konektörler" bölümünde gösterilir. Merkezi pencerede, her bir konektör hakkında aşağıdaki bilgiler görüntülenir:

  • Durum;
  • Adı ve türü;
  • Proxy sayısı;
  • Proxy sayısını ayarlamak için kontroller;
  • Varsayılan konektör olarak ayarlama seçeneği;
  • Ek ayarlar.

    NEW2.png

Konektörler üç durumdan birine sahip olabilir: "AÇIK", "KAPALI" ve "HATA". Verileri güncellemek ve geçerliliğini doğrulamak için konektörler gerektiği gibi düzenlenebilir.

Proksiler

Bu sekme son derece çok işlevlidir ve proxy sunucularının bir listesini ad, IP adresi ve durum gibi temel bilgileriyle birlikte gösterir. Ek olarak, bu sayfa proxy sunucularının yönetimine izin vererek gerektiğinde bunları silmenize veya devre dışı bırakmanıza olanak tanır.

image18.png

Durum sütununda, simgeler her proxy sunucusunun geçerli durumunu gösterir:

  • Başlar;
  • Başlatıldı;
  • Durdurur;
  • Durduruldu;
  • Çalışmıyor.

Bunun bitişiğinde, her proxy'nin bağlantı durumunu temsil eden, çevrimiçi, çevrimdışı veya bağlantı hatası olup olmadığını gösteren bir simge vardır.

Kapsam

Scrapoxy'ye bir proxy sunucu listesi eklediğinizde ve bunları en az bir kez kullandığınızda, program otomatik olarak coğrafi konumlarını analiz eder ve bu bölümde erişilebilen bir kapsama haritası oluşturur. Bu özellik, aşağıdakileri içeren istatistiksel bir özetle birlikte görsel bir temsil sağlar:

  • Her birinde bulunan vekil sayısı ile birlikte şehirlerin isimleri;
  • Ülkeler ve her birinde bulunan vekil sayısı;
  • Her proxy'nin ait olduğu ağların adları ve ilgili sayıları.

Kaynağın doğrulanması ve dünya haritası üzerinde kapsamlı bir kapsama alanı sağlanması, web kazıma sürecinin optimize edilmesi için çok önemlidir.

image1.png

Metrikler

Bu sekme, projenin izlenmesi için bir dizi gösterge sağlayan kapsamlı bir gösterge tablosu sunar. Merkezi panel, projelerle ilgili temel istatistikleri gösteren farklı bölümlere ayrılmıştır. Üst panelde, kullanıcılar Scrapoxy'nin analitik verileri görüntülemesi gereken zaman dilimini seçebilirler. Aşağıda, projelerde kullanılan proxy sunucuları ile ilgili bilgiler detaylandırılmıştır:

  • Alınan ve Gönderilen: tüm proxy'ler tarafından alınan ve gönderilen toplam bayt sayısını görüntüler.
  • İstekler: yapılan isteklerin sayısını gösterir.
  • Duraklar: silme isteklerinin sayısını gösterir.
  • Alınan ve Gönderilen Oranlar: veri alma ve gönderme hızını detaylandırır.
  • Geçerli ve Geçersiz İstekler: geçerli ve geçersiz isteklerin sayısını sayar.
  • Oluşturulan ve Kaldırılan Proxy'ler: oluşturulan ve kaldırılan proxy sayısını listeler.

    image14.png

Havuzdan kaldırılan proxy sunucularını analiz etmek için ek bilgiler sağlanır:

  • Her proxy aracılığıyla yapılan ortalama talep sayısı;
  • Her bir proxy'nin ortalama çalışma süresi.

    image4.png

Sekmenin devamında, gönderilen ve alınan veri hacmini, yapılan talep sayısını ve seçilen dönem boyunca alınan durdurma emirlerini gösteren grafikler yer alır.

image16.png

Görevler

Bu sekme Scrapoxy kullanılarak başlatılan tüm görevleri görüntüler. Her görev için aşağıdaki bilgiler sunulur:

  • Görev adı;
  • Başlangıç tarihi ve saati;
  • Tamamlama tarihi ve saati;
  • Görev ilerlemesi: kaç adım tamamlandı;
  • Detay görünüm düğmesi.

    image17.png

Bir görevi açtığınızda, görevin açıklaması ve yeniden deneme denemeleri için zamanlama da dahil olmak üzere daha kapsamlı ayrıntılara erişebilirsiniz. Ayrıca, gerekirse görevi durdurmak için bir seçenek de mevcuttur.

image3.png

Kullanıcılar

Bu sekmeye eriştiğinizde, projelere erişimi olan tüm kullanıcıların bir listesi görüntülenir. Her kullanıcının adını ve e-posta adresini görebilirsiniz. Buradan, bir kullanıcıyı listeden çıkarma veya yeni kullanıcılar ekleme seçeneğiniz vardır. Kullanıcıların kendilerini bir projeden çıkaramayacaklarını unutmamak önemlidir; bu eylem uygun izinlere sahip başka bir kullanıcı tarafından gerçekleştirilmelidir. Ayrıca, yalnızca daha önce Scrapoxy'de oturum açmış olan kullanıcıları ekleyebilirsiniz.

image15.png

Ayarlar

Scrapoxy'ye ilk bağlandığınızda, proje ayarlarını yapılandırmanıza olanak tanıyan bu sekme açılır. Bu pencere aşağıdaki gibi bilgileri içerir:

  • Projenin adı;
  • Giriş ve şifre dahil olmak üzere taleplerde proxy kimlik doğrulaması için veriler;
  • Rotasyon ve ağdaki minimum proxy sayısı gibi proxy ayarları;
  • Proxy değiştirirken User-Agent'ı değiştirme, proje durumlarını değiştirme, HTTPS isteklerini durdurma, yapışkan çerezler ve diğerleri gibi ek işlevler.

Tüm ayarları yaptıktan ve kaydettikten sonra proje için bir hesap oluşturabilirsiniz.

image20.png

Scrapoxy'ye bir proxy sunucusu nasıl entegre edilir

Proxy-Seller kullanarak Scrapoxy'de bir proxy kurmak için aşağıdaki adımları izleyin:

  1. Proxy-Seller sitesindeki hesabınıza giriş yapın ve "API" bölümüne gidin.

    image7.png

  2. API belirtecini kopyalayın ve ileride kullanmak üzere kaydedin.

    image10.png

  3. Scrapoxy web arayüzünü açın ve "Pazar Yeri" ne gidin. Proxy-Seller'ı isme veya türe göre bulmak için manuel arama işlevini kullanın.

    image2.png

  4. Kullanmak istediğiniz proxy türünü (statik veya dinamik) seçin ve yeni bir hesap oluşturmak için "Oluştur" düğmesine tıklayın.

    image12.png

  5. Daha önce hesabınızdan kaydettiğiniz adı ve belirteci girin. "Oluştur" butonuna tıklayarak onaylayın.

    image13.png

  6. Sağlayıcı olarak Proxy-Seller'ı seçerek yeni bir bağlayıcı oluşturmaya devam edin. Oluşturulduktan sonra, bağlayıcı ana listede görünecek ve oradan etkinleştirebilirsiniz.

    image8.png

Kurulum artık tamamlandı ve Scrapoxy proxy rotator'daki veri ayrıştırma görevleri bağlı proxy'ler kullanılarak gerçekleştirilecek.

Sonuç olarak Scrapoxy, web kazıma görevleri için proxy sunucularını etkili bir şekilde ölçeklendiren ve yöneten proxy yönetimi için değerli bir araç olarak hizmet vermektedir. Proxy yöneticisi, isteklerin anonimliğini artırır ve veri toplamayı verimli bir şekilde otomatikleştirir. Hem bireysel hem de ekip kullanımı için uygun olan Scrapoxy, çok çeşitli proxy sağlayıcılarıyla uyumludur ve ücretsiz olarak kullanılabilir.

Yorumlar:

0 yorumlar