Introdução

O sistema proxy é um componente do navegador de scraping que encaminha conexões através de um servidor proxy. É usado principalmente para evitar bloqueio de IP, acessar conteúdo geograficamente restrito e melhorar o anonimato. O Scraping Browser fornece um sistema proxy configurável que permite controle preciso sobre o roteamento de tráfego automatizado, incluindo anonimato, direcionamento de geolocalização e maior confiabilidade, facilitando a integração de proxies em seu fluxo de trabalho.

Funcionalidades principais

A capacidade principal do sistema proxy reside em ocultar o endereço IP real por meio de um servidor intermediário e rotacionar automaticamente ou sob demanda diferentes endereços de um pool de IPs. Ele também permite selecionar servidores proxy em locais geográficos específicos, simulando o acesso do usuário de todo o mundo.

Cenários de aplicação

Principalmente aplicável a cenários que exigem scraping de dados em larga escala e contornam restrições ou bloqueios de IP do site de destino. Também é uma ferramenta essencial para acessar conteúdo geograficamente restrito e manter o anonimato online em tarefas como pesquisa de mercado.

Classificação

O Scrapeless oferece duas opções de configuração de proxy:

  • Usando proxies integrados: Roteie facilmente o tráfego por meio de nossos proxies residenciais gerenciados.
  • Usando proxies personalizados: Use proxies SOCKS5/HTTPS personalizados para controle mais flexível sobre o roteamento de rede.

Guia de operação

Usando proxies integrados

Usar os proxies integrados do Scraping Browser roteia o tráfego por meio de seus proxies residenciais gerenciados.

const puppeteer = require('puppeteer-core');
const connectionURL = 'wss://browser.scrapeless.com/browser?token=APIKey&session_ttl=180&proxy_country=ANY';
 
(async () => {
    const browser = await puppeteer.connect({browserWSEndpoint: connectionURL});
    const page = await browser.newPage();
    await page.goto('https://www.scrapeless.com');
    console.log(await page.title());
    await browser.close();
})();

Localização geográfica do proxy por país

Nossos proxies integrados suportam 195 países. Consulte a documentação detalhada do proxy Scrapeless Documentação do proxy Scrapeless.

Proxies personalizados

Se você quiser usar seu próprio serviço/provedor de proxy, pode especificar os seguintes parâmetros ao criar uma sessão. Se você usar seu próprio provedor de proxy, não será cobrado pelo uso do proxy.

const puppeteer = require('puppeteer-core');
 
(async () => {
  try {
    const proxyUrl = 'http://gw-us.scrapeless.com:8789';
    const username = 'username';
    const password = 'password';
    const browser = await puppeteer.launch({ args: [`--proxy-server=${proxyUrl}`], headless: false });
    const page = await browser.newPage();
    await page.authenticate({ username, password });
    await page.goto('API_URL');
    await browser.close();
  } catch (e) {
    console.log(e)
  }
})();

Você também pode adquirir serviços de proxy Scrapeless separadamente.

Ambiente de testes de Proxy: https://app.scrapeless.com/scrapelessteam/products/proxy/channel-list

Documentação de Proxy: https://docs.scrapeless.com/en/proxies/features/proxy/