Proxies
Introdução
O sistema proxy é um componente do navegador de scraping que encaminha conexões por meio de um servidor proxy. Ele é usado principalmente para evitar o bloqueio de IP, acessar conteúdo com restrições geográficas e aumentar o anonimato. O Scraping Browser fornece um sistema proxy configurável que permite um controle preciso sobre o roteamento de tráfego automatizado, incluindo anonimato, segmentação de geolocalização e maior confiabilidade, facilitando a integração de proxies em seu fluxo de trabalho.
Funcionalidades principais
A capacidade principal do sistema proxy reside em ocultar o endereço IP real por meio de um servidor intermediário e rotacionar automática ou sob demanda por meio de diferentes endereços em um pool de IP. Ele também permite selecionar servidores proxy em locais geográficos específicos, simulando o acesso do usuário de várias partes do mundo.
Cenários de aplicação
Principalmente aplicável a cenários que exigem raspagem de dados em larga escala e contornam restrições ou bloqueios de IP do site de destino. Também é uma ferramenta fundamental para acessar conteúdo com restrições geográficas e manter o anonimato online em tarefas como pesquisa de mercado.
Classificação
Com o Scrapeless, você tem duas opções de configuração de proxy:
- Usando proxies integrados: Roteie facilmente o tráfego por meio de nossos proxies residenciais gerenciados.
- Usando proxies personalizados: Use proxies HTTP/HTTPS/SOCKS5 personalizados para um controle mais flexível sobre o roteamento de rede.
Orientação operacional
Usando proxies integrados
Usar os proxies integrados do Scraping Browser roteia o tráfego por meio de seus proxies residenciais gerenciados.
const { ScrapelessClient } = require('@scrapeless-ai/sdk');
const puppeteer =require('puppeteer-core');
const client = new ScrapelessClient({ apiKey: 'API Key' });
const { browserWSEndpoint } = client.browser.create({
session_name: 'sdk_test',
session_ttl: 180,
proxy_country: 'ANY',
session_recording: true,
});
(async () => {
const browser = await puppeteer.connect({browserWSEndpoint});
const page = await browser.newPage();
await page.goto('https://www.scrapeless.com');
console.log(await page.title());
await browser.close();
})();
Geolocalização de Proxy por País
Nossos proxies integrados suportam 195 países. Consulte a documentação detalhada do proxy Scrapeless Documentação do proxy Scrapeless.
Proxies personalizados
Se você quiser usar seu próprio serviço/provedor de proxy, poderá especificar os seguintes parâmetros ao criar uma sessão. Se você usar seu próprio provedor de proxy, não será cobrado pelo uso do proxy.
- 💡A funcionalidade de proxy personalizado está atualmente disponível apenas para assinantes Enterprise e Enterprise Plus Faça upgrade aqui
- 💡Usuários personalizados de nível Enterprise podem entrar em contato conosco para usar proxies personalizados.
const { ScrapelessClient } = require('@scrapeless-ai/sdk');
const puppeteer =require('puppeteer-core');
const client = new ScrapelessClient({ apiKey: 'API Key' });
const proxyUrl = client.proxies.proxy({
country: 'US',
sessionDuration: 30,
sessionId: 'test-session-123',
gateway: 'gate.smartproxy.com:7000'
});
(async () => {
const browser = await puppeteer.launch({ args: [`--proxy-server=${proxyUrl}`], headless: false });
const page = await browser.newPage();
await page.goto('API_URL');
await browser.close();
})();
Você também pode adquirir serviços de proxy Scrapeless separadamente.
Ambiente de teste de proxy: https://app.scrapeless.com/scrapelessteam/products/proxy/channel-list
Documentação de proxy: https://docs.scrapeless.com/en/proxies/features/proxy/