Proxies
Introducción
El sistema de proxy es un componente del navegador de scraping que reenvía conexiones a través de un servidor proxy. Se utiliza principalmente para prevenir el bloqueo de IP, acceder a contenido restringido geográficamente y mejorar el anonimato. Scraping Browser proporciona un sistema de proxy configurable que permite un control preciso sobre el enrutamiento del tráfico automatizado, incluyendo anonimato, segmentación geográfica y mayor confiabilidad, facilitando la integración de proxies en tu flujo de trabajo.
Capacidades Principales
La capacidad principal del sistema de proxy radica en ocultar la dirección IP real a través de un servidor intermediario y rotar automáticamente o a demanda a través de diferentes direcciones en un grupo de IP. También permite seleccionar servidores proxy en ubicaciones geográficas específicas, simulando el acceso de usuarios desde diversas partes del mundo.
Escenarios de Aplicación
Principalmente aplicable a escenarios que requieren scraping de datos a gran escala y eludir restricciones o bloqueos de IP del sitio web objetivo. También es una herramienta clave para acceder a contenido restringido geográficamente y mantener el anonimato en línea en tareas como la investigación de mercado.
Clasificación
Con Scrapeless, tienes dos opciones de configuración de proxy:
- Usar proxies integrados: Rote fácilmente el tráfico a través de nuestros proxies residenciales gestionados.
- Usar proxies personalizados: Utiliza proxies HTTP/HTTPS/SOCKS5 personalizados para un control más flexible sobre el enrutamiento de la red.
Guía Operativa
Usando Proxies Integrados
El uso de los proxies integrados de Scraping Browser enruta el tráfico a través de sus proxies residenciales gestionados.
const { ScrapelessClient } = require('@scrapeless-ai/sdk');
const puppeteer = require('puppeteer-core');
const client = new ScrapelessClient({ apiKey: 'API Key' });
const { browserWSEndpoint } = client.browser.create({
sessionName: 'sdk_test',
sessionTTL: 180,
proxyCountry: 'AU',
proxyState: 'NSW', // Opcional: código de estado
proxyCity: 'sydney', // Opcional: nombre de la ciudad
sessionRecording: true,
});
(async () => {
const browser = await puppeteer.connect({ browserWSEndpoint });
const page = await browser.newPage();
await page.goto('https://www.scrapeless.com');
console.log(await page.title());
await browser.close();
})();Selección de Proxy Geográfico
Nuestra red de proxies integrada abarca 195 países y territorios en todo el mundo, lo que permite una segmentación geográfica precisa para tus operaciones de scraping. Cada ubicación de proxy está optimizada para rendimiento y confiabilidad, permitiéndote simular el acceso auténtico de usuarios desde regiones específicas.
Para una selección completa de países y regiones, incluyendo segmentación a nivel de estado y ciudad, consulta nuestra documentación detallada sobre proxies.
Proxies Personalizados
Si deseas utilizar tu propio servicio/proveedor de proxy, puedes especificar los siguientes parámetros al crear una sesión. Si utilizas tu propio proveedor de proxy, no se te cobrará por el uso del proxy.
- 💡La funcionalidad de proxy personalizado está actualmente disponible solo para suscriptores de Enterprise y Enterprise Plus Actualiza aquí
- 💡Los usuarios personalizados de nivel Enterprise pueden contactarnos para usar proxies personalizados.
const { ScrapelessClient } = require('@scrapeless-ai/sdk');
const puppeteer =require('puppeteer-core');
const client = new ScrapelessClient({ apiKey: 'API Key' });
const proxyUrl = client.proxies.proxy({
country: 'US',
sessionDuration: 30,
sessionId: 'test-session-123',
gateway: 'gate.smartproxy.com:7000'
});
(async () => {
const browser = await puppeteer.launch({ args: [`--proxy-server=${proxyUrl}`], headless: false });
const page = await browser.newPage();
await page.goto('API_URL');
await browser.close();
})();También puedes comprar los servicios de proxy de Scrapeless por separado.
Proxy Playground: https://app.scrapeless.com/scrapelessteam/products/proxy/channel-list
Documentación de Proxy: https://docs.scrapeless.com/en/proxies/features/proxy/