Integración
Puppeteer
Scraping Browser ofrece una plataforma serverless de alto rendimiento diseñada para simplificar el proceso de extracción de datos de sitios web dinámicos. Con una integración perfecta con Puppeteer, los desarrolladores pueden ejecutar, gestionar y monitorizar navegadores headless sin recursos de servidor dedicados, logrando una automatización web eficiente y una recolección de datos eficaz.
Instalar las bibliotecas necesarias
Primero, instale puppeteer-core
, que es la versión ligera de Puppeteer, diseñada para conectarse a instancias de navegador existentes:
npm install puppeteer-core
Escribir código para conectarse a Scraping Browser
En su código Puppeteer, conéctese a Scraping Browser usando el siguiente método:
const puppeteer = require('puppeteer-core');
const connectionURL = 'wss://browser.scrapeless.com/browser?token=APIKey&session_ttl=180&proxy_country=ANY';
(async () => {
const browser = await puppeteer.connect({browserWSEndpoint: connectionURL});
const page = await browser.newPage();
await page.goto('https://www.scrapeless.com');
console.log(await page.title());
await browser.close();
})();
De esta manera, puede aprovechar la infraestructura de Scraping Browser, incluyendo la escalabilidad, la rotación de IP y el acceso global.
Ejemplos prácticos
Aquí hay algunas operaciones comunes de Puppeteer después de integrarse con Scraping Browser:
- Navegación y extracción de contenido de la página
const page = await browser.newPage();
await page.goto('https://www.example.com');
console.log(await page.title());
const html = await page.content();
console.log(html);
await browser.close();
- Capturar capturas de pantalla
const page = await browser.newPage();
await page.goto('https://www.example.com');
await page.screenshot({ path: 'example.png' });
console.log('Screenshot saved as example.png');
await browser.close();
- Ejecutar scripts personalizados
const page = await browser.newPage();
await page.goto('https://www.example.com');
const result = await page.evaluate(() => document.title);
console.log('Page title:', result);
await browser.close();
Playwright
Scraping Browser ofrece una plataforma serverless de alto rendimiento diseñada para simplificar el proceso de extracción de datos de sitios web dinámicos. Con una integración perfecta con Playwright, los desarrolladores pueden ejecutar, gestionar y monitorizar navegadores headless sin recursos de servidor dedicados, logrando una automatización web eficiente y una recolección de datos eficaz.
Instalar las bibliotecas necesarias
Primero, instale playwright-core
, que es la versión ligera de Playwright, usada para conectarse a instancias de navegador existentes:
npm install playwright-core
Escribir código para conectarse a Scraping Browser
En el código Playwright, conéctese a Scraping Browser usando el siguiente método:
const { chromium } = require('playwright-core');
const connectionURL = 'wss://browser.scrapeless.com/browser?token=APIKey&session_ttl=180&proxy_country=ANY';
(async () => {
const browser = await chromium.connectOverCDP(connectionURL);
const page = await browser.newPage();
await page.goto('https://www.scrapeless.com');
console.log(await page.title());
await browser.close();
})();
Esto le permite aprovechar la infraestructura de Scraping Browser, incluyendo la escalabilidad, la rotación de IP y el acceso global.
Ejemplos prácticos
Aquí hay algunas operaciones comunes de Playwright después de integrarse con Scraping Browser:
- Navegación y extracción de contenido de la página
const page = await browser.newPage();
await page.goto('https://www.example.com');
console.log(await page.title());
const html = await page.content();
console.log(html);
await browser.close();
- Capturar capturas de pantalla
const page = await browser.newPage();
await page.goto('https://www.example.com');
await page.screenshot({ path: 'example.png' });
console.log('Screenshot saved as example.png');
await browser.close();
- Ejecutar scripts personalizados
const page = await browser.newPage();
await page.goto('https://www.example.com');
const result = await page.evaluate(() => document.title);
console.log('Page title:', result);
await browser.close();
Estos ejemplos de código demuestran cómo usar playwright-core para conectarse y manipular Scraping Browser.