Scraping BrowserCaracterísticasIntegraciones

Integración

Puppeteer

Scraping Browser ofrece una plataforma serverless de alto rendimiento diseñada para simplificar el proceso de extracción de datos de sitios web dinámicos. Con una integración perfecta con Puppeteer, los desarrolladores pueden ejecutar, gestionar y monitorizar navegadores headless sin recursos de servidor dedicados, logrando una automatización web eficiente y una recolección de datos eficaz.

Instalar las bibliotecas necesarias

Primero, instale puppeteer-core, que es la versión ligera de Puppeteer, diseñada para conectarse a instancias de navegador existentes:

npm install puppeteer-core

Escribir código para conectarse a Scraping Browser

En su código Puppeteer, conéctese a Scraping Browser usando el siguiente método:

const puppeteer = require('puppeteer-core');
const connectionURL = 'wss://browser.scrapeless.com/browser?token=APIKey&session_ttl=180&proxy_country=ANY';
 
(async () => {
    const browser = await puppeteer.connect({browserWSEndpoint: connectionURL});
    const page = await browser.newPage();
    await page.goto('https://www.scrapeless.com');
    console.log(await page.title());
    await browser.close();
})();
 

De esta manera, puede aprovechar la infraestructura de Scraping Browser, incluyendo la escalabilidad, la rotación de IP y el acceso global.

Ejemplos prácticos

Aquí hay algunas operaciones comunes de Puppeteer después de integrarse con Scraping Browser:

  1. Navegación y extracción de contenido de la página
const page = await browser.newPage();
await page.goto('https://www.example.com');
console.log(await page.title());
const html = await page.content();
console.log(html);
await browser.close();
 
  1. Capturar capturas de pantalla
const page = await browser.newPage();
await page.goto('https://www.example.com');
await page.screenshot({ path: 'example.png' });
console.log('Screenshot saved as example.png');
await browser.close();
 
  1. Ejecutar scripts personalizados
const page = await browser.newPage();
await page.goto('https://www.example.com');
const result = await page.evaluate(() => document.title);
console.log('Page title:', result);
await browser.close();
 

Playwright

Scraping Browser ofrece una plataforma serverless de alto rendimiento diseñada para simplificar el proceso de extracción de datos de sitios web dinámicos. Con una integración perfecta con Playwright, los desarrolladores pueden ejecutar, gestionar y monitorizar navegadores headless sin recursos de servidor dedicados, logrando una automatización web eficiente y una recolección de datos eficaz.

Instalar las bibliotecas necesarias

Primero, instale playwright-core, que es la versión ligera de Playwright, usada para conectarse a instancias de navegador existentes:

npm install playwright-core

Escribir código para conectarse a Scraping Browser

En el código Playwright, conéctese a Scraping Browser usando el siguiente método:

const { chromium } = require('playwright-core');
const connectionURL = 'wss://browser.scrapeless.com/browser?token=APIKey&session_ttl=180&proxy_country=ANY';
 
(async () => {
    const browser = await chromium.connectOverCDP(connectionURL);
    const page = await browser.newPage();
    await page.goto('https://www.scrapeless.com');
    console.log(await page.title());
    await browser.close();
})();
 

Esto le permite aprovechar la infraestructura de Scraping Browser, incluyendo la escalabilidad, la rotación de IP y el acceso global.

Ejemplos prácticos

Aquí hay algunas operaciones comunes de Playwright después de integrarse con Scraping Browser:

  1. Navegación y extracción de contenido de la página
const page = await browser.newPage();
await page.goto('https://www.example.com');
console.log(await page.title());
const html = await page.content();
console.log(html);
await browser.close();
 
  1. Capturar capturas de pantalla
const page = await browser.newPage();
await page.goto('https://www.example.com');
await page.screenshot({ path: 'example.png' });
console.log('Screenshot saved as example.png');
await browser.close();
 
  1. Ejecutar scripts personalizados
const page = await browser.newPage();
await page.goto('https://www.example.com');
const result = await page.evaluate(() => document.title);
console.log('Page title:', result);
await browser.close();
 

Estos ejemplos de código demuestran cómo usar playwright-core para conectarse y manipular Scraping Browser.