Integração

Puppeteer

O Scraping Browser oferece uma plataforma serverless de alto desempenho, projetada para simplificar o processo de extração de dados de sites dinâmicos. Com integração perfeita ao Puppeteer, os desenvolvedores podem executar, gerenciar e monitorar navegadores headless sem recursos de servidor dedicados, alcançando automação web eficiente e coleta de dados.

Instalar Bibliotecas Necessárias

Primeiro, instale puppeteer-core, que é a versão leve do Puppeteer, projetada para conectar a instâncias de navegador existentes:

npm install puppeteer-core

Escrever Código para Conectar ao Scraping Browser

Em seu código Puppeteer, conecte-se ao Scraping Browser usando o seguinte método:

const puppeteer = require('puppeteer-core');
const connectionURL = 'wss://browser.scrapeless.com/browser?token=APIKey&session_ttl=180&proxy_country=ANY';
 
(async () => {
    const browser = await puppeteer.connect({browserWSEndpoint: connectionURL});
    const page = await browser.newPage();
    await page.goto('https://www.scrapeless.com');
    console.log(await page.title());
    await browser.close();
})();

Dessa forma, você pode aproveitar a infraestrutura do Scraping Browser, incluindo escalabilidade, rotação de IP e acesso global.

Exemplos Práticos

Aqui estão algumas operações comuns do Puppeteer após a integração com o Scraping Browser:

Navegação e Extração de Conteúdo da Página

const page = await browser.newPage();
await page.goto('https://www.example.com');
console.log(await page.title());
const html = await page.content();
console.log(html);
await browser.close();

Capturando Capturas de Tela

const page = await browser.newPage();
await page.goto('https://www.example.com');
await page.screenshot({ path: 'example.png' });
console.log('Screenshot saved as example.png');
await browser.close();

Executando Scripts Personalizados

const page = await browser.newPage();
await page.goto('https://www.example.com');
const result = await page.evaluate(() => document.title);
console.log('Page title:', result);
await browser.close();

Playwright

O Scraping Browser oferece uma plataforma serverless de alto desempenho, projetada para simplificar o processo de extração de dados de sites dinâmicos. Com integração perfeita ao Playwright, os desenvolvedores podem executar, gerenciar e monitorar navegadores headless sem recursos de servidor dedicados, alcançando automação web eficiente e coleta de dados.

Instalar Bibliotecas Necessárias

Primeiro, instale playwright-core, que é a versão leve do Playwright, usada para conectar a instâncias de navegador existentes:

npm install playwright-core

Escrever Código para Conectar ao Scraping Browser

No código Playwright, conecte-se ao Scraping Browser usando o seguinte método:

const { chromium } = require('playwright-core');
const connectionURL = 'wss://browser.scrapeless.com/browser?token=APIKey&session_ttl=180&proxy_country=ANY';
 
(async () => {
    const browser = await chromium.connectOverCDP(connectionURL);
    const page = await browser.newPage();
    await page.goto('https://www.scrapeless.com');
    console.log(await page.title());
    await browser.close();
})();

Isso permite que você aproveite a infraestrutura do Scraping Browser, incluindo escalabilidade, rotação de IP e acesso global.

Exemplos Práticos

Aqui estão algumas operações comuns do Playwright após a integração com o Scraping Browser:

Navegação e Extração de Conteúdo da Página

const page = await browser.newPage();
await page.goto('https://www.example.com');
console.log(await page.title());
const html = await page.content();
console.log(html);
await browser.close();

Capturando Capturas de Tela

const page = await browser.newPage();
await page.goto('https://www.example.com');
await page.screenshot({ path: 'example.png' });
console.log('Screenshot saved as example.png');
await browser.close();

Executando Scripts Personalizados

const page = await browser.newPage();
await page.goto('https://www.example.com');
const result = await page.evaluate(() => document.title);
console.log('Page title:', result);
await browser.close();

Esses exemplos de código demonstram como usar o playwright-core para conectar e manipular o Scraping Browser.

Começando CDP API