Playwright

O Scraping Browser fornece uma plataforma serverless de alto desempenho, projetada para simplificar o processo de extração de dados de sites dinâmicos. Através da integração perfeita com o Playwright, os desenvolvedores podem executar, gerenciar e monitorar navegadores headless sem precisar de recursos de servidor dedicados, permitindo automação web eficiente e coleta de dados.

Instalando Bibliotecas Necessárias

Primeiro, instale o playwright-core, uma versão leve do Playwright usada para conectar a instâncias de navegador existentes:

npm install playwright-core

Escrevendo Código para se Conectar ao Scraping Browser

Em seu código Playwright, conecte-se ao Scraping Browser usando o seguinte:

const { Playwright } = require('@scrapeless-ai/sdk');
 
(async () => {
    const browser = await Playwright.connect({
        session_name: 'sdk_test',
        session_ttl: 180,
        proxy_country: 'US',
        session_recording: true,
        defaultViewport: null
    });
 
    const page = await browser.newPage();
    await page.goto('https://www.scrapeless.com');
    console.log(await page.title());
    await browser.close();
})();

Isso permite que você aproveite a infraestrutura do Scraping Browser, incluindo escalabilidade, rotação de IP e acesso global.

Exemplos Práticos

Aqui estão algumas operações comuns do Playwright após integrar o Scraping Browser:

  1. Navegação e Extração de Conteúdo da Página
const page = await browser.newPage();
await page.goto('https://www.example.com');
console.log(await page.title());
const html = await page.content();
console.log(html);
await browser.close();
 
  1. Tirando Capturas de Tela
const page = await browser.newPage();
await page.goto('https://www.example.com');
await page.screenshot({ path: 'example.png' });
console.log('Screenshot salvo como example.png');
await browser.close();
 
  1. Executando Código Personalizado
const page = await browser.newPage();
await page.goto('https://www.example.com');
const result = await page.evaluate(() => document.title);
console.log('Título da página:', result);
await browser.close();
 
  1. Simula um clique do mouse.
await page.realClick('button[type="submit"]');
  1. Simula entrada de teclado.
await page.realFill('#login-email', 'scrapeless@gmail.com');