SDK Node

Instalação

Para instalar o SDK Node do Scrapeless, você pode usar o npm:

npm install @scrapeless-ai/sdk

Início Rápido

Faça login no painel do Scrapeless e obtenha sua Chave de API
Defina a chave de API como uma variável de ambiente chamada SCRAPELESS_API_KEY ou passe-a como um parâmetro para a classe Scrapeless.

Aqui está um exemplo básico:

import { Scrapeless } from '@scrapeless-ai/sdk';
 
const client = new Scrapeless({
  apiKey: 'YOUR_API_KEY' // ou use a variável de ambiente SCRAPELESS_API_KEY
});

Serviços Disponíveis

1. Navegador de Raspagem (Wrapper de Automação de Navegador)

O módulo Navegador de Raspagem fornece uma API unificada de alto nível para automação de navegadores, construída sobre a API do Navegador Scrapeless. Ele suporta Puppeteer e Playwright, e estende o objeto de página padrão com métodos avançados como realClick, realFill e liveURL para uma automação mais semelhante à humana.

import { Puppeteer, createPuppeteerCDPSession } from '@scrapeless-ai/sdk';
 
const browser = await Puppeteer.connect({
  sessionName: 'my-session',
  sessionTTL: 180,
  proxyCountry: 'US'
});
const page = await browser.newPage();
 
await page.goto('https://example.com');
const cdpSession = await createPuppeteerCDPSession(page);
 
await cdpSession.realClick('#login-btn');
await cdpSession.realFill('#username', 'myuser');
const urlInfo = await cdpSession.liveURL();
console.log('Current page URL:', urlInfo.liveURL);
 
await browser.close();

Recursos-chave:

API unificada para Puppeteer e Playwright
Automação semelhante à humana: realClick, realFill, liveURL
Fácil integração com sessões de navegador Scrapeless

2. API do Navegador

Gerencie diretamente as sessões do navegador para cenários de automação avançados.

// Crie uma sessão de navegador
const session = await client.browser.create({
  sessionName: 'api-session',
  sessionTTL: 120,
  proxyCountry: 'US'
});
console.log('Browser session info:', session);

3. API de Raspagem

Raspe páginas da web e extraia conteúdo em vários formatos.

const result = await client.scraping.scrape({
  actor: 'scraper.shopee',
  input: {
    url: 'https://shopee.tw/product/58418206/7180456348'
  }
});
 
console.log('result: ', result);

4. Deep SerpApi

Extraia resultados de mecanismos de busca (por exemplo, Google).

const searchResults = await client.deepserp.scrape({
  actor: 'scraper.google.search',
  input: {
    q: 'nike site:www.nike.com'
  }
});
console.log('Search results:', searchResults);

5. API Universal

Raspagem de uso geral para extração de dados flexível.

const universalResult = await client.universal.scrape({
  url: 'https://example.com',
  options: {
    javascript: true,
    screenshot: true,
    extractMetadata: true
  }
});
console.log('Universal scraping result:', universalResult);

6. API de Proxy

Gerencie e configure proxies para suas tarefas de raspagem e automação.

// Obtenha o URL do proxy
const proxyURL = await client.proxies.proxy({
  sessionName: 'sessionName',
  sessionTTL: 180,
  proxyCountry: 'US',
  sessionRecording: true,
  defaultViewport: null
});
console.log('Proxy URL:', proxyURL);

7. Perfis de Navegador

Os perfis permitem que você persista dados do usuário — como armazenamento, cookies, cache e estados de login — em várias sessões. Isso permite uma automação mais suave, autenticação simplificada e desempenho otimizado.

// Crie um novo perfil
const createResponse = await client.profiles.create('Meu Perfil');
console.log('Profile created:', createResponse);
 
// Liste os perfis
const profiles = await client.profiles.list({ page: 1, pageSize: 10 });
console.log('Profiles:', profiles.docs);
 
// Obtenha um perfil específico
const profile = await client.profiles.get(createResponse.profileId);
console.log('Profile details:', profile);
 
// Exclua o perfil
const deleteResponse = await client.profiles.delete(createResponse.profileId);
console.log('Profile deleted:', deleteResponse);

Tratamento de Erros

O SDK fornece tratamento abrangente de erros:

try {
  const result = await client.scraping.scrape({
    actor: 'scraper.shopee',
    input: {
      url: 'https://shopee.tw/product/58418206/7180456348'
    }
  });
} catch (error) {
  if (error instanceof ScrapelessError) {
    console.error('Erro Scrapeless:', error.message);
    console.error('Código de status:', error.statusCode);
  } else {
    console.error('Erro inesperado:', error);
  }
}

Configuração

O SDK suporta várias opções de configuração:

const client = new Scrapeless({
  apiKey: 'YOUR_API_KEY',
  timeout: 30000, // timeout da solicitação em milissegundos
  baseApiUrl: 'https://api.scrapeless.com',
  browserApiUrl: 'https://browser.scrapeless.com'
});

Variáveis de Ambiente

SCRAPELESS_API_KEY - Sua chave de API
SCRAPELESS_BASE_API_URL - URL da API base
SCRAPELESS_BROWSER_API_URL - URL da API do navegador

Melhores Práticas

Segurança da Chave de API: Nunca codifique sua chave de API. Use variáveis de ambiente.
Tratamento de Erros: Sempre envolva chamadas de API em blocos try-catch.
Limpeza de Recursos: Sempre feche as conexões do navegador quando terminar.
Limitação de Taxa: Esteja ciente dos limites de taxa da API.
Configuração de Tempo Limite: Defina tempos limite apropriados para operações de longa duração.

Suporte

Para suporte, documentação e mais exemplos, visite:

Documentação: https://docs.scrapeless.com
GitHub: https://github.com/scrapeless-ai/scrapeless-sdk-node
Suporte: support@scrapeless.com

Visão Geral