Node SDK

インストール

Scrapeless Node SDKをインストールするには、npmを使用します。

npm install @scrapeless-ai/sdk

クイックスタート

ログインしてScrapelessダッシュボードからAPIキーを取得します
APIキーをSCRAPELESS_API_KEYという環境変数として設定するか、Scrapelessクラスのパラメータとして渡します。

基本的な例を以下に示します。

import { Scrapeless } from '@scrapeless-ai/sdk';
 
const client = new Scrapeless({
  apiKey: 'YOUR_API_KEY' // or use SCRAPELESS_API_KEY env variable
});

利用可能なサービス

1. スクラピングブラウザ (ブラウザ自動化ラッパー)

スクラピングブラウザモジュールは、ScrapelessブラウザAPI上に構築された、ブラウザ自動化のための高レベルで統一されたAPIを提供します。PuppeteerとPlaywrightの両方をサポートし、より人間らしい自動化のためにrealClick、realFill、liveURLなどの高度なメソッドで標準のページオブジェクトを拡張します。

import { Puppeteer, createPuppeteerCDPSession } from '@scrapeless-ai/sdk';
 
const browser = await Puppeteer.connect({
  sessionName: 'my-session',
  sessionTTL: 180,
  proxyCountry: 'US'
});
const page = await browser.newPage();
 
await page.goto('https://example.com');
const cdpSession = await createPuppeteerCDPSession(page);
 
await cdpSession.realClick('#login-btn');
await cdpSession.realFill('#username', 'myuser');
const urlInfo = await cdpSession.liveURL();
console.log('Current page URL:', urlInfo.liveURL);
 
await browser.close();

主な機能:

PuppeteerとPlaywrightの統一API
人間らしい自動化: realClick、realFill、liveURL
Scrapelessブラウザセッションとの容易な統合

2. ブラウザAPI

高度な自動化シナリオのために、ブラウザセッションを直接管理します。

// ブラウザセッションを作成
const session = await client.browser.create({
  sessionName: 'api-session',
  sessionTTL: 120,
  proxyCountry: 'US'
});
console.log('Browser session info:', session);

3. スクラピングAPI

ウェブページをスクレイピングし、様々な形式でコンテンツを抽出します。

const result = await client.scraping.scrape({
  actor: 'scraper.shopee',
  input: {
    url: 'https://shopee.tw/product/58418206/7180456348'
  }
});
 
console.log('result: ', result);

4. Deep SerpApi

検索エンジンの結果（例：Google）を抽出します。

const searchResults = await client.deepserp.scrape({
  actor: 'scraper.google.search',
  input: {
    q: 'nike site:www.nike.com'
  }
});
console.log('Search results:', searchResults);

5. ユニバーサルAPI

柔軟なデータ抽出のための汎用スクレイピング。

const universalResult = await client.universal.scrape({
  url: 'https://example.com',
  options: {
    javascript: true,
    screenshot: true,
    extractMetadata: true
  }
});
console.log('Universal scraping result:', universalResult);

6. プロキシAPI

スクレイピングと自動化タスクのプロキシを管理および構成します。

// プロキシURLを取得
const proxyURL = await client.proxies.proxy({
  sessionName: 'sessionName',
  sessionTTL: 180,
  proxyCountry: 'US',
  sessionRecording: true,
  defaultViewport: null
});
console.log('Proxy URL:', proxyURL);

7. ブラウザプロファイル

プロファイルを使用すると、ストレージ、Cookie、キャッシュ、ログイン状態などのユーザーデータを複数のセッション間で保持できます。これにより、よりスムーズな自動化、簡素化された認証、および最適化されたパフォーマンスが可能になります。

// 新しいプロファイルを作成
const createResponse = await client.profiles.create('My Profile');
console.log('Profile created:', createResponse);
 
// プロファイル一覧
const profiles = await client.profiles.list({ page: 1, pageSize: 10 });
console.log('Profiles:', profiles.docs);
 
// 特定のプロファイルを取得
const profile = await client.profiles.get(createResponse.profileId);
console.log('Profile details:', profile);
 
// プロファイルを削除
const deleteResponse = await client.profiles.delete(createResponse.profileId);
console.log('Profile deleted:', deleteResponse);

エラー処理

SDKは包括的なエラー処理を提供します。

try {
  const result = await client.scraping.scrape({
    actor: 'scraper.shopee',
    input: {
      url: 'https://shopee.tw/product/58418206/7180456348'
    }
  });
} catch (error) {
  if (error instanceof ScrapelessError) {
    console.error('Scrapeless error:', error.message);
    console.error('Status code:', error.statusCode);
  } else {
    console.error('Unexpected error:', error);
  }
}

設定

SDKは様々な設定オプションをサポートします。

const client = new Scrapeless({
  apiKey: 'YOUR_API_KEY',
  timeout: 30000, // request timeout in milliseconds
  baseApiUrl: 'https://api.scrapeless.com',
  browserApiUrl: 'https://browser.scrapeless.com'
});

環境変数

SCRAPELESS_API_KEY - APIキー
SCRAPELESS_BASE_API_URL - 基本API URL
SCRAPELESS_BROWSER_API_URL - ブラウザAPI URL

ベストプラクティス

APIキーのセキュリティ: APIキーをハードコードしないでください。環境変数を使用してください。
エラー処理: API呼び出しは常にtry-catchブロックで囲んでください。
リソースのクリーンアップ: ブラウザ接続は使用後必ず閉じます。
レート制限: APIのレート制限に注意してください。
タイムアウト設定: 長時間実行される操作には適切なタイムアウトを設定してください。

サポート

サポート、ドキュメント、その他の例については、以下をご覧ください。

ドキュメント: https://docs.scrapeless.com
GitHub: https://github.com/scrapeless-ai/scrapeless-sdk-node
サポート: support@scrapeless.com

概要