快速入门

请求流程

提交任务 发送 POST 请求到 /api/v1/scraper/request。
处理响应
1. HTTP 200 (成功): 数据直接返回在响应体中。
2. HTTP 201 (处理中): 使用提供的 taskId 轮询结果。
轮询结果 对于异步任务，重复调用 /api/v1/scraper/result/{taskId} 直到数据准备就绪 (HTTP 200)。

HTTP 状态码

代码	含义	操作
200	成功	直接使用响应体数据。
201	任务进行中	轮询 `/result/{taskId}` (建议间隔: 1-5 秒)。
400	参数无效	请检查任务参数是否有效。
429	速率限制超出	减少请求频率或联系支持人员调整配额。
500	内部服务器错误	1 分钟后重试；如果持续出现，请联系支持人员。

代码示例

完整流程

import { Scrapeless } from '@scrapeless-ai/sdk';
const client = new Scrapeless({
  apiKey: 'YOUR_API_KEY',
});
 
async function runTask() {
  const result = await client.scraping.scrape({
    actor: 'scraper.shopee',
    input: {
      url: 'https://shopee.tw/a-i.10228173.24803858474'
    }
  });
 
  return result;
}
 
runTask()
  .then(data => {
    console.log('Data:', data);
  })
  .catch(error => {
    console.error('Error:', error);
  });

import requests
import json
import time
 
API_KEY = "YOUR_API_KEY"
HOST = "api.scrapeless.com"
 
# Submit task
task_url = f"https://{HOST}/api/v1/scraper/request"
payload = json.dumps({
    "actor": "scraper.shopee",
    "input": {"url": "https://shopee.tw/a-i.10228173.24803858474"}
})
headers = {'Content-Type': 'application/json', 'x-api-token': API_KEY}
 
response = requests.post(task_url, headers=headers, data=payload)
 
# Handle response
if response.status_code == 200:
    print("Data:", response.json())
elif response.status_code == 201:
    task_id = response.json()["taskId"]
    print(f"Task queued. Polling ID: {task_id}")
 
    # Poll for results (max 10 attempts, 3s interval)
    max_retries = 10
    for _ in range(max_retries):
        result_url = f"https://{HOST}/api/v1/scraper/result/{task_id}"
        result_response = requests.get(result_url, headers=headers)
 
        if result_response.status_code == 200:
            print("Result:", result_response.json())
            break
        elif result_response.status_code == 201:
            print("Still processing. Retrying in 3s...")
            time.sleep(3)
        else:
            print(f"Error {result_response.status_code}: {result_response.text}")
            break
else:
    print(f"Request failed: {response.status_code} - {response.text}")

package main
import (
    "bytes"
    "encoding/json"
    "fmt"
    "io/ioutil"
    "net/http"
    "time"
)
const (
    API_KEY = "YOUR_KEY"
    HOST    = "api.scrapeless.com"
)
type TaskResponse struct {
    TaskId string `json:"taskId"`
}
func main() {
    // Submit task
    payload, _ := json.Marshal(map[string]interface{}{
       "actor": "scraper.shopee",
       "input": map[string]string{
          "url": "https://shopee.tw/a-i.10228173.24803858474",
       },
    })
    req, _ := http.NewRequest(
       "POST",
       fmt.Sprintf("https://%s/api/v1/scraper/request", HOST),
       bytes.NewBuffer(payload),
    )
    req.Header.Set("Content-Type", "application/json")
    req.Header.Set("x-api-token", API_KEY)
    client := &http.Client{}
    resp, err := client.Do(req)
    if err != nil {
       panic(err)
    }
    defer resp.Body.Close()
    body, _ := ioutil.ReadAll(resp.Body)
    if resp.StatusCode == 200 {
       fmt.Printf("Direct result: %s\n", body)
    } else if resp.StatusCode == 201 {
       var taskResp TaskResponse
       json.Unmarshal(body, &taskResp)
       // Polling logic
       for i := 0; i < 10; i++ {
          pollReq, _ := http.NewRequest("GET",
             fmt.Sprintf("https://%s/api/v1/scraper/result/%s", HOST, taskResp.TaskId), nil)
          pollReq.Header.Add("x-api-token", API_KEY)
          pollResp, err := client.Do(pollReq)
          if err != nil {
             continue
          }
          defer pollResp.Body.Close()
          if pollResp.StatusCode == 200 {
             result, _ := ioutil.ReadAll(pollResp.Body)
             fmt.Printf("Final result: %s\n", result)
             break
          }
          time.Sleep(3 * time.Second)
       }
    } else {
       fmt.Printf("Error %d: %s", resp.StatusCode, body)
    }
}

const axios = require('axios');
const API_KEY = 'YOUR_KEY';
const HOST = 'api.scrapeless.com';
 
async function runTask() {
  try {
    // Submit task
    const submitResp = await axios.post(
      `https://${HOST}/api/v1/scraper/request`,
      {
        actor: 'scraper.shopee',
        input: {
          url: 'https://shopee.tw/a-i.10228173.24803858474'
        }
      },
      {
        headers: {
          'x-api-token': API_KEY,
          'Content-Type': 'application/json'
        }
      }
    );
 
    if (submitResp.status === 200) {
      console.log('Direct result:', submitResp.data);
    } else if (submitResp.status === 201) {
      const taskId = submitResp.data.taskId;
      
      // Polling function
      const pollResult = async (attempts = 0) => {
        if (attempts > 10) throw new Error('Max retries reached');
        
        const resultResp = await axios.get(
          `https://${HOST}/api/v1/scraper/result/${taskId}`,
          { headers: { 'x-api-token': API_KEY } }
        );
 
        if (resultResp.status === 200) {
          console.log('Final result:', resultResp.data);
        } else if (resultResp.status === 201) {
          await new Promise(resolve => setTimeout(resolve, 3000));
          return pollResult(attempts + 1);
        } else {
          throw new Error(`Status ${resultResp.status}: ${resultResp.data}`);
        }
      };
      
      await pollResult();
    }
  } catch (error) {
    console.error('Error:', error.message);
  }
}
 
runTask();

cURL (轮询示例)

curl --location --request GET 'https://api.scrapeless.com/api/v1/scraper/result/30681c8b-bfd3-48eb-a7c9-006e40b00591' \
--header 'x-api-token: YOUR_API_KEY' \
--header 'Content-Type: application/json'

参数

参数	类型	描述
actor	字符串	爬虫服务 (例如，scraper.shopee)。
input	对象	任务特定参数 (例如，action, url)。
proxy	对象	可选的代理配置，包含国家字段。

注意

轮询建议
1. 间隔: 1-5 秒。
2. 超时: 设置最大重试次数限制 (例如，10 次尝试)。
调试技巧
1. 首先使用简单的 URL 进行测试。

介绍爬取Shopee