Scraping APIクイックスタートはじめる

はじめに

パラメータの説明

パラメータ説明
actorstring非常に重要なパラメータであり、サービスを表します。スクレーパーアクター一覧情報を参照するにはクリックしてください
inputobjectデータスクレイピングタスクを完了するためにアクターが必要とするパラメータ。
proxyobjectcountryフィールド、この地域からのプロキシを使用してリクエストを送信します。

タスク成功の説明

  • HTTPコード200は、タスクが成功し、レスポンスボディがデータであることを示します。

タスク処理中説明

  • HTTPコード201は、タスクが処理中であることを示します。taskIdを使用してタスクの結果を取得してください。
{
  "message": "task in progress",
  "taskId":"30681c8b-bfd3-48eb-a7c9-006e40b00591"
}

タスク失敗の説明

  • HTTPコード429。リクエストが多すぎます。
  • HTTPコード400。タスクパラメータが有効かどうかを確認してください。
  • HTTPコード500。内部サーバーエラー。

簡単なリクエスト

Pythonを使用してShopeeデータを取得する

import requests
import json
 
API_KEY = ""
host = "api.scrapeless.com"
url = f"https://{host}/api/v1/scraper/request"
 
payload = json.dumps({
   "actor": "scraper.shopee",
   "input": {
      "action": "shopee.product",
      "url": "https://shopee.tw/2312312.10228173.24803858474"
   }
})
headers = {
   'Content-Type': 'application/json',
   'x-api-token': f'{API_KEY}'
}
 
response = requests.request("POST", url, headers=headers, data=payload)
 
print(response.text)