深いセルパピクイックスタートはじめる

はじめに

パラメータ説明

パラメータ説明
actorstring非常に重要なパラメータで、サービスを表します。クリックしてスクレーパーのアクターリスト情報をご覧ください
inputobjectデータスクレイピングタスクを完了するためにアクターが必要とするパラメータ。
proxyobjectcountryフィールド、この地域からのプロキシを使用してリクエストを送信します。

タスク成功時の説明

  • HTTPコード200は、タスクが成功し、レスポンスボディがデータであることを示します。

タスク進行中の説明

  • HTTPコード201は、タスクが処理中であることを示します。taskIdを通してタスクの結果を取得してください。
{"message": "task in progress", "taskId":"30681c8b-bfd3-48eb-a7c9-006e40b00591"}

タスク失敗時の説明

  • HTTPコード429、リクエストが多すぎます。
  • HTTPコード400、タスクパラメータが有効かどうかを確認してください。
  • HTTPコード500、内部サーバーエラー。

リクエスト例

Pythonを使用してGoogle検索データを取得する

import json
 
import requests
 
def send_request():
    host = "api.scrapeless.com"
    url = f"https://{host}/api/v1/scraper/request"
    token = "your_api_key"
 
    headers = {
        "x-api-token": token
        "Content-Type": "application/json"
    }
 
    json_payload = json.dumps({
        "actor": "scraper.google.search",
        "input": {
            "q": "Top news headlines",
            "gl": "us",
            "hl": "en",
            "google_domain": "google.com"
        }
    })
 
    response = requests.post(url, headers=headers, data=json_payload)
 
    if response.status_code != 200:
        print("Error:", response.status_code, response.text)
        return
 
    print("body", response.text)
 
if __name__ == "__main__":
    send_request()