はじめに
パラメータ説明
パラメータ | 型 | 説明 |
---|---|---|
actor | string | 非常に重要なパラメータで、サービスを表します。クリックしてスクレーパーのアクターリスト情報をご覧ください |
input | object | データスクレイピングタスクを完了するためにアクターが必要とするパラメータ。 |
proxy | object | countryフィールド、この地域からのプロキシを使用してリクエストを送信します。 |
タスク成功時の説明
- HTTPコード200は、タスクが成功し、レスポンスボディがデータであることを示します。
タスク進行中の説明
- HTTPコード201は、タスクが処理中であることを示します。taskIdを通してタスクの結果を取得してください。
{"message": "task in progress", "taskId":"30681c8b-bfd3-48eb-a7c9-006e40b00591"}
タスク失敗時の説明
- HTTPコード429、リクエストが多すぎます。
- HTTPコード400、タスクパラメータが有効かどうかを確認してください。
- HTTPコード500、内部サーバーエラー。
リクエスト例
Pythonを使用してGoogle検索データを取得する
import json
import requests
def send_request():
host = "api.scrapeless.com"
url = f"https://{host}/api/v1/scraper/request"
token = "your_api_key"
headers = {
"x-api-token": token
"Content-Type": "application/json"
}
json_payload = json.dumps({
"actor": "scraper.google.search",
"input": {
"q": "Top news headlines",
"gl": "us",
"hl": "en",
"google_domain": "google.com"
}
})
response = requests.post(url, headers=headers, data=json_payload)
if response.status_code != 200:
print("Error:", response.status_code, response.text)
return
print("body", response.text)
if __name__ == "__main__":
send_request()