开始使用
参数说明
参数 | 类型 | 描述 |
---|---|---|
actor | string | 一个非常重要的参数,它代表一个服务。点击查看抓取器 actor 列表信息 |
input | object | actor 完成数据抓取任务所需的参数。 |
proxy | object | 国家字段,使用来自该地区的代理发送请求。 |
任务成功描述
- HTTP 代码 200 表示任务已成功,响应正文为数据。
任务进行中描述
- HTTP 代码 201 表示任务正在处理中,请通过 taskId 获取任务结果。
{"message": "task in progress", "taskId":"30681c8b-bfd3-48eb-a7c9-006e40b00591"}
任务失败描述
- HTTP 代码 429,请求过多。
- HTTP 代码 400,请检查任务参数是否有效。
- HTTP 代码 500,内部服务器错误。
请求示例
使用 Python 获取 Google 搜索数据
import json
import requests
def send_request():
host = "api.scrapeless.com"
url = f"https://{host}/api/v1/scraper/request"
token = "your_api_key"
headers = {
"x-api-token": token
"Content-Type": "application/json"
}
json_payload = json.dumps({
"actor": "scraper.google.search",
"input": {
"q": "Top news headlines",
"gl": "us",
"hl": "en",
"google_domain": "google.com"
}
})
response = requests.post(url, headers=headers, data=json_payload)
if response.status_code != 200:
print("Error:", response.status_code, response.text)
return
print("body", response.text)
if __name__ == "__main__":
send_request()