Introducción
Explicación de Parámetros
Parámetro | Tipo | Descripción |
---|---|---|
actor | string | Un parámetro muy importante, representa un servicio. Haga clic para ver la información de la lista de actores del raspador |
input | object | Parámetros requeridos por el actor para completar una tarea de raspado de datos. |
proxy | object | El campo país, use un proxy de esta región para enviar solicitudes. |
Descripción del Éxito de la Tarea
- Un código HTTP de 200 indica que la tarea se ha realizado correctamente y que el cuerpo de la respuesta son los datos.
Descripción de la Tarea en Progreso
- Un código HTTP de 201 indica que la tarea se está procesando, por favor recupere el resultado de la tarea a través del taskId.
{"message": "task in progress", "taskId":"30681c8b-bfd3-48eb-a7c9-006e40b00591"}
Descripción del Fallo de la Tarea
- Código HTTP 429, Demasiadas solicitudes.
- Código HTTP 400, por favor verifique si los parámetros de la tarea son válidos.
- Código HTTP 500, error interno del servidor.
Ejemplo de Solicitud
Usando Python para recuperar datos de la búsqueda de Google
import json
import requests
def send_request():
host = "api.scrapeless.com"
url = f"https://{host}/api/v1/scraper/request"
token = "your_api_key"
headers = {
"x-api-token": token
"Content-Type": "application/json"
}
json_payload = json.dumps({
"actor": "scraper.google.search",
"input": {
"q": "Top news headlines",
"gl": "us",
"hl": "en",
"google_domain": "google.com"
}
})
response = requests.post(url, headers=headers, data=json_payload)
if response.status_code != 200:
print("Error:", response.status_code, response.text)
return
print("body", response.text)
if __name__ == "__main__":
send_request()