Trích xuất dữ liệu trang web Shopee
Giải thích tham số
Tham số | Kiểu | Giá trị | Mô tả |
---|---|---|---|
actor | string | scraper.shopee | Giá trị cố định |
input.action | string | shopee.product | Hỗ trợ ba loại |
- shopee.product Lấy dữ liệu chi tiết sản phẩm
- shopee.search Dữ liệu tìm kiếm từ khóa
- shopee.live Dữ liệu liên quan đến livestream | | input.url | string | Liên kết URL | Hỗ trợ bốn loại liên kết URL
- Liên kết URL của trang chi tiết sản phẩm
- Liên kết API của trang chi tiết sản phẩm (/api/v4/pdp/get_pc)
- Liên kết API để tìm kiếm sản phẩm (/api/v4/search/search_items)
- Liên kết API cho phát trực tiếp (/api/v1/session/
{sessionId}
/more_items) |
Dữ liệu chi tiết sản phẩm
import { Scrapeless } from '@scrapeless-ai/sdk';
const client = new Scrapeless({
apiKey: 'YOUR_API_KEY'
});
client.scraping.createTask({
actor: "scraper.shopee",
input: {
action: "shopee.product",
url: "https://shopee.tw/2312312.10228173.24803858474"
}
}).then(async (result) => {
console.log(result);
})
.catch((error) => {
console.error('Error:', error);
});
Dữ liệu tìm kiếm sản phẩm
import { Scrapeless } from '@scrapeless-ai/sdk';
const client = new Scrapeless({
apiKey: 'YOUR_API_KEY'
});
client.scraping.createTask({
actor: "scraper.shopee",
input: {
action: "shopee.search",
url: "https://shopee.co.th/api/v4/search/search_items?by=sales&keyword=baby%20pants&limit=30&newest=0&order=desc&page_type=search"
}
}).then(async (result) => {
console.log(result);
})
.catch((error) => {
console.error('Error:', error);
});
Dữ liệu Livestream
import { Scrapeless } from '@scrapeless-ai/sdk';
const client = new Scrapeless({
apiKey: 'YOUR_API_KEY'
});
const sessionId = "";
client.scraping.createTask({
actor: "scraper.shopee",
input: {
action: "shopee.live",
url: `https://live.shopee.co.th/api/v1/session/${sessionId}/more_items?offset=0&limit=10`
}
}).then(async (result) => {
console.log(result);
})
.catch((error) => {
console.error('Error:', error);
});
Cách xây dựng liên kết API
API trang chi tiết sản phẩm
# API có thể được chia thành ba phần
# 1. region
# 2. item_id
# 3. shop_id
# Danh sách khu vực được hỗ trợ
# ["shopee.co.id", "shopee.vn", "shopee.co.th", "shopee.ph", "shopee.com.my", "shopee.sg", "shopee.com.co", "shopee.cl", "shopee.com.mx", "shopee.com.br", "shopee.tw"]
url = f"https://{region}/api/v4/pdp/get_pc?item_id={item_id}&shop_id={shop_id}"
print(url)
API tìm kiếm sản phẩm
limit = 20 # 10 20 30 40
order = "desc"
page_type = "search"
keyword = "keyword" # chỉnh sửa
region = "shopee.co.id"
# Danh sách khu vực được hỗ trợ
# ["shopee.co.id", "shopee.vn", "shopee.co.th", "shopee.ph", "shopee.com.my", "shopee.sg", "shopee.com.co", "shopee.cl", "shopee.com.mx", "shopee.com.br", "shopee.tw"]
url = f"https://{region}/api/v4/search/search_items?limit={limit}&newest=0&by=sales&keyword={keyword}&order={order}&page_type={page_type}&scenario=PAGE_OTHERS&version=2"
print(url)
Truy xuất kết quả tác vụ qua TaskId
import requests
API_KEY = ""
host = "api.scrapeless.com"
task_id = ""
url = f"https://{host}/api/v1/scraper/result/{task_id}"
headers = {
'x-api-token': f'{API_KEY}'
}
response = requests.request("GET", url, headers=headers)
print(response.text)