Bắt đầu
Bước 1. Lấy API Key của Scrapeless
- Tạo tài khoản và đăng nhập vào Bảng điều khiển Scrapeless. Bạn có thể nhận được 2.000 cuộc gọi API miễn phí.
- Tạo API key của Scrapeless.
Bước 2. Thiết lập điều kiện kích hoạt và kết nối với Scrapeless
- Thiết lập điều kiện kích hoạt dựa trên nhu cầu thực tế của bạn.
- Kết nối tài khoản Scrapeless của bạn. Ở đây, chúng ta chọn Universal Scraping và sử dụng
https://www.amazon.com/LK-Apple-Watch-Screen-Protector/dp/B0DFG31G1P/
làm URL mẫu.
Bước 3. Làm sạch dữ liệu
Tiếp theo, chúng ta cần làm sạch dữ liệu HTML đã được thu thập ở bước trước. Đầu tiên, chọn Universal Scraping Data trong mục inputs. Cấu hình mã như sau:
export const code = async (inputs) => {
const html = inputs.SOURCE_DATA
const titleMatch = html.match(/id=['"]productTitle['"][^>]*>([^<]+)</i);
const title = titleMatch ? titleMatch[1].trim() : "";
const priceMatch = html.match(/class=['"]a-offscreen['"][^>]*>\$?([\d.,]+)/i);
const price = priceMatch ? priceMatch[1].trim() : "";
const ratingMatch = html.match(/class=['"]a-icon-alt['"][^>]*>([^<]+)</i);
const rating = ratingMatch ? ratingMatch[1].trim() : "";
return [
{
json: {
title,
price,
rating
},
},
];
};
Bước 4. Kết nối với Google Sheets
Tiếp theo, bạn có thể chọn xuất dữ liệu đã được làm sạch và cấu trúc vào Google Sheets. Chỉ cần thêm một node Google Sheets và cấu hình kết nối Google Sheets của bạn.
Lưu ý: Hãy chắc chắn tạo một Google Sheet trước đó.
Ví dụ về kết quả đầu ra
Đó là một hướng dẫn đơn giản về cách thiết lập và sử dụng Scrapeless. Nếu bạn có bất kỳ câu hỏi nào, hãy thoải mái thảo luận chúng trên Scrapeless Discord.