开始使用
步骤 1. 获取你的 Scrapeless API 密钥
- 创建一个账户 并登录 Scrapeless 控制面板。您可以获得 2,000 次免费 API 调用。
- 生成你的 Scrapeless API 密钥。
步骤 2. 设置触发条件并连接到 Scrapeless
- 根据您的实际需求设置触发条件。
- 连接你的 Scrapeless 账户。这里,我们选择 通用抓取 并使用
https://www.amazon.com/LK-Apple-Watch-Screen-Protector/dp/B0DFG31G1P/
作为示例 URL。
步骤 3. 清理数据
接下来,我们需要清理上一步抓取的 HTML 数据。首先,在 输入 部分选择 通用抓取数据。代码配置如下:
export const code = async (inputs) => {
const html = inputs.SOURCE_DATA
const titleMatch = html.match(/id=['"]productTitle['"][^>]*>([^<]+)</i);
const title = titleMatch ? titleMatch[1].trim() : "";
const priceMatch = html.match(/class=['"]a-offscreen['"][^>]*>\$?([\d.,]+)/i);
const price = priceMatch ? priceMatch[1].trim() : "";
const ratingMatch = html.match(/class=['"]a-icon-alt['"][^>]*>([^<]+)</i);
const rating = ratingMatch ? ratingMatch[1].trim() : "";
return [
{
json: {
title,
price,
rating
},
},
];
};
步骤 4. 连接到 Google Sheets
接下来,您可以选择将清理和结构化的数据输出到 Google Sheets。只需添加一个 Google Sheets 节点并配置您的 Google Sheets 连接。
注意:请确保提前创建一个 Google Sheet。
输出结果示例
这是一个关于如何设置和使用 Scrapeless 的简单教程。如果您有任何疑问,请随时在 Scrapeless Discord 上讨论。