はじめに
ステップ1. Scrapeless APIキーを取得する
- アカウントを作成して、Scrapelessダッシュボードにログインします。無料で2,000回のAPIコールが利用できます。
- Scrapeless APIキーを生成します。
ステップ2. トリガー条件を設定し、Scrapelessに接続する
- 実際のニーズに基づいてトリガー条件を設定します。
- Scrapelessアカウントに接続します。「ユニバーサルスクレイピング」を選択し、
https://www.amazon.com/LK-Apple-Watch-Screen-Protector/dp/B0DFG31G1P/
をサンプルURLとして使用します。
ステップ3. データをクリーンアップする
次に、前のステップでスクレイピングされたHTMLデータをクリーンアップする必要があります。「入力」セクションで「ユニバーサルスクレイピングデータ」を選択します。コードの設定は以下のとおりです。
export const code = async (inputs) => {
const html = inputs.SOURCE_DATA
const titleMatch = html.match(/id=['"]productTitle['"][^>]*>([^<]+)</i);
const title = titleMatch ? titleMatch[1].trim() : "";
const priceMatch = html.match(/class=['"]a-offscreen['"][^>]*>\$?([\d.,]+)/i);
const price = priceMatch ? priceMatch[1].trim() : "";
const ratingMatch = html.match(/class=['"]a-icon-alt['"][^>]*>([^<]+)</i);
const rating = ratingMatch ? ratingMatch[1].trim() : "";
return [
{
json: {
title,
price,
rating
},
},
];
};
ステップ4. Google スプレッドシートに接続する
次に、クリーンアップして構造化されたデータをGoogleスプレッドシートに出力することを選択できます。Googleスプレッドシートノードを追加し、Googleスプレッドシート接続を構成するだけです。
注意:事前にGoogleスプレッドシートを作成してください。
出力結果の例
これは、Scrapelessの設定と使用方法に関する簡単なチュートリアルです。ご質問がある場合は、Scrapeless Discordで自由に議論してください。