Playwright

स्क्रैपिंग ब्राउज़र एक उच्च-प्रदर्शन सर्वरलेस प्लेटफ़ॉर्म प्रदान करता है जो गतिशील वेबसाइटों से डेटा निष्कर्षण की प्रक्रिया को सरल बनाने के लिए डिज़ाइन किया गया है। Playwright के साथ सहज एकीकरण के माध्यम से, डेवलपर्स समर्पित सर्वर संसाधनों की आवश्यकता के बिना हेडलेस ब्राउज़र चला सकते हैं, प्रबंधित कर सकते हैं और उनकी निगरानी कर सकते हैं, जिससे कुशल वेब ऑटोमेशन और डेटा संग्रह संभव होता है।

आवश्यक लाइब्रेरीज़ स्थापित करना

सबसे पहले, playwright-core स्थापित करें, जो मौजूदा ब्राउज़र उदाहरणों से कनेक्ट करने के लिए उपयोग किया जाने वाला Playwright का एक हल्का संस्करण है:

npm install playwright-core

स्क्रैपिंग ब्राउज़र से कनेक्ट करने के लिए कोड लिखना

अपने Playwright कोड में, निम्न का उपयोग करके स्क्रैपिंग ब्राउज़र से कनेक्ट करें:

const { chromium } = require('playwright-core');
const connectionURL = 'wss://browser.scrapeless.com/browser?token=APIKey&session_ttl=180&proxy_country=ANY';
 
(async () => {
    const browser = await chromium.connectOverCDP(connectionURL);
    const page = await browser.newPage();
    await page.goto('https://www.scrapeless.com');
    console.log(await page.title());
    await browser.close();
})();
 

यह आपको स्केलेबिलिटी, आईपी रोटेशन और वैश्विक पहुँच सहित स्क्रैपिंग ब्राउज़र के बुनियादी ढाँचे का लाभ उठाने की अनुमति देता है।

व्यावहारिक उदाहरण

स्क्रैपिंग ब्राउज़र को एकीकृत करने के बाद कुछ सामान्य Playwright संचालन इस प्रकार हैं:

  1. नेविगेशन और पृष्ठ सामग्री निष्कर्षण
const page = await browser.newPage();
await page.goto('https://www.example.com');
console.log(await page.title());
const html = await page.content();
console.log(html);
await browser.close();
 
  1. स्क्रीनशॉट लेना
const page = await browser.newPage();
await page.goto('https://www.example.com');
await page.screenshot({ path: 'example.png' });
console.log('Screenshot saved as example.png');
await browser.close();
 
  1. कस्टम कोड चलाना
const page = await browser.newPage();
await page.goto('https://www.example.com');
const result = await page.evaluate(() => document.title);
console.log('Page title:', result);
await browser.close();