एकीकरण
पुपेटियर
स्क्रैपिंग ब्राउज़र एक उच्च-प्रदर्शन सर्वरलेस प्लेटफ़ॉर्म प्रदान करता है जो गतिशील वेबसाइटों से डेटा निकालने की प्रक्रिया को सरल बनाने के लिए डिज़ाइन किया गया है। पुपेटियर के साथ सहज एकीकरण से, डेवलपर समर्पित सर्वर संसाधनों के बिना हेडलेस ब्राउज़र चला सकते हैं, प्रबंधित कर सकते हैं और उनकी निगरानी कर सकते हैं, जिससे कुशल वेब ऑटोमेशन और डेटा संग्रह प्राप्त होता है।
आवश्यक लाइब्रेरीज़ स्थापित करें
सबसे पहले, puppeteer-core
स्थापित करें, जो पुपेटियर का हल्का संस्करण है, जिसे मौजूदा ब्राउज़र उदाहरणों से कनेक्ट करने के लिए डिज़ाइन किया गया है:
npm install puppeteer-core
स्क्रैपिंग ब्राउज़र से कनेक्ट करने के लिए कोड लिखें
अपने पुपेटियर कोड में, निम्न विधि का उपयोग करके स्क्रैपिंग ब्राउज़र से कनेक्ट करें:
const puppeteer = require('puppeteer-core');
const connectionURL = 'wss://browser.scrapeless.com/browser?token=APIKey&session_ttl=180&proxy_country=ANY';
(async () => {
const browser = await puppeteer.connect({browserWSEndpoint: connectionURL});
const page = await browser.newPage();
await page.goto('https://www.scrapeless.com');
console.log(await page.title());
await browser.close();
})();
इस तरह, आप स्क्रैपिंग ब्राउज़र के इन्फ्रास्ट्रक्चर का लाभ उठा सकते हैं, जिसमें स्केलेबिलिटी, आईपी रोटेशन और वैश्विक पहुँच शामिल है।
व्यावहारिक उदाहरण
स्क्रैपिंग ब्राउज़र के साथ एकीकृत करने के बाद कुछ सामान्य पुपेटियर ऑपरेशन यहां दिए गए हैं:
- नेविगेशन और पृष्ठ सामग्री निष्कर्षण
const page = await browser.newPage();
await page.goto('https://www.example.com');
console.log(await page.title());
const html = await page.content();
console.log(html);
await browser.close();
- स्क्रीनशॉट कैप्चर करना
const page = await browser.newPage();
await page.goto('https://www.example.com');
await page.screenshot({ path: 'example.png' });
console.log('Screenshot saved as example.png');
await browser.close();
- कस्टम स्क्रिप्ट चलाना
const page = await browser.newPage();
await page.goto('https://www.example.com');
const result = await page.evaluate(() => document.title);
console.log('Page title:', result);
await browser.close();
प्लेराइट
स्क्रैपिंग ब्राउज़र एक उच्च-प्रदर्शन सर्वरलेस प्लेटफ़ॉर्म प्रदान करता है जो गतिशील वेबसाइटों से डेटा निकालने की प्रक्रिया को सरल बनाने के लिए डिज़ाइन किया गया है। प्लेराइट के साथ सहज एकीकरण से, डेवलपर समर्पित सर्वर संसाधनों के बिना हेडलेस ब्राउज़र चला सकते हैं, प्रबंधित कर सकते हैं और उनकी निगरानी कर सकते हैं, जिससे कुशल वेब ऑटोमेशन और डेटा संग्रह प्राप्त होता है।
आवश्यक लाइब्रेरीज़ स्थापित करें
सबसे पहले, playwright-core
स्थापित करें, जो प्लेराइट का हल्का संस्करण है, जिसका उपयोग मौजूदा ब्राउज़र उदाहरणों से कनेक्ट करने के लिए किया जाता है:
npm install playwright-core
स्क्रैपिंग ब्राउज़र से कनेक्ट करने के लिए कोड लिखें
प्लेराइट कोड में, निम्न विधि का उपयोग करके स्क्रैपिंग ब्राउज़र से कनेक्ट करें:
const { chromium } = require('playwright-core');
const connectionURL = 'wss://browser.scrapeless.com/browser?token=APIKey&session_ttl=180&proxy_country=ANY';
(async () => {
const browser = await chromium.connectOverCDP(connectionURL);
const page = await browser.newPage();
await page.goto('https://www.scrapeless.com');
console.log(await page.title());
await browser.close();
})();
यह आपको स्क्रैपिंग ब्राउज़र के इन्फ्रास्ट्रक्चर का लाभ उठाने की अनुमति देता है, जिसमें स्केलेबिलिटी, आईपी रोटेशन और वैश्विक पहुँच शामिल है।
व्यावहारिक उदाहरण
स्क्रैपिंग ब्राउज़र के साथ एकीकृत करने के बाद कुछ सामान्य प्लेराइट ऑपरेशन यहां दिए गए हैं:
- नेविगेशन और पृष्ठ सामग्री निष्कर्षण
const page = await browser.newPage();
await page.goto('https://www.example.com');
console.log(await page.title());
const html = await page.content();
console.log(html);
await browser.close();
- स्क्रीनशॉट कैप्चर करना
const page = await browser.newPage();
await page.goto('https://www.example.com');
await page.screenshot({ path: 'example.png' });
console.log('Screenshot saved as example.png');
await browser.close();
- कस्टम स्क्रिप्ट चलाना
const page = await browser.newPage();
await page.goto('https://www.example.com');
const result = await page.evaluate(() => document.title);
console.log('Page title:', result);
await browser.close();
ये कोड उदाहरण दर्शाते हैं कि स्क्रैपिंग ब्राउज़र से कनेक्ट करने और उसे हेरफेर करने के लिए playwright-core का उपयोग कैसे करें।