代理
简介
代理系统是抓取浏览器的一个组件,用于通过代理服务器转发连接。它主要用于防止 IP 被封禁、访问受地理限制的内容以及增强匿名性。抓取浏览器提供可配置的代理系统,允许对自动化流量路由进行精确控制,包括匿名性、地理位置定向和更高的可靠性,从而轻松将代理集成到您的工作流程中。
核心功能
代理系统的核心功能在于通过中间服务器隐藏真实 IP 地址,并自动或按需轮换 IP 池中的不同地址。它还允许选择特定地理位置的代理服务器,模拟来自世界不同地区的用户访问。
应用场景
主要适用于需要大规模数据抓取以及绕过目标网站 IP 限制或封锁的场景。它也是访问受地理限制的内容以及在市场调研等任务中保持在线匿名性的关键工具。
分类
使用 Scrapeless,您有两种代理配置选项:
- 使用内置代理:轻松通过我们管理的住宅代理路由流量。
- 使用自定义代理:使用自定义的 HTTP/HTTPS/SOCKS5 代理,以更灵活地控制网络路由。
操作指南
使用内置代理
使用抓取浏览器的内置代理,流量将通过其管理的住宅代理进行路由。
const { ScrapelessClient } = require('@scrapeless-ai/sdk');
const puppeteer = require('puppeteer-core');
const client = new ScrapelessClient({ apiKey: 'API Key' });
const { browserWSEndpoint } = client.browser.create({
sessionName: 'sdk_test',
sessionTTL: 180,
proxyCountry: 'AU',
proxyState: 'NSW', // Optional: state code
proxyCity: 'sydney', // Optional: city name
sessionRecording: true,
});
(async () => {
const browser = await puppeteer.connect({ browserWSEndpoint });
const page = await browser.newPage();
await page.goto('https://www.scrapeless.com');
console.log(await page.title());
await browser.close();
})();地理位置代理选择
我们的内置代理网络覆盖全球 195 个国家和地区,可为您的抓取操作实现精确的地理定位。每个代理位置都经过性能和可靠性优化,允许您模拟来自特定地区的真实用户访问。
有关全面的国家和地区选择(包括州/省和城市级定位),请参阅我们的详细代理文档。
自定义代理
如果您想使用自己的代理服务/提供商,可以在创建会话时指定以下参数。如果您使用自己的代理提供商,将不会产生代理使用费用。
注意: 使用 SDK 生成代理时,您无需显式指定用户名和密码。您只需关注生成的代理连接 URL 即可。
提示: 如果您已有代理,只需在需要的位置传入完整的代理 URL 作为参数即可。
- 💡自定义代理功能目前仅对订阅用户开放。在此升级
const { ScrapelessClient } = require('@scrapeless-ai/sdk');
const puppeteer =require('puppeteer-core');
const client = new ScrapelessClient({ apiKey: 'API Key' });
const proxyUrl = client.proxies.proxy({
country: 'US',
sessionDuration: 30, // session duration
sessionId: 'test-session-123', // custom proxy sessionId
gateway: 'gw-us.scrapeless.io:8789' // allowed value: `gw-us.scrapeless.io:8789`, `gw-eu.scrapeless.io:8789`, `gw-ap.scrapeless.io:8789`
});
console.log(proxyUrl)我们云浏览器的内置代理仅支持住宅类型,更适合大规模数据提取操作。我们还单独提供多种代理类型,包括住宅代理、数据中心代理、静态 ISP 代理和 IPv6 代理,并支持更精细的配置。您也可以独立购买我们的代理并将其注入云浏览器,以匹配更多样化的使用场景。例如,如果您需要在会话间保持一致且专用的 IP 地址,可以购买我们的静态 ISP 代理。 指南