Proxy
Giới thiệu
Hệ thống proxy là một thành phần của trình duyệt cào dữ liệu, có chức năng chuyển tiếp kết nối thông qua máy chủ proxy. Nó chủ yếu được sử dụng để ngăn chặn việc chặn IP, truy cập nội dung bị giới hạn theo khu vực địa lý và tăng cường tính ẩn danh. Scraping Browser cung cấp hệ thống proxy có thể cấu hình, cho phép kiểm soát chính xác việc định tuyến lưu lượng truy cập tự động, bao gồm ẩn danh, nhắm mục tiêu theo vị trí địa lý và độ tin cậy cao hơn, giúp việc tích hợp proxy vào quy trình làm việc của bạn trở nên dễ dàng.
Khả năng cốt lõi
Khả năng cốt lõi của hệ thống proxy nằm ở việc ẩn địa chỉ IP thực thông qua máy chủ trung gian và tự động hoặc theo yêu cầu xoay vòng qua các địa chỉ khác nhau trong một nhóm IP. Nó cũng cho phép chọn máy chủ proxy tại các vị trí địa lý cụ thể, mô phỏng truy cập người dùng từ nhiều khu vực khác nhau trên thế giới.
Các tình huống ứng dụng
Chủ yếu áp dụng cho các tình huống yêu cầu cào dữ liệu quy mô lớn và vượt qua các hạn chế hoặc chặn IP từ trang web mục tiêu. Đây cũng là công cụ then chốt để truy cập nội dung bị giới hạn theo khu vực và duy trì tính ẩn danh trực tuyến trong các tác vụ như nghiên cứu thị trường.
Phân loại
Với Scrapeless, bạn có hai tùy chọn cấu hình proxy:
- Sử dụng proxy tích hợp sẵn: Dễ dàng định tuyến lưu lượng truy cập thông qua proxy dân cư do chúng tôi quản lý.
- Sử dụng proxy tùy chỉnh: Sử dụng proxy HTTP/HTTPS/SOCKS5 tùy chỉnh để kiểm soát linh hoạt hơn việc định tuyến mạng.
Hướng dẫn vận hành
Sử dụng Proxy Tích hợp sẵn
Việc sử dụng proxy tích hợp sẵn của Scraping Browser sẽ định tuyến lưu lượng truy cập thông qua proxy dân cư do chúng tôi quản lý.
const { ScrapelessClient } = require('@scrapeless-ai/sdk');
const puppeteer = require('puppeteer-core');
const client = new ScrapelessClient({ apiKey: 'API Key' });
const { browserWSEndpoint } = client.browser.create({
sessionName: 'sdk_test',
sessionTTL: 180,
proxyCountry: 'AU',
proxyState: 'NSW', // Optional: state code
proxyCity: 'sydney', // Optional: city name
sessionRecording: true,
});
(async () => {
const browser = await puppeteer.connect({ browserWSEndpoint });
const page = await browser.newPage();
await page.goto('https://www.scrapeless.com');
console.log(await page.title());
await browser.close();
})();Lựa chọn Proxy theo Khu vực Địa lý
Mạng lưới proxy tích hợp sẵn của chúng tôi trải rộng khắp 195 quốc gia và vùng lãnh thổ trên toàn thế giới, cho phép nhắm mục tiêu địa lý chính xác cho các hoạt động cào dữ liệu của bạn. Mỗi vị trí proxy đều được tối ưu hóa về hiệu suất và độ tin cậy, giúp bạn mô phỏng truy cập người dùng thực tế từ các khu vực cụ thể.
Để biết danh sách đầy đủ các quốc gia và khu vực, bao gồm cả nhắm mục tiêu theo cấp bang và thành phố, vui lòng tham khảo tài liệu chi tiết về proxy.
Proxy Tùy chỉnh
Nếu bạn muốn sử dụng dịch vụ/nhà cung cấp proxy của riêng mình, bạn có thể chỉ định các tham số sau khi tạo phiên. Nếu sử dụng nhà cung cấp proxy riêng, bạn sẽ không bị tính phí cho việc sử dụng proxy.
Lưu ý: Khi sử dụng SDK để tạo proxy, bạn không cần chỉ định rõ tên người dùng và mật khẩu. Bạn chỉ cần tập trung vào URL kết nối proxy được tạo ra.
Mẹo: Nếu bạn đã có sẵn proxy, bạn chỉ cần truyền URL proxy đầy đủ làm tham số tại nơi cần thiết.
- 💡Tính năng proxy tùy chỉnh hiện chỉ khả dụng cho người đăng ký. Nâng cấp tại đây
const { ScrapelessClient } = require('@scrapeless-ai/sdk');
const puppeteer =require('puppeteer-core');
const client = new ScrapelessClient({ apiKey: 'API Key' });
const proxyUrl = client.proxies.proxy({
country: 'US',
sessionDuration: 30, // session duration
sessionId: 'test-session-123', // custom proxy sessionId
gateway: 'gw-us.scrapeless.io:8789' // allowed value: `gw-us.scrapeless.io:8789`, `gw-eu.scrapeless.io:8789`, `gw-ap.scrapeless.io:8789`
});
console.log(proxyUrl)Proxy tích hợp sẵn của trình duyệt đám mây của chúng tôi chỉ hỗ trợ loại dân cư, phù hợp hơn cho các hoạt động trích xuất dữ liệu quy mô lớn. Chúng tôi cũng cung cấp riêng biệt nhiều loại proxy khác nhau bao gồm Proxy dân cư, Proxy trung tâm dữ liệu, Proxy ISP tĩnh và Proxy IPv6, với hỗ trợ cấu hình chi tiết hơn. Bạn cũng có thể mua proxy của chúng tôi độc lập và tích hợp chúng vào trình duyệt đám mây để phù hợp với nhiều tình huống sử dụng đa dạng hơn. Ví dụ: nếu bạn cần một địa chỉ IP ổn định và dành riêng xuyên suốt các phiên, bạn có thể mua Proxy ISP tĩnh của chúng tôi. Hướng dẫn