自定义指纹
简介
浏览器指纹利用您的浏览器和设备配置信息来创建几乎独一无二的“数字指纹”,即使没有 cookie 也能用于追踪您的在线活动。好消息是,在爬虫浏览器中,指纹配置是可选的。我们为浏览器指纹提供深度自定义功能,例如浏览器用户代理、时区、语言和屏幕分辨率等核心参数。功能可以通过自定义启动参数进行扩展。这适用于多账号管理、数据收集和隐私保护等场景,利用 scrapeless 自建的 Chromium 浏览器完全避免检测。默认情况下,使用我们的爬虫浏览器服务将为每个会话生成一个随机指纹。
核心功能与局限性
User-Agent 控制
- 能力: 支持自定义 HTTP 请求头中的 User-Agent 字符串,允许定义浏览器引擎版本和操作系统类型。
- 局限: 目前无法修改渲染引擎的细节(例如 WebGL 渲染特性)。
屏幕分辨率映射
- 能力: 支持自定义
screen.width和screen.height的返回值,以模拟基本的设备屏幕尺寸(必须符合物理宽高比)。 - 局限: 目前无法伪造设备像素比(DPR)或 Retina 屏幕特性。
平台属性锁定
- 能力: 允许为
navigator.platform设置固定的返回值(仅支持 Windows/macOS/Linux),这会影响浏览器功能检测逻辑。 - 局限: 目前无法修改操作系统版本号或硬件架构信息。
其他局限:
此功能仅支持对浏览器原生暴露的标准化参数进行有限调整。它不涉及硬件级别的指纹识别或高级行为伪装。
应用场景
- 基础多账号隔离: 通过区分 User-Agent 和屏幕分辨率,避免简单的账号关联检测。
- 轻量级数据收集: 模拟主流浏览器环境(Windows + Chrome),绕过目标网站的基本反爬策略(例如 User-Agent 黑名单)。
- 兼容性测试: 验证网站在不同操作系统(Windows/macOS)和屏幕尺寸下的基本渲染逻辑。
操作指南
指纹参数说明
| 参数名称 | 类型 | 描述 |
|---|---|---|
| userAgent | string | 定义浏览器 HTTP 请求头中的 User-Agent 字符串,包含浏览器引擎、版本号和操作系统等关键识别信息。网站使用此值来识别客户端环境,影响内容适配和功能。默认值:遵循浏览器 |
| platform | enum | 指定 JavaScript navigator.platform 属性的返回值,指示运行时环境的操作系统类型。可选值为 “Windows”、“macOS” 或 “Linux”。此参数将用于功能检测和系统相关功能的启用判断。默认值:Windows |
| screen | object | 定义浏览器报告的显示设备的物理特性参数,直接映射到 JavaScript window.screen 对象。 |
| screen.width | number | 物理屏幕宽度(像素),映射到 screen.width 属性,影响媒体查询和响应式布局。默认值:遵循随机指纹,最小值为 640。 |
| screen.height | number | 物理屏幕高度(像素),映射到 screen.height 属性,与宽度一起决定设备分辨率特性。默认值:遵循随机指纹,最小值为 480。 |
| localization | object | 控制浏览器的本地化环境配置,包括语言、区域和时区参数,影响显示格式和内容本地化行为。 |
| localization.basedOnIp | boolean | 是否根据 IP 自动设置时区和语言。 |
| localization.timezone | string | 符合 IANA 时区数据库格式的时区标识符(例如“Asia/Shanghai”),控制 JavaScript 日期对象和 Intl.DateTimeFormat 输出的默认时区行为,是时区指纹的关键组成部分。默认值:America/New_York |
| localization.languages | [string] | 浏览器支持的语言优先级列表,映射到 navigator.languages 属性和 HTTP Accept-Language 请求头,决定网站内容语言的选择逻辑。默认值:“en”,“en-US” |
| args | object | 使用命令行开关运行浏览器(例如 --window-size、--proxy-bypass-list 等,了解更多),请注意,不支持以下参数:--load-extension、--user-data-dir、--fonts-dir、--remote-debugging-port |
userAgent
类型:string
描述:定义浏览器 HTTP 请求头中的 User-Agent 字符串,包含浏览器引擎、版本号和操作系统等关键识别信息。网站使用此值来识别客户端环境,影响内容适配和功能。
示例值:
Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/132.0.6834.83 Safari/537.36Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/132.0.6834.83 Safari/537.36
platform
类型:enum
描述:指定 JavaScript navigator.platform 属性的返回值,指示运行时环境的操作系统类型。此参数将用于功能检测和系统相关功能的启用判断。
可接受示例值:
| 值 | 描述 |
|---|---|
| ”Windows” | Windows 操作系统,默认值 |
| ”macOS” | macOS 操作系统 |
| ”Linux” | Linux 操作系统 |
screen
类型:object
描述:定义浏览器报告的显示设备的物理特性参数,直接映射到 JavaScript window.screen 对象。
screen.width:物理屏幕宽度(像素),影响媒体查询和响应式布局,最小值为 640。 screen.height:物理屏幕高度(像素),与宽度一起决定设备分辨率特性,最小值为 480。
示例值:
| 宽度 | 高度 |
|---|---|
| 1920 | 1080 |
| 1366 | 768 |
| 1280 | 720 |
| 768 | 1280 |
localization
类型:object
描述:控制浏览器的本地化环境配置,包括语言、区域和时区参数,影响显示格式和内容本地化行为。
localization.basedOnIp:是否根据 IP 自动设置时区和语言。
localization.timezone:符合 IANA 时区数据库格式的时区标识符,控制 JavaScript 日期对象和 Intl.DateTimeFormat 输出的默认时区行为,是时区指纹的关键组成部分。
示例值:
America/New_YorkAsia/ShanghaiEurope/London
localization.languages:浏览器支持的语言优先级列表,映射到 navigator.languages 属性和 HTTP Accept-Language 请求头,决定网站内容语言的选择逻辑。
示例值:
["fr-FR", "en-US", "zh-CN"]["en-US", "es-ES", "de-DE"]
参考:tz 数据库时区列表
args
类型:object
描述:使用命令行开关运行浏览器,点击了解更多,请注意,不支持以下参数:--load-extension、--user-data-dir、--fonts-dir、--remote-debugging-port
示例值:
- 代理绕过:
'--proxy-bypass-list': 'example.com' - 设置窗口大小:
'--window-size': '1280,1024',建议与screen指纹设置相同
示例代码
const { ScrapelessClient } = require('@scrapeless-ai/sdk');
const puppeteer =require('puppeteer-core');
const client = new ScrapelessClient({ apiKey: 'API Key' });
// custom browser fingerprint
const fingerprint = {
userAgent: 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/134.1.2.3 Safari/537.36',
platform: 'Windows',
screen: {
width: 1280, height: 1024
},
localization: {
languages: ['zh-HK', 'en-US', 'en'], timezone: 'Asia/Hong_Kong',
},
args: {
'--proxy-bypass-list': 'example.com',
'--window-size': '1280,1024' // set window size as the same as the screen fingerprint
}
}
// Create browser session and get WebSocket endpoint
const { browserWSEndpoint } = client.browser.create({
sessionName: 'sdk_test',
sessionTTL: 180,
proxyCountry: 'US',
sessionRecording: true,
fingerprint,
});
(async () => {
const browser = await puppeteer.connect({browserWSEndpoint});
const page = await browser.newPage();
await page.goto('https://www.scrapeless.com');
const info = await page.evaluate(() => {
return {
screen: {
width:screen.width,
height:screen.height,
},
userAgent:navigator.userAgent,
timeZone: Intl.DateTimeFormat().resolvedOptions().timeZone,
languages:navigator.languages
};
});
console.log(info);
await browser.close();
})();道德声明
我们倡导负责任的指纹定制:
- 仅用于合法授权的场景(例如企业数据合规收集、内部风控测试)。
- 严禁使用伪造指纹从事网络欺诈或侵犯用户隐私。