Scraping Browser特徴高度なプライバシーと防止防止カスタムフィンガープリント

カスタムフィンガープリント

はじめに

ブラウザフィンガープリントは、ブラウザとデバイスの設定情報を利用して、ほぼ一意の「デジタルフィンガープリント」を作成します。これにより、Cookie を使用しなくてもオンラインアクティビティを追跡できます。良いニュースは、スクレイピングブラウザではフィンガープリントの設定がオプションであることです。ブラウザユーザーエージェント、タイムゾーン、言語、画面解像度などのコアパラメータを含む、ブラウザフィンガープリントの高度なカスタマイズ機能を提供しています。機能はカスタムスタートアップパラメータによって拡張できます。これは、scrapeless の自己構築Chromiumブラウザを使用して検出を完全に回避する、複数アカウント管理、データ収集、プライバシー保護などのシナリオに適しています。デフォルトでは、当社のスクレイピングブラウザサービスを使用すると、各セッションに対してランダムなフィンガープリントが生成されます。

コア機能と制限事項

ユーザーエージェント制御

  • 機能: HTTPリクエストヘッダーのユーザーエージェント文字列のカスタマイズをサポートし、ブラウザエンジンバージョンとオペレーティングシステムの種類を定義できます。
  • 制限: 現在、レンダリングエンジンの詳細(例:WebGLレンダリング機能)を変更することはできません。

画面解像度マッピング

  • 機能: screen.widthscreen.height の戻り値のカスタマイズをサポートし、基本的なデバイスの画面サイズをシミュレートします(物理的なアスペクト比に準拠する必要があります)。
  • 制限: 現在、デバイスピクセル比(DPR)またはRetinaスクリーンの特性を偽造することはできません。

プラットフォーム属性のロック

  • 機能: navigator.platform の固定された戻り値を設定できます(Windows/macOS/Linuxのみサポート)。これは、ブラウザの機能検出ロジックに影響します。
  • 制限: 現在、オペレーティングシステムのバージョン番号やハードウェアアーキテクチャ情報を変更することはできません。

その他の制限:

この機能は、ブラウザによってネイティブに公開される標準化されたパラメータへの限定的な調整のみをサポートします。ハードウェアレベルのフィンガープリントや高度な動作マスキングは含まれていません。

アプリケーションシナリオ

  • 基本的な複数アカウントの分離: ユーザーエージェントと画面解像度を区別することで、単純なアカウント関連付けの検出を回避します。
  • 軽負荷データ収集: 主流のブラウザ環境(Windows + Chrome)をシミュレートして、ターゲットウェブサイトの基本的な反スクレイピング戦略(例:ユーザーエージェントブラックリスト)をバイパスします。
  • 互換性テスト: さまざまなオペレーティングシステム(Windows/macOS)と画面サイズでのウェブサイトの基本的なレンダリングロジックを確認します。

操作ガイド

フィンガープリントパラメータの説明

パラメータ名タイプ説明
userAgentstringブラウザのHTTPリクエストヘッダー内のユーザーエージェント文字列を定義します。ブラウザエンジン、バージョン番号、オペレーティングシステムなどの主要な識別情報が含まれています。ウェブサイトはこの値を使用してクライアント環境を識別し、コンテンツの適応と機能に影響を与えます。デフォルト値:ブラウザに従います
platformenumJavaScript の navigator.platform プロパティの戻り値を指定し、実行環境のオペレーティングシステムの種類を示します。「Windows」、「macOS」、「Linux」がオプションの値です。このパラメータは、機能検出とシステム関連機能の有効化判定に使用されます。デフォルト値:Windows
screenobjectブラウザによって報告されるディスプレイデバイスの物理特性パラメータを定義し、JavaScript の window.screen オブジェクトに直接マップされます。
screen.widthnumber物理的な画面幅(ピクセル)。screen.width プロパティにマップされ、メディアクエリとレスポンシブレイアウトに影響を与えます。デフォルト値:ランダムフィンガープリントに従い、最小値は640です。
screen.heightnumber物理的な画面高さ(ピクセル)。screen.height プロパティにマップされ、幅と合わせてデバイスの解像度特性を決定します。デフォルト値:ランダムフィンガープリントに従い、最小値は480です。
localizationobject言語、地域、タイムゾーンパラメータを含むブラウザのローカリゼーション環境設定を制御し、表示形式とコンテンツのローカリゼーション動作に影響を与えます。
localization.timezonestringIANA タイムゾーンデータベース形式に準拠したタイムゾーン識別子(例:「Asia/Shanghai」)。JavaScript の日付オブジェクトと Intl.DateTimeFormat の出力のデフォルトのタイムゾーン動作を制御します。これは、タイムゾーンフィンガープリントの重要なコンポーネントです。デフォルト値:America/New_York
localization.languages[string]ブラウザのサポートされている言語の優先順位リスト。navigator.languages プロパティとHTTP Accept-Language リクエストヘッダーにマップされ、ウェブサイトのコンテンツ言語選択ロジックを決定します。デフォルト値:「en」、「en-US」

userAgent

タイプ: string 説明: ブラウザのHTTPリクエストヘッダー内のユーザーエージェント文字列を定義します。ブラウザエンジン、バージョン番号、オペレーティングシステムなどの主要な識別情報が含まれています。ウェブサイトはこの値を使用してクライアント環境を識別し、コンテンツの適応と機能に影響を与えます。

例:

  • Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/132.0.6834.83 Safari/537.36
  • Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/132.0.6834.83 Safari/537.36

platform

タイプ: enum 説明: JavaScript の navigator.platform プロパティの戻り値を指定し、実行環境のオペレーティングシステムの種類を示します。このパラメータは、機能検出とシステム関連機能の有効化判定に使用されます。

許容される値の例:

説明
”Windows”Windows オペレーティングシステム、デフォルト値
”macOS”macOS オペレーティングシステム
”Linux”Linux オペレーティングシステム

screen

タイプ: object 説明: ブラウザによって報告されるディスプレイデバイスの物理特性パラメータを定義し、JavaScript の window.screen オブジェクトに直接マップされます。

screen.width: 物理的な画面幅(ピクセル)。メディアクエリとレスポンシブレイアウトに影響を与えます。最小値は640です。 screen.height: 物理的な画面高さ(ピクセル)。幅と合わせてデバイスの解像度特性を決定します。最小値は480です。

例:

widthheight
19201080
1366768
1280720
7681280

localization

タイプ: object 説明: 言語、地域、タイムゾーンパラメータを含むブラウザのローカリゼーション環境設定を制御し、表示形式とコンテンツのローカリゼーション動作に影響を与えます。

localization.timezone: IANA タイムゾーンデータベース形式に準拠したタイムゾーン識別子。JavaScript の日付オブジェクトと Intl.DateTimeFormat の出力のデフォルトのタイムゾーン動作を制御します。

例:

  • America/New_York
  • Asia/Shanghai
  • Europe/London

localization.languages: ブラウザのサポートされている言語の優先順位リスト。navigator.languages プロパティとHTTP Accept-Language リクエストヘッダーにマップされ、ウェブサイトのコンテンツ言語選択ロジックを決定します。

例:

  • ["fr-FR", "en-US", "zh-CN"]
  • ["en-US", "es-ES", "de-DE"]

参照: tz データベースのタイムゾーン一覧

コード例

const puppeteer =require('puppeteer-core');
 
// custom browser fingerprint
const fingerprint = {
    userAgent: 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/134.1.2.3 Safari/537.36',
    platform: 'Windows',
    screen: {
        width: 1280, height: 1024
    },
    localization: {
        languages: ['zh-HK', 'en-US', 'en'], timezone: 'Asia/Hong_Kong',
    }
}
 
const query = new URLSearchParams({
  token: 'APIKey',// required
  session_ttl: 180,
  proxy_country: 'ANY',
  fingerprint: encodeURIComponent(JSON.stringify(fingerprint)),
});
 
const connectionURL = `wss://browser.scrapeless.com/browser?${query.toString()}`;
 
(async () => {
    const browser = await puppeteer.connect({browserWSEndpoint: connectionURL});
    const page = await browser.newPage();
    await page.goto('https://www.scrapeless.com');
    const info = await page.evaluate(() => {
        return {
            screen: {
                width:screen.width,
                height:screen.height,
            },
            userAgent:navigator.userAgent,
            timeZone: Intl.DateTimeFormat().resolvedOptions().timeZone,
            languages:navigator.languages
        };
    });
console.log(info);
    await browser.close();
})();

倫理規定

責任あるフィンガープリントのカスタマイズを提唱します。

  • 法的に許可されたシナリオ(企業データコンプライアンスの収集、内部リスク管理テストなど)の場合のみ使用してください。
  • 偽造されたフィンガープリントを使用してオンライン詐欺に関与したり、ユーザーのプライバシーを侵害したりすることは禁止されています。