浏览器 MCP

Scrapeless 浏览器 MCP 服务器可将 ChatGPT、Claude 等模型以及 Cursor、Windsurf 等工具无缝连接到广泛的外部功能，包括：

浏览器自动化，用于页面级别的导航和交互
抓取动态、大量使用 JS 的网站——导出为 HTML、Markdown 或截图

MCP 类型	技术栈	优势	主要生态系统	最佳用途
Chrome DevTools MCP	Node.js / Puppeteer	官方标准，健壮，深度性能分析工具。	广泛（Gemini, Copilot, Cursor）	CI/CD 自动化，跨 IDE 工作流，以及深度性能审计。
Playwright MCP	Node.js / Playwright	使用可访问性树而非像素；确定性且无需视觉即可与 LLM 友好。	广泛（VS Code, Copilot）	可靠、结构化的自动化，不易因微小的 UI 变化而中断。
Scrapeless 浏览器 MCP	云服务	零本地设置，可扩展的云浏览器，处理复杂网站和反机器人措施。	API 驱动（任何客户端）	大规模、并行自动化任务，以及与具有强力机器人检测的网站进行交互。

支持的 MCP 工具

名称	描述
browser_create	使用 Scrapeless 创建或重用云浏览器会话。
browser_close	通过断开云浏览器连接来关闭当前会话。
browser_goto	导航浏览器到指定 URL。
browser_go_back	在浏览器历史记录中后退一步。
browser_go_forward	在浏览器历史记录中前进一步。
browser_click	点击页面上的特定元素。
browser_type	在指定的输入字段中键入文本。
browser_press_key	模拟按键操作。
browser_wait_for	等待特定的页面元素出现。
browser_wait	暂停执行一段固定时间。
browser_screenshot	捕获当前页面的截图。
browser_get_html	获取当前页面的完整 HTML。
browser_get_text	获取当前页面所有可见文本。
browser_scroll	滚动到页面底部。
browser_scroll_to	将特定元素滚动到视图中。
scrape_html	抓取 URL 并返回其完整的 HTML 内容。
scrape_markdown	抓取 URL 并将其内容以 Markdown 格式返回。
scrape_screenshot	捕获任何网页的高质量截图。

入门指南

获取您的 Scrapeless API 密钥

获取 API 密钥

配置您的 MCP 客户端

Scrapeless MCP 服务器支持 Stdio 和流式 HTTP (Streamable HTTP) 两种传输模式。

🖥️ Stdio (本地执行)

{
  "mcpServers": {
    "Scrapeless MCP Server": {
      "command": "npx",
      "args": ["-y", "scrapeless-mcp-server"],
      "env": {
        "SCRAPELESS_KEY": "YOUR_SCRAPELESS_KEY"
      }
    }
  }
}

🌐 流式 HTTP (托管 API 模式)

{
  "mcpServers": {
    "Scrapeless MCP Server": {
      "type": "streamable-http",
      "url": "https://api.scrapeless.com/mcp",
      "headers": {
        "x-api-token": "YOUR_SCRAPELESS_KEY"
      },
      "disabled": false,
      "alwaysAllow": []
    }
  }
}

高级选项

使用可选参数自定义浏览器会话行为。这些可以通过环境变量（对于 Stdio）或 HTTP 头（对于流式 HTTP）进行设置：

Stdio (环境变量)	流式 HTTP (HTTP 头)	描述
BROWSER_PROFILE_ID	x-browser-profile-id	指定可重用的浏览器配置文件 ID 以保持会话连续性。
BROWSER_PROFILE_PERSIST	x-browser-profile-persist	启用 cookie、本地存储等持久化存储。
BROWSER_SESSION_TTL	x-browser-session-ttl	定义会话的最大超时时间（秒）。会话将在不活动达到此持续时间后自动过期。

用例

网页抓取与数据收集

电商监控：自动访问商品页面，收集价格、库存状态和描述。
市场研究：批量抓取新闻、评论或公司页面进行分析和比较。
内容聚合：提取页面内容、帖子和评论进行集中收集。
潜在客户生成：从企业网站或目录中收集联系信息和公司详情。

测试与质量保证

功能验证：使用点击、输入和元素等待来确保页面行为符合预期。
用户旅程测试：模拟真实用户交互（输入、点击、滚动）以验证工作流程。
回归测试支持：捕获关键页面的截图并进行比较，以检测 UI 或内容变化。

任务与工作流自动化

表单填写：自动完成并提交网页表单（例如，注册、调查）。
数据捕获与报告生成：定期提取页面数据并保存为 HTML 或截图以进行分析。
简单管理任务：使用模拟点击和输入自动化重复的后端或基于网络的任务。

案例展示

案例 1：使用 Claude 进行网页交互和数据提取自动化

使用浏览器 MCP 服务器，Claude 可以通过对话命令执行复杂的网页操作——例如导航、点击、滚动和数据抓取——并通过实时会话进行实时执行预览。

浏览器 MCP 案例 1

案例 2：绕过 Cloudflare 获取目标页面内容

使用浏览器 MCP 服务器，Cloudflare 保护的页面被自动访问，完成后，页面内容被提取并以 Markdown 格式返回。

浏览器 MCP 案例 2

一个云浏览器，无限集成

Chrome DevTools MCP、Playwright MCP 和 Scrapeless 浏览器 MCP——它们共享一个基础：它们都连接到 Scrapeless 云浏览器。

与传统的本地浏览器自动化不同，Scrapeless 浏览器完全在****云端运行，为开发人员和 AI 代理提供无与伦比的灵活性和可扩展性。

以下是其真正强大的原因：

无缝集成：与 Puppeteer、Playwright 和 CDP 完全兼容，只需一行代码即可轻松从现有项目迁移。
全球 IP 覆盖：访问遍布 195+ 国家/地区的住宅、ISP 和无限 IP 池，价格透明且经济高效（0.6–1.8 美元/GB）。非常适合大规模网络数据自动化。
隔离配置文件：每个任务都在专用、持久的环境中运行，确保会话隔离、多账户管理和长期稳定性。
无限并发扩展：通过自动扩展基础设施，即时启动 50–1000+ 个浏览器实例——无需服务器设置，无性能瓶颈。
全球边缘节点：部署在多个全球节点上，实现超低延迟，启动速度比其他云浏览器快 2-3 倍。
反检测：内置 reCAPTCHA、Cloudflare Turnstile 和 AWS WAF 解决方案，即使在严格的保护层下也能确保自动化不中断。
可视化调试：通过实时视图（Live View）实现人机交互式调试和实时代理流量监控。通过会话录像（Session Recordings）逐页重放会话，快速识别问题并优化操作。

集成

Claude 桌面版

打开 Claude 桌面版
导航至：设置 → 工具 → MCP 服务器
点击“添加 MCP 服务器”
粘贴上方 Stdio 或 流式 HTTP 配置
保存并启用服务器
Claude 现在将能够使用 Scrapeless 发出网页查询、提取内容并与页面交互

Cursor IDE

打开 Cursor
按下 Cmd + Shift + P 并搜索：配置 MCP 服务器
使用上方格式添加 Scrapeless MCP 配置
保存文件并重启 Cursor（如果需要）
现在您可以向 Cursor 提出如下问题：
1. "在 StackOverflow 上搜索此错误的解决方案"
2. "抓取此页面的 HTML"
它将在后台使用 Scrapeless。

Playwright MCP 优化成本