Browser集成Browser MCP

浏览器 MCP

Scrapeless 浏览器 MCP 服务器 可将 ChatGPT、Claude 等模型以及 Cursor、Windsurf 等工具无缝连接到广泛的外部功能,包括:

  • 浏览器自动化,用于页面级别的导航和交互
  • 抓取动态、大量使用 JS 的网站——导出为 HTML、Markdown 或截图
MCP 类型技术栈优势主要生态系统最佳用途
Chrome DevTools MCPNode.js / Puppeteer官方标准,健壮,深度性能分析工具。广泛(Gemini, Copilot, Cursor)CI/CD 自动化,跨 IDE 工作流,以及深度性能审计。
Playwright MCPNode.js / Playwright使用可访问性树而非像素;确定性且无需视觉即可与 LLM 友好。广泛(VS Code, Copilot)可靠、结构化的自动化,不易因微小的 UI 变化而中断。
Scrapeless 浏览器 MCP云服务零本地设置,可扩展的云浏览器,处理复杂网站和反机器人措施。API 驱动(任何客户端)大规模、并行自动化任务,以及与具有强力机器人检测的网站进行交互。

支持的 MCP 工具

名称描述
browser_create使用 Scrapeless 创建或重用云浏览器会话。
browser_close通过断开云浏览器连接来关闭当前会话。
browser_goto导航浏览器到指定 URL。
browser_go_back在浏览器历史记录中后退一步。
browser_go_forward在浏览器历史记录中前进一步。
browser_click点击页面上的特定元素。
browser_type在指定的输入字段中键入文本。
browser_press_key模拟按键操作。
browser_wait_for等待特定的页面元素出现。
browser_wait暂停执行一段固定时间。
browser_screenshot捕获当前页面的截图。
browser_get_html获取当前页面的完整 HTML。
browser_get_text获取当前页面所有可见文本。
browser_scroll滚动到页面底部。
browser_scroll_to将特定元素滚动到视图中。
scrape_html抓取 URL 并返回其完整的 HTML 内容。
scrape_markdown抓取 URL 并将其内容以 Markdown 格式返回。
scrape_screenshot捕获任何网页的高质量截图。

入门指南

获取您的 Scrapeless API 密钥

登录 Scrapeless 并获取您的 API 令牌

获取 API 密钥

配置您的 MCP 客户端

Scrapeless MCP 服务器支持 Stdio 和流式 HTTP (Streamable HTTP) 两种传输模式。

🖥️ Stdio (本地执行)

{
  "mcpServers": {
    "Scrapeless MCP Server": {
      "command": "npx",
      "args": ["-y", "scrapeless-mcp-server"],
      "env": {
        "SCRAPELESS_KEY": "YOUR_SCRAPELESS_KEY"
      }
    }
  }
}
 

🌐 流式 HTTP (托管 API 模式)

{
  "mcpServers": {
    "Scrapeless MCP Server": {
      "type": "streamable-http",
      "url": "https://api.scrapeless.com/mcp",
      "headers": {
        "x-api-token": "YOUR_SCRAPELESS_KEY"
      },
      "disabled": false,
      "alwaysAllow": []
    }
  }
}
 

高级选项

使用可选参数自定义浏览器会话行为。这些可以通过环境变量(对于 Stdio)或 HTTP 头(对于流式 HTTP)进行设置:

Stdio (环境变量)流式 HTTP (HTTP 头)描述
BROWSER_PROFILE_IDx-browser-profile-id指定可重用的浏览器配置文件 ID 以保持会话连续性。
BROWSER_PROFILE_PERSISTx-browser-profile-persist启用 cookie、本地存储等持久化存储。
BROWSER_SESSION_TTLx-browser-session-ttl定义会话的最大超时时间(秒)。会话将在不活动达到此持续时间后自动过期。

用例

网页抓取与数据收集

  • 电商监控:自动访问商品页面,收集价格、库存状态和描述。
  • 市场研究:批量抓取新闻、评论或公司页面进行分析和比较。
  • 内容聚合:提取页面内容、帖子和评论进行集中收集。
  • 潜在客户生成:从企业网站或目录中收集联系信息和公司详情。

测试与质量保证

  • 功能验证:使用点击、输入和元素等待来确保页面行为符合预期。
  • 用户旅程测试:模拟真实用户交互(输入、点击、滚动)以验证工作流程。
  • 回归测试支持:捕获关键页面的截图并进行比较,以检测 UI 或内容变化。

任务与工作流自动化

  • 表单填写:自动完成并提交网页表单(例如,注册、调查)。
  • 数据捕获与报告生成:定期提取页面数据并保存为 HTML 或截图以进行分析。
  • 简单管理任务:使用模拟点击和输入自动化重复的后端或基于网络的任务。

案例展示

案例 1:使用 Claude 进行网页交互和数据提取自动化

使用浏览器 MCP 服务器,Claude 可以通过对话命令执行复杂的网页操作——例如导航、点击、滚动和数据抓取——并通过实时会话进行实时执行预览。

浏览器 MCP 案例 1

案例 2:绕过 Cloudflare 获取目标页面内容

使用浏览器 MCP 服务器,Cloudflare 保护的页面被自动访问,完成后,页面内容被提取并以 Markdown 格式返回。

浏览器 MCP 案例 2

一个云浏览器,无限集成

Chrome DevTools MCP、Playwright MCP 和 Scrapeless 浏览器 MCP——它们共享一个基础:它们都连接到 Scrapeless 云浏览器

与传统的本地浏览器自动化不同,Scrapeless 浏览器完全在****云端运行,为开发人员和 AI 代理提供无与伦比的灵活性和可扩展性。

以下是其真正强大的原因:

  • 无缝集成:与 PuppeteerPlaywrightCDP 完全兼容,只需一行代码即可轻松从现有项目迁移。
  • 全球 IP 覆盖:访问遍布 195+ 国家/地区的住宅、ISP 和无限 IP 池,价格透明且经济高效(0.6–1.8 美元/GB)。非常适合大规模网络数据自动化。
  • 隔离配置文件:每个任务都在专用、持久的环境中运行,确保会话隔离、多账户管理和长期稳定性。
  • 无限并发扩展:通过自动扩展基础设施,即时启动 50–1000+ 个浏览器实例——无需服务器设置,无性能瓶颈。
  • 全球边缘节点:部署在多个全球节点上,实现超低延迟,启动速度比其他云浏览器快 2-3 倍
  • 反检测:内置 reCAPTCHACloudflare TurnstileAWS WAF 解决方案,即使在严格的保护层下也能确保自动化不中断。
  • 可视化调试:通过实时视图(Live View)实现人机交互式调试和实时代理流量监控。通过会话录像(Session Recordings)逐页重放会话,快速识别问题并优化操作。

集成

Claude 桌面版

  1. 打开 Claude 桌面版
  2. 导航至:设置工具MCP 服务器
  3. 点击“添加 MCP 服务器”
  4. 粘贴上方 Stdio流式 HTTP 配置
  5. 保存并启用服务器
  6. Claude 现在将能够使用 Scrapeless 发出网页查询、提取内容并与页面交互

Cursor IDE

  1. 打开 Cursor
  2. 按下 Cmd + Shift + P 并搜索:配置 MCP 服务器
  3. 使用上方格式添加 Scrapeless MCP 配置
  4. 保存文件并重启 Cursor(如果需要)
  5. 现在您可以向 Cursor 提出如下问题:
    1. "在 StackOverflow 上搜索此错误的解决方案"
    2. "抓取此页面的 HTML"
  6. 它将在后台使用 Scrapeless。