浏览器 MCP
Scrapeless 浏览器 MCP 服务器 可将 ChatGPT、Claude 等模型以及 Cursor、Windsurf 等工具无缝连接到广泛的外部功能,包括:
- 浏览器自动化,用于页面级别的导航和交互
- 抓取动态、大量使用 JS 的网站——导出为 HTML、Markdown 或截图
| MCP 类型 | 技术栈 | 优势 | 主要生态系统 | 最佳用途 |
|---|---|---|---|---|
| Chrome DevTools MCP | Node.js / Puppeteer | 官方标准,健壮,深度性能分析工具。 | 广泛(Gemini, Copilot, Cursor) | CI/CD 自动化,跨 IDE 工作流,以及深度性能审计。 |
| Playwright MCP | Node.js / Playwright | 使用可访问性树而非像素;确定性且无需视觉即可与 LLM 友好。 | 广泛(VS Code, Copilot) | 可靠、结构化的自动化,不易因微小的 UI 变化而中断。 |
| Scrapeless 浏览器 MCP | 云服务 | 零本地设置,可扩展的云浏览器,处理复杂网站和反机器人措施。 | API 驱动(任何客户端) | 大规模、并行自动化任务,以及与具有强力机器人检测的网站进行交互。 |
支持的 MCP 工具
| 名称 | 描述 |
|---|---|
| browser_create | 使用 Scrapeless 创建或重用云浏览器会话。 |
| browser_close | 通过断开云浏览器连接来关闭当前会话。 |
| browser_goto | 导航浏览器到指定 URL。 |
| browser_go_back | 在浏览器历史记录中后退一步。 |
| browser_go_forward | 在浏览器历史记录中前进一步。 |
| browser_click | 点击页面上的特定元素。 |
| browser_type | 在指定的输入字段中键入文本。 |
| browser_press_key | 模拟按键操作。 |
| browser_wait_for | 等待特定的页面元素出现。 |
| browser_wait | 暂停执行一段固定时间。 |
| browser_screenshot | 捕获当前页面的截图。 |
| browser_get_html | 获取当前页面的完整 HTML。 |
| browser_get_text | 获取当前页面所有可见文本。 |
| browser_scroll | 滚动到页面底部。 |
| browser_scroll_to | 将特定元素滚动到视图中。 |
| scrape_html | 抓取 URL 并返回其完整的 HTML 内容。 |
| scrape_markdown | 抓取 URL 并将其内容以 Markdown 格式返回。 |
| scrape_screenshot | 捕获任何网页的高质量截图。 |
入门指南
获取您的 Scrapeless API 密钥
登录 Scrapeless 并获取您的 API 令牌。

配置您的 MCP 客户端
Scrapeless MCP 服务器支持 Stdio 和流式 HTTP (Streamable HTTP) 两种传输模式。
🖥️ Stdio (本地执行)
{
"mcpServers": {
"Scrapeless MCP Server": {
"command": "npx",
"args": ["-y", "scrapeless-mcp-server"],
"env": {
"SCRAPELESS_KEY": "YOUR_SCRAPELESS_KEY"
}
}
}
}
🌐 流式 HTTP (托管 API 模式)
{
"mcpServers": {
"Scrapeless MCP Server": {
"type": "streamable-http",
"url": "https://api.scrapeless.com/mcp",
"headers": {
"x-api-token": "YOUR_SCRAPELESS_KEY"
},
"disabled": false,
"alwaysAllow": []
}
}
}
高级选项
使用可选参数自定义浏览器会话行为。这些可以通过环境变量(对于 Stdio)或 HTTP 头(对于流式 HTTP)进行设置:
| Stdio (环境变量) | 流式 HTTP (HTTP 头) | 描述 |
|---|---|---|
| BROWSER_PROFILE_ID | x-browser-profile-id | 指定可重用的浏览器配置文件 ID 以保持会话连续性。 |
| BROWSER_PROFILE_PERSIST | x-browser-profile-persist | 启用 cookie、本地存储等持久化存储。 |
| BROWSER_SESSION_TTL | x-browser-session-ttl | 定义会话的最大超时时间(秒)。会话将在不活动达到此持续时间后自动过期。 |
用例
网页抓取与数据收集
- 电商监控:自动访问商品页面,收集价格、库存状态和描述。
- 市场研究:批量抓取新闻、评论或公司页面进行分析和比较。
- 内容聚合:提取页面内容、帖子和评论进行集中收集。
- 潜在客户生成:从企业网站或目录中收集联系信息和公司详情。
测试与质量保证
- 功能验证:使用点击、输入和元素等待来确保页面行为符合预期。
- 用户旅程测试:模拟真实用户交互(输入、点击、滚动)以验证工作流程。
- 回归测试支持:捕获关键页面的截图并进行比较,以检测 UI 或内容变化。
任务与工作流自动化
- 表单填写:自动完成并提交网页表单(例如,注册、调查)。
- 数据捕获与报告生成:定期提取页面数据并保存为 HTML 或截图以进行分析。
- 简单管理任务:使用模拟点击和输入自动化重复的后端或基于网络的任务。
案例展示
案例 1:使用 Claude 进行网页交互和数据提取自动化
使用浏览器 MCP 服务器,Claude 可以通过对话命令执行复杂的网页操作——例如导航、点击、滚动和数据抓取——并通过实时会话进行实时执行预览。

案例 2:绕过 Cloudflare 获取目标页面内容
使用浏览器 MCP 服务器,Cloudflare 保护的页面被自动访问,完成后,页面内容被提取并以 Markdown 格式返回。

一个云浏览器,无限集成
Chrome DevTools MCP、Playwright MCP 和 Scrapeless 浏览器 MCP——它们共享一个基础:它们都连接到 Scrapeless 云浏览器。
与传统的本地浏览器自动化不同,Scrapeless 浏览器完全在****云端运行,为开发人员和 AI 代理提供无与伦比的灵活性和可扩展性。
以下是其真正强大的原因:
- 无缝集成:与 Puppeteer、Playwright 和 CDP 完全兼容,只需一行代码即可轻松从现有项目迁移。
- 全球 IP 覆盖:访问遍布 195+ 国家/地区的住宅、ISP 和无限 IP 池,价格透明且经济高效(0.6–1.8 美元/GB)。非常适合大规模网络数据自动化。
- 隔离配置文件:每个任务都在专用、持久的环境中运行,确保会话隔离、多账户管理和长期稳定性。
- 无限并发扩展:通过自动扩展基础设施,即时启动 50–1000+ 个浏览器实例——无需服务器设置,无性能瓶颈。
- 全球边缘节点:部署在多个全球节点上,实现超低延迟,启动速度比其他云浏览器快 2-3 倍。
- 反检测:内置 reCAPTCHA、Cloudflare Turnstile 和 AWS WAF 解决方案,即使在严格的保护层下也能确保自动化不中断。
- 可视化调试:通过实时视图(Live View)实现人机交互式调试和实时代理流量监控。通过会话录像(Session Recordings)逐页重放会话,快速识别问题并优化操作。
集成
Claude 桌面版
- 打开 Claude 桌面版
- 导航至:
设置→工具→MCP 服务器 - 点击“添加 MCP 服务器”
- 粘贴上方
Stdio或流式 HTTP配置 - 保存并启用服务器
- Claude 现在将能够使用 Scrapeless 发出网页查询、提取内容并与页面交互
Cursor IDE
- 打开 Cursor
- 按下
Cmd + Shift + P并搜索:配置 MCP 服务器 - 使用上方格式添加 Scrapeless MCP 配置
- 保存文件并重启 Cursor(如果需要)
- 现在您可以向 Cursor 提出如下问题:
"在 StackOverflow 上搜索此错误的解决方案""抓取此页面的 HTML"
- 它将在后台使用 Scrapeless。