
最近热衷于找一些好玩的MCP,集成在cursor中,给大模型外挂许多有趣的功能,在开发的代码的同时,在IDE中可以获得更多的乐趣。例如:
今天要分享的 mcp server:Playwright,提供了浏览器自动化能力,能够通过结构化的可访问性快照与网页进行交互,可以实现表单填写、页面跳转、网页数据提取、保存网页为PDF等操作.
在 Cursor 的 Cursor Settings 中找到 MCP。

点击右侧上方的 Add new global MCP server 按钮,便自动打开 .local 目录下的 mcp.json 文件,我们将两个 mcp server 的json信息粘贴进去.
{
"mcpServers": {
"playwright": {
"command": "npx",
"args": [
"@playwright/mcp@latest"
]
}
}
}在MCP页面就可以看到配置的 mcp server 信息。

可以看到 Playwright 的一些tool,列表如下:
browser_press_key:模拟按下键盘上的某个键
我们使用 Playwright 来做一些常见的浏览器操作。
我们在cursor的chat中要求打开一个网站。

playwright 启动一个chrome浏览器,并调用了 browser_navigate 打开一个网页,结果如下:

输入 进入腾讯云开发者社区,大模型搜索到网站,playwright 进入网站。

在浏览器中就进入到了腾讯云开发者社区。

输入提示词,搜索我的(叫我阿柒啊)个人主页。

如上图所示,通过 browser_snapshot 获取页面快照,然后调用 browser_type 输入搜索文本到搜索框中,最后通过多次 browser_clik 点击动作完成页面的跳转,结果如下图:

同时,在跳转到个人主页之后,playwright 还提取了主页的用户信息、排名信息和文章内容等。

表单填写是我们常见的一个场景,这里开发了一个表单页面:

在cursor中我们输入表单地址和填写的内容:

playwright 多次调用 browser_type 输入搜索文本到搜索框中。

在提示词中输入 保存pdf,playwright 会将当前页面所有的内容(包括下拉才能展示的)保存为 PDF。

我们打开PDF,如图可以看到页面已经被保存。

playwright 提供了强大的浏览器交互能力,结合大模型可以帮我们完成很多的事情。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。