首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

browser-use --让AI的Agent控制你的电脑浏览器

*大家好,我是AI拉呱,一个专注于人工智领域与网络安全方面的博主,现任资深算法研究员一职,热爱机器学习和深度学习算法应用,拥有丰富的AI项目经验,希望和你一起成长交流。关注AI拉呱一起学习更多AI知识。

browser-use:轻量高效的浏览器信息检测工具

browser-use是一个专注于浏览器环境检测的 JavaScript 库,帮助开发者快速获取用户的浏览器类型、版本、操作系统及设备信息,支持现代浏览器和主流旧版浏览器,适用于兼容性适配、用户行为分析、功能特性判断等场景。

愿景

告诉电脑你想做什么,它就能帮你完成。

路线图

代理功能

改进代理记忆(总结、压缩、RAG等)

增强规划能力(加载网站特定上下文)

降低Token消耗(系统提示、DOM状态优化)

DOM提取

优化日期选择器、下拉菜单、特殊元素的提取

改进UI元素的状态表示

任务重试

大语言模型作为备用方案

简化工作流模板定义(LLM填充细节)

从代理返回Playwright脚本

快速开始

使用pip安装(Python>=3.11):

pip install browser-use

安装Playwright:

playwright install chromium

启动你的代理:

from langchain_openai import ChatOpenAI

from browser_use import Agent

import asyncio

from dotenv import load_dotenv

load_dotenv()

async def main():

  agent = Agent(

      task="比较gpt-4o和DeepSeek-V3的价格",

      llm=ChatOpenAI(model="gpt-4o"),

  )

  await agent.run()

asyncio.run(main())

将你使用的服务提供商API密钥添加到.env文件:

OPENAI_API_KEY=

ANTHROPIC_API_KEY=

AZURE_ENDPOINT=

AZURE_OPENAI_API_KEY=

GEMINI_API_KEY=

DEEPSEEK_API_KEY=

更多设置、模型和细节,查看 文档 。

带UI测试

你可以使用 带UI的仓库 测试Browser-use,或直接运行Gradio示例:

pip install gradio

python examples/ui/gradio_demo.py

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OeViWr1eyX7neZM8rM847HAA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券