*大家好,我是AI拉呱,一个专注于人工智领域与网络安全方面的博主,现任资深算法研究员一职,热爱机器学习和深度学习算法应用,拥有丰富的AI项目经验,希望和你一起成长交流。关注AI拉呱一起学习更多AI知识。
browser-use:轻量高效的浏览器信息检测工具
browser-use是一个专注于浏览器环境检测的 JavaScript 库,帮助开发者快速获取用户的浏览器类型、版本、操作系统及设备信息,支持现代浏览器和主流旧版浏览器,适用于兼容性适配、用户行为分析、功能特性判断等场景。
愿景
告诉电脑你想做什么,它就能帮你完成。
路线图
代理功能
改进代理记忆(总结、压缩、RAG等)
增强规划能力(加载网站特定上下文)
降低Token消耗(系统提示、DOM状态优化)
DOM提取
优化日期选择器、下拉菜单、特殊元素的提取
改进UI元素的状态表示
任务重试
大语言模型作为备用方案
简化工作流模板定义(LLM填充细节)
从代理返回Playwright脚本
快速开始
使用pip安装(Python>=3.11):
pip install browser-use
安装Playwright:
playwright install chromium
启动你的代理:
from langchain_openai import ChatOpenAI
from browser_use import Agent
import asyncio
from dotenv import load_dotenv
load_dotenv()
async def main():
agent = Agent(
task="比较gpt-4o和DeepSeek-V3的价格",
llm=ChatOpenAI(model="gpt-4o"),
)
await agent.run()
asyncio.run(main())
将你使用的服务提供商API密钥添加到.env文件:
OPENAI_API_KEY=
ANTHROPIC_API_KEY=
AZURE_ENDPOINT=
AZURE_OPENAI_API_KEY=
GEMINI_API_KEY=
DEEPSEEK_API_KEY=
更多设置、模型和细节,查看 文档 。
带UI测试
你可以使用 带UI的仓库 测试Browser-use,或直接运行Gradio示例:
pip install gradio
python examples/ui/gradio_demo.py
领取专属 10元无门槛券
私享最新 技术干货