UI-TARS 桌面版添加福利群:解决AI开发者的「MCP实战痛点」[2025-03-18] 我们发布了一款新桌面应用程序的技术预览版本——Agent TARS,这是一个多模态AI代理,通过视觉解析网页并无缝集成命令行和文件系统来利用浏览器操作。
UI-TARS 桌面版是一款基于 UI-TARS(视觉语言模型) 的图形用户界面代理应用程序,允许您使用自然语言控制计算机。
   📑 论文   
| 🤗 Hugging Face 模型  
|   🫨 Discord  
|   🤖 ModelScope  
🖥️ 桌面应用程序   
|    👓 Midscene(在浏览器中使用)   
|   
| 指令 | 视频 |
|---|---|
| 请帮我打开 VS Code 的自动保存功能,并在 VS Code 设置中将自动保存操作延迟 500 毫秒。 | |
| 你能帮我查看 UI-TARS-Desktop 项目在 GitHub 上的最新开放问题吗? |
请参阅 快速开始。
请参阅 部署。
请参阅 CONTRIBUTING.md。
请参阅 @ui-tars/sdk
UI-TARS 桌面版遵循 Apache 2.0 许可证。
如果您在研究中发现我们的论文和代码有用,请考虑给予星标 :star: 和引用 :pencil:
@article{qin2025ui, title={UI-TARS: Pioneering Automated GUI Interaction with Native Agents}, author={Qin, Yujia and Ye, Yining and Fang, Junjie and Wang, Haoming and Liang, Shihao and Tian, Shizuo and Zhang, Junda and Li, Jiahao and Li, Yunxin and Huang, Shijue and others}, journal={arXiv preprint arXiv:2501.12326}, year={2025} }