让 AI 帮你操作浏览器,browser-use 到底怎么用
browser-use 是目前最火的 AI 浏览器自动化 Skill。它做的事很简单:让 AI 替你操作浏览器。
browser-use 是目前最火的 AI 浏览器自动化 Skill。它做的事很简单:让 AI 替你操作浏览器。
比如你可以说,「帮我去某个网站填个表」,它就真的打开浏览器,找到输入框,一个一个填进去,点提交。你说「帮我把这个网页上的数据抓下来」,它就自己翻页、定位、提取,最后给你整理好。
装法很简单。用 Claude Code、Trae、OpenCode 或者 Cursor 这些 AI 编程工具,把 GitHub 地址告诉 AI,跟它说:
帮我安装 browser-use 这个 Skill:https://github.com/browser-use/browser-use
装好之后你就可以直接给 AI 下任务了。如果你不确定怎么用,直接问 AI 就行,比如你可以说「教我怎么连接我自己的 Chrome 浏览器」或者「帮我用 browser-use 抓取某个网页的数据」,AI 会一步一步带你搞定。
那 AI 是怎么「看懂」一个网页的?
这是 browser-use 很聪明的一个设计。它会把当前页面上所有可以点击、可以输入的元素提取出来,每个元素标上一个编号。AI 拿到这份清单之后,就知道编号 5 是用户名输入框,编号 6 是密码框,编号 7 是登录按钮。然后 AI 只需要按编号操作,在 5 里输入用户名,在 6 里输入密码,点击 7,登录就完成了。
你想想看,不管网页多复杂,对 AI 来说都变成了「看清单,选编号,执行动作」这三步。AI 不需要理解网页图形,一份编号清单就够了。