今天在咖啡店刷新闻时,偶然看到一款自称“AI浏览器”的产品。它的界面和普通浏览器几乎没有区别,唯一的不同是左下角多了一个对话框,随时可以召唤AI帮忙点开链接、填表单、甚至把页面内容转成笔记。于是我忍不住想,这玩意儿会不会把我们常用的独立Agent给挤出市场?
把AI嵌进浏览器,本质上是把“看网页”这件事变成了“对话式操作”。比如在购物时,突然想把商品参数复制到Excel,只要说一句“帮我把这页的规格表格导出”,AI立马抓取页面元素、生成表格并下载。整个过程不需要打开额外的工具,也不必手动复制粘贴,省下的时间往往比等咖啡冲好要多。
传统Agent通常是先在聊天框里写好完整的指令,然后交给模型去执行。它们擅长一次性解决复杂任务,比如写代码、生成报告,却需要提前把需求拆解好。若在执行过程中突然出现“页面弹窗要验证码”之类的意外,Agent往往卡在那儿,需要人再去补充信息。也就是说,它们更像是“计划驱动”,对实时的网页变化适应度不高。
想象一下,你在浏览新闻时看到一段数据想进一步分析,AI浏览器可以立刻把这段文字当作上下文,打开相关图表页面并把数据导入分析工具;而如果你已经准备好一整套营销报告,需要模型帮你写文案、排版、校对,那传统Agent的强大算力和可编程性就更合适。两者其实是互补的,一个解决“我刚想要”,一个解决“我已经想好要”。
我朋友的HR最近要在十几所高校官网填企业信息,传统做法是打开每个页面手动敲字段,耗时近半天。她装了AI浏览器后,只需把企业资料上传,指令“一键填完所有页面”,AI就能识别每个表单的标签、匹配字段并提交,整个过程不到十五分钟。相反,若要让OpenClaw完成同样的任务,需要先写好API调用、设置Cookie、调试脚本,门槛明显更高。于是我不禁想,或许在日常的“临时需求”里,AI浏览器已经比传统Agent更实用,真正的竞争点在于场景的多样性和使用的门槛。
你觉得,未来的工作流会不会更多地围绕浏览器展开,而把独立的Agent relegated to “特定专业任务”呢?
所有资源来源于网络,如有侵权请联系站长。
参与讨论
那个填表单的功能确实爽,之前手动填这些玩意儿快把人逼疯。