<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>浏览器自动化 on Text Matrix</title><link>https://0f9f3b1c.text-matrix.pages.dev/tags/%E6%B5%8F%E8%A7%88%E5%99%A8%E8%87%AA%E5%8A%A8%E5%8C%96/</link><description>Recent content in 浏览器自动化 on Text Matrix</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Wed, 08 Apr 2026 11:10:11 +0800</lastBuildDate><atom:link href="https://0f9f3b1c.text-matrix.pages.dev/tags/%E6%B5%8F%E8%A7%88%E5%99%A8%E8%87%AA%E5%8A%A8%E5%8C%96/index.xml" rel="self" type="application/rss+xml"/><item><title>xiaohongshu-skills：958 Stars的浏览器自动化方案，用真实账号做小红书运营</title><link>https://0f9f3b1c.text-matrix.pages.dev/posts/tech/xiaohongshu-skills-browser-automation-guide/</link><pubDate>Tue, 07 Apr 2026 18:10:00 +0800</pubDate><guid>https://0f9f3b1c.text-matrix.pages.dev/posts/tech/xiaohongshu-skills-browser-automation-guide/</guid><description>&lt;h1 id="xiaohongshu-skills958-stars的浏览器自动化方案">xiaohongshu-skills：958 Stars的浏览器自动化方案&lt;/h1>
&lt;h2 id="项目概述">项目概述&lt;/h2>
&lt;p>&lt;strong>xiaohongshu-skills&lt;/strong>是由autoclaw-cc团队开发的开源项目，核心特点是「直接使用你已登录的浏览器和真实账号，以普通用户的方式操作小红书」。与xiaohongshu-mcp-skills不同，本项目采用&lt;strong>Chrome扩展+浏览器自动化&lt;/strong>的技术路线，而非MCP服务接口。&lt;/p></description></item><item><title>Page Agent：阿里巴巴开源的网页内置 GUI Agent</title><link>https://0f9f3b1c.text-matrix.pages.dev/posts/tech/page-agent-alibaba-gui-agent-guide/</link><pubDate>Mon, 06 Apr 2026 21:20:00 +0800</pubDate><guid>https://0f9f3b1c.text-matrix.pages.dev/posts/tech/page-agent-alibaba-gui-agent-guide/</guid><description>&lt;h2 id="学习目标">学习目标&lt;/h2>
&lt;p>通过本文，你将全面掌握以下核心能力：&lt;/p>
&lt;ul>
&lt;li>深入理解 Page Agent 的项目定位、技术架构和设计理念&lt;/li>
&lt;li>掌握在网页中集成 Page Agent 的两种方式（CDN 一行代码 + NPM）&lt;/li>
&lt;li>学会使用文本化 DOM 操作进行自然语言浏览器控制&lt;/li>
&lt;li>理解 MCP Server 的架构和外部控制能力&lt;/li>
&lt;li>掌握 Chrome 扩展实现多页面 Agent 的方法&lt;/li>
&lt;li>理解与 browser-use 的差异化定位&lt;/li>
&lt;/ul>
&lt;hr>
&lt;h2 id="1-项目概述">1. 项目概述&lt;/h2>
&lt;h3 id="11-是什么">1.1 是什么&lt;/h3>
&lt;p>Page Agent 是阿里巴巴开源的&lt;strong>网页内置 GUI Agent&lt;/strong>，核心理念是：&lt;strong>The GUI Agent Living in Your Webpage&lt;/strong>——让网页拥有自己的 AI Agent，通过自然语言控制网页界面。&lt;/p></description></item><item><title>Browser-Use：让 AI Agent 控制浏览器完成任何任务</title><link>https://0f9f3b1c.text-matrix.pages.dev/posts/tech/browser-use-ai-browser-automation-guide/</link><pubDate>Mon, 06 Apr 2026 20:12:00 +0800</pubDate><guid>https://0f9f3b1c.text-matrix.pages.dev/posts/tech/browser-use-ai-browser-automation-guide/</guid><description>&lt;h2 id="学习目标">学习目标&lt;/h2>
&lt;p>通过本文，你将全面掌握以下核心能力：&lt;/p>
&lt;ul>
&lt;li>深入理解 Browser-Use 的项目定位、技术架构和工作原理&lt;/li>
&lt;li>掌握在 Python 项目中安装、配置和使用 Browser-Use&lt;/li>
&lt;li>学会使用 CLI 工具进行快速浏览器自动化&lt;/li>
&lt;li>掌握为 Claude Code 安装 Browser-Use Skill 的方法&lt;/li>
&lt;li>理解自定义工具（Tools）的扩展方法&lt;/li>
&lt;li>学会处理认证、CAPTCHA 和生产环境部署&lt;/li>
&lt;li>理解 Open Source 与 Cloud 的权衡选择&lt;/li>
&lt;/ul>
&lt;hr>
&lt;h2 id="1-项目概述">1. 项目概述&lt;/h2>
&lt;h3 id="11-是什么">1.1 是什么&lt;/h3>
&lt;p>Browser-Use 是一个&lt;strong>开源的 AI 浏览器自动化库&lt;/strong>，它的核心理念是：&lt;strong>Tell your computer what to do, and it gets it done&lt;/strong>——告诉计算机要做什么，它就能完成。&lt;/p></description></item></channel></rss>