<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>表格识别 on Text Matrix</title><link>https://0f9f3b1c.text-matrix.pages.dev/tags/%E8%A1%A8%E6%A0%BC%E8%AF%86%E5%88%AB/</link><description>Recent content in 表格识别 on Text Matrix</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Wed, 08 Apr 2026 11:10:11 +0800</lastBuildDate><atom:link href="https://0f9f3b1c.text-matrix.pages.dev/tags/%E8%A1%A8%E6%A0%BC%E8%AF%86%E5%88%AB/index.xml" rel="self" type="application/rss+xml"/><item><title>PaddleOCR：全球领先 OCR 工具包与文档 AI 引擎完全指南</title><link>https://0f9f3b1c.text-matrix.pages.dev/posts/tech/tools/paddleocr-ocr-document-ai-engine-guide/</link><pubDate>Wed, 01 Apr 2026 01:23:00 +0800</pubDate><guid>https://0f9f3b1c.text-matrix.pages.dev/posts/tech/tools/paddleocr-ocr-document-ai-engine-guide/</guid><description>&lt;h1 id="paddleocr全球领先-ocr-工具包与文档-ai-引擎完全指南">PaddleOCR：全球领先 OCR 工具包与文档 AI 引擎完全指南&lt;/h1>
&lt;h2 id="1-学习目标">§1 学习目标&lt;/h2>
&lt;p>完成本文档后，你将能够：&lt;/p>
&lt;ul>
&lt;li>✅ 理解 PaddleOCR 的定位与设计理念&lt;/li>
&lt;li>✅ 掌握 PaddleOCR 的核心功能与使用方法&lt;/li>
&lt;li>✅ 部署和配置 PaddleOCR 开发环境&lt;/li>
&lt;li>✅ 使用 PP-OCR 系列进行文本识别&lt;/li>
&lt;li>✅ 使用 PaddleOCR-VL 进行文档智能解析&lt;/li>
&lt;li>✅ 使用 PP-StructureV3 进行文档结构化&lt;/li>
&lt;li>✅ 优化推理性能和生产部署&lt;/li>
&lt;li>✅ 集成到 RAG 和 Agent 应用&lt;/li>
&lt;/ul>
&lt;hr>
&lt;h2 id="2-项目概述">§2 项目概述&lt;/h2>
&lt;h3 id="21-什么是-paddleocr">2.1 什么是 PaddleOCR？&lt;/h3>
&lt;p>&lt;strong>PaddleOCR&lt;/strong>（&lt;a href="https://github.com/PaddlePaddle/PaddleOCR" target="_blank" rel="noopener noreffer ">GitHub 仓库&lt;/a>）是百度飞桨团队开发的&lt;strong>全球领先 OCR 工具包与文档 AI 引擎&lt;/strong>，可将 PDF 文档和图像转换为结构化的、LLM 可用的数据（JSON/Markdown），具有行业领先的准确率。&lt;/p></description></item><item><title>Chandra OCR：复杂表格、表单与手写内容的终极识别解决方案</title><link>https://0f9f3b1c.text-matrix.pages.dev/posts/tech/tools/chandra-ocr-complex-document-recognition/</link><pubDate>Sun, 29 Mar 2026 12:00:00 +0800</pubDate><guid>https://0f9f3b1c.text-matrix.pages.dev/posts/tech/tools/chandra-ocr-complex-document-recognition/</guid><description>&lt;h1 id="chandra-ocr复杂表格表单与手写内容的终极识别解决方案">Chandra OCR：复杂表格、表单与手写内容的终极识别解决方案&lt;/h1>
&lt;blockquote>
&lt;p>&lt;strong>难度&lt;/strong>：⭐⭐（进阶）
&lt;strong>目标读者&lt;/strong>：需要处理复杂文档（表格、表单、手写）的开发者与企业用户
&lt;strong>前置知识&lt;/strong>：了解 OCR 基本概念，有 Python 开发经验
&lt;strong>预计阅读时间&lt;/strong>：约 20 分钟&lt;/p></description></item></channel></rss>