Skip to content

Commit 0f2feb7

Browse files
Update README.md (PaddlePaddle#15235)
1 parent a628e26 commit 0f2feb7

File tree

1 file changed

+28
-30
lines changed

1 file changed

+28
-30
lines changed

README.md

Lines changed: 28 additions & 30 deletions
Original file line numberDiff line numberDiff line change
@@ -1,11 +1,10 @@
11
<div align="center">
22
<p>
3-
<a href="https://paddlepaddle.github.io/PaddleOCR/latest/en/index.html" target="_blank">
43
<img width="100%" src="./docs/images/Banner_cn.png" alt="PaddleOCR Banner"></a>
54
</p>
65

76
<!-- language -->
8-
[English](./README_en.md) | 简体中文| [日本語](./README_ja.md)
7+
中文 | [English](./README_en.md) | [日本語](./README_ja.md)
98

109
<!-- icon -->
1110

@@ -27,14 +26,13 @@
2726
PaddleOCR自发布以来凭借学术前沿算法和产业落地实践,受到了产学研各方的喜爱,并被广泛应用于众多知名开源项目,例如:Umi-OCR、OmniParser、MinerU、RAGFlow等,已成为广大开发者心中的开源OCR领域的首选工具。2025年5月20日,飞桨团队发布**PaddleOCR 3.0**,全面适配**飞桨框架3.0正式版**,进一步**提升文字识别精度**,支持**多文字类型识别****手写体识别**,满足大模型应用对**复杂文档高精度解析**的旺盛需求,结合**文心大模型4.5 Turbo**显著提升关键信息抽取精度,并新增**对昆仑芯、昇腾等国产硬件**的支持。
2827

2928
PaddleOCR 3.0**新增**三大特色能力::
30-
- 🖼️全场景文字识别模型[PP-OCRv5](docs/version3.x/algorithm/PP-OCRv5/PP-OCRv5.md):单模型支持五种文字类型和复杂手写体识别;整体识别精度相比上一代**提升13个百分点**
31-
- 🧮通用文档解析方案[PP-StructureV3](docs/version3.x/algorithm/PP-StructureV3/PP-StructureV3.md):支持多场景、多版式 PDF 高精度解析,在公开评测集中**领先众多开源和闭源方案**
32-
- 📈智能文档理解方案[PP-ChatOCRv4](docs/version3.x/algorithm/PP-ChatOCRv4/PP-ChatOCRv4.md):原生支持文心大模型4.5 Turbo,精度相比上一代**提升15个百分点**
29+
- 全场景文字识别模型[PP-OCRv5](docs/version3.x/algorithm/PP-OCRv5/PP-OCRv5.md):单模型支持五种文字类型和复杂手写体识别;整体识别精度相比上一代**提升13个百分点**
30+
- 通用文档解析方案[PP-StructureV3](docs/version3.x/algorithm/PP-StructureV3/PP-StructureV3.md):支持多场景、多版式 PDF 高精度解析,在公开评测集中**领先众多开源和闭源方案**
31+
- 智能文档理解方案[PP-ChatOCRv4](docs/version3.x/algorithm/PP-ChatOCRv4/PP-ChatOCRv4.md):原生支持文心大模型4.5 Turbo,精度相比上一代**提升15个百分点**
3332

3433
PaddleOCR 3.0除了提供优秀的模型库外,还提供好学易用的工具,覆盖模型训练、推理和服务化部署,方便开发者快速落地AI应用。
3534
<div align="center">
3635
<p>
37-
<a href="https://paddlepaddle.github.io/PaddleOCR/latest/en/index.html" target="_blank">
3836
<img width="100%" src="./docs/images/Arch_cn.png" alt="PaddleOCR Architecture"></a>
3937
</p>
4038
</div>
@@ -74,21 +72,19 @@ PaddleOCR 3.0除了提供优秀的模型库外,还提供好学易用的工具
7472
</details>
7573

7674
## ⚡ 快速开始
77-
### 1. 在线体验无需安装
75+
### 1. 在线体验
7876
[![AI Studio](https://img.shields.io/badge/PP_OCRv5-AI_Studio-green)](https://aistudio.baidu.com/community/app/91660/webUI)
7977
[![AI Studio](https://img.shields.io/badge/PP_StructureV3-AI_Studio-green)](https://aistudio.baidu.com/community/app/518494/webUI)
8078
[![AI Studio](https://img.shields.io/badge/PP_ChatOCRv4-AI_Studio-green)](https://aistudio.baidu.com/community/app/518493/webUI)
8179

82-
### 2. 本地安装指南
80+
### 2. 本地安装
8381

84-
首先,请参考[安装指南](https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/develop/install/pip/linux-pip.html)完成**PaddlePaddle 3.0**的安装。
82+
请参考[安装指南](https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/develop/install/pip/linux-pip.html)完成**PaddlePaddle 3.0**的安装。
8583

86-
然后,安装paddleocr
84+
安装paddleocr
8785
```bash
88-
# 1. 安装 paddleocr
86+
# 安装 paddleocr
8987
pip install paddleocr
90-
# 2. 安装完毕后自检
91-
paddleocr --version
9288
```
9389

9490
### 3. 命令行方式推理
@@ -99,7 +95,7 @@ paddleocr ocr -i https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_im
9995
# 运行 PP-StructureV3 推理
10096
paddleocr PP-StructureV3 -i https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/pp_structure_v3_demo.png
10197

102-
# 运行 PP-ChatOCRv4 推理
98+
# 运行 PP-ChatOCRv4 推理前,需要先获得千帆KPI Key
10399
paddleocr pp_chatocrv4_doc -i https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/vehicle_certificate-1.png -k 驾驶室准乘人数 --qianfan_api_key your_api_key
104100

105101
# 查看 "paddleocr ocr" 详细参数
@@ -240,40 +236,42 @@ print(chat_result)
240236

241237
</details>
242238

239+
[进阶指南]()
240+
243241
### 5. **国产化硬件支持**
244242
- [昆仑芯安装指南](https://paddlepaddle.github.io/PaddleOCR/latest/version3.x/other_devices_support/paddlepaddle_install_XPU.html)
245243
- [昇腾安装指南](https://paddlepaddle.github.io/PaddleOCR/latest/version3.x/other_devices_support/paddlepaddle_install_NPU.html)
246244

247-
## 😃 使用 PaddleOCR 的优秀项目
248-
💗 PaddleOCR 的发展离不开社区贡献!衷心感谢所有开发者、合作伙伴与贡献者!
249-
| 项目名称 | 简介 |
250-
| ------------ | ----------- |
251-
| [RAGFlow](https://github.com/infiniflow/ragflow) <a href="https://github.com/infiniflow/ragflow"><img src="https://img.shields.io/github/stars/infiniflow/ragflow"></a>|基于RAG的AI工作流引擎|
252-
| [MinerU](https://github.com/opendatalab/MinerU) <a href="https://github.com/opendatalab/MinerU"><img src="https://img.shields.io/github/stars/opendatalab/MinerU"></a>|多类型文档转换Markdown工具|
253-
| [Umi-OCR](https://github.com/hiroi-sora/Umi-OCR) <a href="https://github.com/hiroi-sora/Umi-OCR"><img src="https://img.shields.io/github/stars/hiroi-sora/Umi-OCR"></a>|开源批量离线OCR软件|
254-
| [OmniParser](https://github.com/microsoft/OmniParser)<a href="https://github.com/microsoft/OmniParser"><img src="https://img.shields.io/github/stars/microsoft/OmniParser"></a> |基于纯视觉的GUI智能体屏幕解析工具|
255-
| [QAnything](https://github.com/netease-youdao/QAnything)<a href="https://github.com/netease-youdao/QAnything"><img src="https://img.shields.io/github/stars/netease-youdao/QAnything"></a> |基于任意内容的问答系统|
256-
| [PDF-Extract-Kit](https://github.com/opendatalab/PDF-Extract-Kit) <a href="https://github.com/opendatalab/PDF-Extract-Kit"><img src="https://img.shields.io/github/stars/opendatalab/PDF-Extract-Kit"></a>|高效复杂PDF文档提取工具包|
257-
| [Dango-Translator](https://github.com/PantsuDango/Dango-Translator)<a href="https://github.com/PantsuDango/Dango-Translator"><img src="https://img.shields.io/github/stars/PantsuDango/Dango-Translator"></a> |屏幕实时翻译工具|
258-
| [更多项目](./awesome_projects.md) | [基于 PaddleOCR 的扩展项目](./awesome_projects.md)|
259245

260-
## 🔄 快速一览运行效果
246+
247+
## 🔄 效果展示
261248

262249
<div align="center">
263250
<p>
264-
<a href="https://paddlepaddle.github.io/PaddleOCR/latest/en/index.html" target="_blank">
265-
<img width="100%" src="./docs/images/demo.gif" alt="PP-OCRv5 Demo"></a>
251+
<img width="100%" src="./docs/images/demo.gif" alt="PP-OCRv5 Demo"></a>
266252
</p>
267253
</div>
268254

269255
<div align="center">
270256
<p>
271-
<a href="https://paddlepaddle.github.io/PaddleOCR/latest/en/index.html" target="_blank">
272257
<img width="100%" src="./docs/images/blue_v3.gif" alt="PP-StructureV3 Demo"></a>
273258
</p>
274259
</div>
275260

276261
## 👩‍👩‍👧‍👦 开发者社区
277262

263+
## 😃 使用 PaddleOCR 的优秀项目
264+
💗 PaddleOCR 的发展离不开社区贡献!衷心感谢所有开发者、合作伙伴与贡献者!
265+
| 项目名称 | 简介 |
266+
| ------------ | ----------- |
267+
| [RAGFlow](https://github.com/infiniflow/ragflow) <a href="https://github.com/infiniflow/ragflow"><img src="https://img.shields.io/github/stars/infiniflow/ragflow"></a>|基于RAG的AI工作流引擎|
268+
| [MinerU](https://github.com/opendatalab/MinerU) <a href="https://github.com/opendatalab/MinerU"><img src="https://img.shields.io/github/stars/opendatalab/MinerU"></a>|多类型文档转换Markdown工具|
269+
| [Umi-OCR](https://github.com/hiroi-sora/Umi-OCR) <a href="https://github.com/hiroi-sora/Umi-OCR"><img src="https://img.shields.io/github/stars/hiroi-sora/Umi-OCR"></a>|开源批量离线OCR软件|
270+
| [OmniParser](https://github.com/microsoft/OmniParser)<a href="https://github.com/microsoft/OmniParser"><img src="https://img.shields.io/github/stars/microsoft/OmniParser"></a> |基于纯视觉的GUI智能体屏幕解析工具|
271+
| [QAnything](https://github.com/netease-youdao/QAnything)<a href="https://github.com/netease-youdao/QAnything"><img src="https://img.shields.io/github/stars/netease-youdao/QAnything"></a> |基于任意内容的问答系统|
272+
| [PDF-Extract-Kit](https://github.com/opendatalab/PDF-Extract-Kit) <a href="https://github.com/opendatalab/PDF-Extract-Kit"><img src="https://img.shields.io/github/stars/opendatalab/PDF-Extract-Kit"></a>|高效复杂PDF文档提取工具包|
273+
| [Dango-Translator](https://github.com/PantsuDango/Dango-Translator)<a href="https://github.com/PantsuDango/Dango-Translator"><img src="https://img.shields.io/github/stars/PantsuDango/Dango-Translator"></a> |屏幕实时翻译工具|
274+
| [更多项目](./awesome_projects.md) | |
275+
278276
## 📄 许可协议
279277
本项目采用 [Apache 2.0 协议](./LICENSE) 开源发布。

0 commit comments

Comments
 (0)