Skip to content

Commit d7ea48e

Browse files
authored
docs: Add android_demo docs (#13601)
* docs: Shorten the image path * docs: Remove duplicate images * docs: Fix docs errors * docs: Add android_demo docs
1 parent 09b7f6c commit d7ea48e

14 files changed

+114
-0
lines changed
+113
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,113 @@
1+
---
2+
typora-copy-images-to: images
3+
comments: true
4+
---
5+
6+
# Android Demo
7+
8+
## 1. 简介
9+
10+
此为PaddleOCR的Android Demo,目前支持文本检测,文本方向分类器和文本识别模型的使用。使用 [PaddleLite v2.10](https://github.com/PaddlePaddle/Paddle-Lite/tree/release/v2.10) 进行开发。
11+
12+
## 2. 近期更新
13+
14+
- 2022.02.27
15+
- 预测库更新到PaddleLite v2.10
16+
- 支持6种运行模式:
17+
- 检测+分类+识别
18+
- 检测+识别
19+
- 分类+识别
20+
- 检测
21+
- 识别
22+
- 分类
23+
24+
## 3. 快速使用
25+
26+
### 3.1 环境准备
27+
28+
1. 在本地环境安装好 Android Studio 工具,详细安装方法请见[Android Stuido 官网](https://developer.android.com/studio)
29+
2. 准备一部 Android 手机,并开启 USB 调试模式。开启方法: `手机设置 -> 查找开发者选项 -> 打开开发者选项和 USB 调试模式`
30+
31+
**注意**:如果您的 Android Studio 尚未配置 NDK ,请根据 Android Studio 用户指南中的[安装及配置 NDK 和 CMake](https://developer.android.com/studio/projects/install-ndk)内容,预先配置好 NDK 。您可以选择最新的 NDK 版本,或者使用 Paddle Lite 预测库版本一样的 NDK
32+
33+
### 3.2 导入项目
34+
35+
点击 File->New->Import Project..., 然后跟着Android Studio的引导导入
36+
导入完成后呈现如下界面
37+
![](./images/import_demo.jpg)
38+
39+
### 3.3 运行demo
40+
41+
将手机连接上电脑后,点击Android Studio工具栏中的运行按钮即可运行demo。在此过程中,手机会弹出"允许从 USB 安装软件权限"的弹窗,点击允许即可。
42+
43+
软件安转到手机上后会在手机主屏最后一页看到如下app
44+
45+
![img](./images/68747470733a.jpeg)
46+
47+
点击app图标即可启动app,启动后app主页如下
48+
49+
![img](./images/68747470733a.png)
50+
51+
app主页中有四个按钮,一个下拉列表和一个菜单按钮,他们的功能分别为
52+
53+
- 运行模型:按照已选择的模式,运行对应的模型组合
54+
- 拍照识别:唤起手机相机拍照并获取拍照的图像,拍照完成后需要点击运行模型进行识别
55+
- 选取图片:唤起手机相册拍照选择图像,选择完成后需要点击运行模型进行识别
56+
- 清空绘图:清空当前显示图像上绘制的文本框,以便进行下一次识别(每次识别使用的图像都是当前显示的图像)
57+
- 下拉列表:进行运行模式的选择,目前包含6种运行模式,默认模式为**检测+分类+识别**详细说明见下一节。
58+
- 菜单按钮:点击后会进入菜单界面,进行模型和内置图像有关设置
59+
60+
点击运行模型后,会按照所选择的模式运行对应的模型,**检测+分类+识别**模式下运行的模型结果如下所示:
61+
62+
<img src="./images/run_det_cls_rec.jpg" width="400">
63+
64+
模型运行完成后,模型和运行状态显示区`STATUS`字段显示了当前模型的运行状态,这里显示为`run model successed`表明模型运行成功。
65+
66+
模型的运行结果显示在运行结果显示区,显示格式为
67+
68+
```text
69+
序号:Det:(x1,y1)(x2,y2)(x3,y3)(x4,y4) Rec: 识别文本,识别置信度 Cls:分类类别,分类分时
70+
```
71+
72+
### 3.4 运行模式
73+
74+
PaddleOCR demo共提供了6种运行模式,如下图
75+
76+
![img](./images/68747470733adfd.jpeg)
77+
78+
每种模式的运行结果如下表所示
79+
80+
| 检测+分类+识别 | 检测+识别 | 分类+识别 |
81+
| ------------------------------------------------------------ | ------------------------------------------------ | ------------------------------------------------ |
82+
| <img src="./images/run_det_cls_rec-20240806100407184.jpg" width="400"> | <img src="./images/run_det_rec.jpg" width="400"> | <img src="./images/run_cls_rec.jpg" width="400"> |
83+
84+
| 检测 | 识别 | 分类 |
85+
| -------------------------------------------- | -------------------------------------------- | -------------------------------------------- |
86+
| <img src="./images/run_det.jpg" width="400"> | <img src="./images/run_rec.jpg" width="400"> | <img src="./images/run_cls.jpg" width="400"> |
87+
88+
### 3.5 设置
89+
90+
设置界面如下
91+
92+
![img](./images/68747470733a2f2f7061.jpeg)
93+
94+
95+
在设置界面可以进行如下几项设定:
96+
97+
1. 普通设置
98+
- Enable custom settings: 选中状态下才能更改设置
99+
- Model Path: 所运行的模型地址,使用默认值就好
100+
- Label Path: 识别模型的字典
101+
- Image Path: 进行识别的内置图像名
102+
2. 模型运行态设置,此项设置更改后返回主界面时,会自动重新加载模型
103+
- CPU Thread Num: 模型运行使用的CPU核心数量
104+
- CPU Power Mode: 模型运行模式,大小核设定
105+
3. 输入设置
106+
- det long size: DB模型预处理时图像的长边长度,超过此长度resize到该值,短边进行等比例缩放,小于此长度不进行处理。
107+
4. 输出设置
108+
- Score Threshold: DB模型后处理box的阈值,低于此阈值的box进行过滤,不显示。
109+
110+
## 4 更多支持
111+
112+
1. 实时识别,更新预测库可参考 <https://github.com/PaddlePaddle/Paddle-Lite-Demo/tree/develop/ocr/android/app/cxx/ppocr_demo>
113+
2. 更多Paddle-Lite相关问题可前往[Paddle-Lite](https://github.com/PaddlePaddle/Paddle-Lite) ,获得更多开发支持
14.3 KB
Loading
Loading
Loading
Loading
140 KB
Loading
109 KB
Loading
116 KB
Loading
197 KB
Loading
Loading
Loading
207 KB
Loading
108 KB
Loading

mkdocs.yml

+1
Original file line numberDiff line numberDiff line change
@@ -283,6 +283,7 @@ nav:
283283
- 基于C++预测引擎推理: ppocr/infer_deploy/cpp_infer.md
284284
- Visual Studio 2019 Community CMake 编译指南: ppocr/infer_deploy/windows_vs2019_build.md
285285
- 服务化部署: ppocr/infer_deploy/paddle_server.md
286+
- Android部署: ppocr/infer_deploy/android_demo.md
286287
- Jetson部署: ppocr/infer_deploy/Jetson_infer.md
287288
- 端侧部署: ppocr/infer_deploy/lite.md
288289
- 网页前端部署: ppocr/infer_deploy/paddle_js.md

0 commit comments

Comments
 (0)