-
Notifications
You must be signed in to change notification settings - Fork 5.8k
Description
问题描述 Please describe your issue
AI加码,PaddleOCR最佳实践场景项目征集等你参与!
PaddleOCR自发布以来凭借学术前沿算法和产业落地实践,受到了产学研各方的喜爱,并被广泛应用于众多知名开源项目,成为广大开发者心中的开源OCR领域的首选工具。
2025年5月,飞桨团队发布PaddleOCR 3.0并对外开源,全面适配飞桨框架3.0正式版,进一步提升文字识别精度,支持多文字类型识别和手写体识别,满足大模型应用对复杂文档高精度解析的旺盛需求,结合文心大模型4.5 Turbo显著提升关键信息抽取精度,并新增对昆仑芯、昇腾等国产硬件的支持。2025年7月,发布 PaddleOCR 3.1,带来3个新升级:新增 PP-OCRv5 多语种文本识别模型、新增文档翻译 PP-DocTranslation 产线、支持 MCP 服务器。
2025年8月5日—10月30日,飞桨星河社区诚邀全球开发者挖掘OCR场景价值及最佳实践,结合产业热门应用,让项目快速落地。
👉 GitHub链接:https://github.com/PaddlePaddle/PaddleOCR
创作方向推荐
为充分发掘PaddleOCR的创新潜力,结合产业热门应用和创意,我们精心策划了以下特色方向供参考:
基于 PP-OCRv5 的文字识别应用方向
PP-OCRv5 提供了高精度、轻量级的端到端文本检测与识别能力,适用于以下场景:
应用名称 | 任务目标 | 产业场景 |
---|---|---|
票据发票识别 | 识别并提取发票编号、金额、开票日期、公司信息等字段 | 财务报销自动化、OCR+RPA发票审核、税务系统对接 |
店铺招牌识别 | 提取街景或实拍图中的商铺招牌文字信息 | 地图建图、商户信息采集、LBS数据服务更新 |
身份证/行驶证识别 | 定位并识别证件中的姓名、证件号、有效期等字段 | 用户实名认证、车险理赔、政务信息录入 |
快递面单识别 | 识别快递单号、寄收人、地址等信息 | 快递分拣、仓储入库、客服查件系统 |
银行卡识别 | 识别银行卡号、银行名称、持卡人信息 | 远程开户、支付系统绑定、银行柜台辅助 |
表单文字识别 | 精细识别表格或表单中的手写或印刷文字 | 阅卷系统、保险单据、业务流程数字化 |
多语种OCR识别 | 识别中英混排、日韩文、阿拉伯文等多语种文字 | 出海产品本地化、国际合同处理、旅游助手 |
视频文字识别 | 从视频中提取字幕、路标、车牌等文字信息 | 视频内容理解、交通监控、短视频分析 |
基于 PP-StructureV3 的文档解析应用场景
PP-StructureV3 提供了强大的文档解析能力,可以将PDF/图片 秒变高质量Markdown文档,然后结合文心大模型能力,打造文档智能解析和关键信息提取应用。
应用名称 | 任务目标 | 产业场景 |
---|---|---|
表格结构提取与还原 | 从图像或PDF中还原原始表格的行列结构 | 财务报表解析、电子票据还原、科研数据整理 |
金融/医疗/学术文档结构化 | 抽取文档中的指标、术语、专业字段 | 医疗病历结构化、财报审计、论文摘要提取 |
通用文档解析 | 解析PDF、扫描件、照片等不同来源的文档 | 企业档案处理、图书馆数字化、办公文档接入 |
图文重排与阅读顺序重建 | 输出结构化的逻辑文本顺序,支持语义重排 | 文档再出版、辅助阅读、可读性增强 |
文档问答预处理 | 构建支持问答的结构化输入信息 | 政策手册问答、智能客服、内部知识库 |
文档标签化与归档 | 按文档结构和关键词打标签并归类存储 | 档案数字化、文档检索、电子卷宗生成 |
多页文档结构分析 | 分析跨页文档的逻辑结构与编号顺序 | 多页报告处理、长合同识别、自动文档拆分 |
基于 PaddleOCR MCP Server 构建智能体工作流
PaddleOCR MCP Server 提供的 PP-OCRv5 和 PP-StructureV3 服务能力,结合文心大模型,打造 AI Agent 工作流。
应用名称 | 任务目标 | 产业场景 |
---|---|---|
智能发票审核助手 | 利用OCR识别发票内容并调用规则判断异常或重复 | 财务机器人、RPA流程、企业合规性检查 |
多证件识别与验证 Agent | 自动识别身份证、驾照、营业执照等证件信息,并对接实名认证或风控系统 | 金融开户、政务系统、平台入驻审核 |
快递面单解析助手 | 批量提取物流单信息,支持异步处理和字段映射 | 快递入库、客服查件、仓储系统 |
合同结构化抽取 Agent | 使用结构化解析组件提取合同信息(人名、金额、条款、签署时间) | 法律文书审阅、合同归档、审计支持 |
文档表格抽取 Agent | 调用表格检测和还原组件,提取图像/PDF表格为结构化数据 | 财务报表数字化、科研表格分析、票据入库 |
多语种图文翻译助手 | 使用OCR检测多语言文本后集成翻译模型生成目标语言文本 | 跨境电商客服、旅游助手、海外合同处理 |
论文翻译Agent | 对PDF格式的论文,保持格式不变的情况下,完成翻译 | 论文阅读助手 |
激励体系
项目评级
项目评级 | 达标标准 | 基础奖励 | 额外激励机会 |
---|---|---|---|
加精&平台置顶 | 评分≥90分(技术深度+创新性) | 200元京东卡 + 200A币资源 | Fork量TOP10获得「社区人气奖」(奖品见下文) |
加精项目 | 评分≥70分(完整实现+实用性) | 100元京东卡 + 100A币资源 | 可参与月度「技术先锋」抽奖(100%中奖) |
潜力项目 | 未加精但通过基础审核 | 100小时V100算力码 + 平台周边抽奖资格 | 新作者专属:额外赠飞桨开发者技术专家项目指导,助力项目加精 |
多维度奖励加成
-
伯乐扶持激励
- 近一年有加精项目的开发者帮助新开发者成功加精1个项目,双方各得 50元京东卡
- 新作者首项目直接获得基础奖励的双倍算力时长
-
优质项目冲刺
- 加精项目数量 ≥3个 → 200元京东卡 + P10笔记本电脑金属支架
- 加精项目数量 ≥5个 → 500元京东卡 + 小度智能音箱旗舰版
-
社区人气奖(Fork量TOP10)
- 官方周边礼盒(价值300+元)
- 飞桨星河社区最佳实践项目奖证书
-
惊喜彩蛋池(0成本参与,100%有奖)
- 所有投稿作者均可参与:
- 幸运轮盘:抽取平台限定卫衣、T恤、多种周边(周边中奖率30%)
- 终极成就抽奖:项目评分第1名将获得小度智能屏X10第二代
- 所有投稿作者均可参与:
开发者权益说明
- 算力资源:可用于平台AI训练/高性能计算任务(有效期6个月)
- 京东卡:活动结束后发放,全国通用
- 实物奖品:活动结束后统一寄送
- 激励结算:活动期间内投稿的PaddleOCR项目以本活动激励方式为准,不再重复参与技能树成长计划
参与方式
项目标题添加标签 【PaddleOCR】 在项目大厅进行投稿。
评分标准
- 技术深度 (30%)
- 完整度 (25%)
- 创新性 (25%)
- 文档质量 (20%)
大家的支持和参与将持续助力我们打造更加优质、开放和强大的 OCR 生态!
心动不如行动!快来报名参与吧!