Skip to content

PaddleOCR最佳实践场景项目征集 #74824

@lingskr

Description

@lingskr

问题描述 Please describe your issue

AI加码,PaddleOCR最佳实践场景项目征集等你参与!

PaddleOCR自发布以来凭借学术前沿算法和产业落地实践,受到了产学研各方的喜爱,并被广泛应用于众多知名开源项目,成为广大开发者心中的开源OCR领域的首选工具。

2025年5月,飞桨团队发布PaddleOCR 3.0并对外开源,全面适配飞桨框架3.0正式版,进一步提升文字识别精度,支持多文字类型识别和手写体识别,满足大模型应用对复杂文档高精度解析的旺盛需求,结合文心大模型4.5 Turbo显著提升关键信息抽取精度,并新增对昆仑芯、昇腾等国产硬件的支持。2025年7月,发布 PaddleOCR 3.1,带来3个新升级:新增 PP-OCRv5 多语种文本识别模型、新增文档翻译 PP-DocTranslation 产线、支持 MCP 服务器。

2025年8月5日—10月30日,飞桨星河社区诚邀全球开发者挖掘OCR场景价值及最佳实践,结合产业热门应用,让项目快速落地。
👉 GitHub链接:https://github.com/PaddlePaddle/PaddleOCR


创作方向推荐

为充分发掘PaddleOCR的创新潜力,结合产业热门应用和创意,我们精心策划了以下特色方向供参考:

基于 PP-OCRv5 的文字识别应用方向

PP-OCRv5 提供了高精度、轻量级的端到端文本检测与识别能力,适用于以下场景:

应用名称 任务目标 产业场景
票据发票识别 识别并提取发票编号、金额、开票日期、公司信息等字段 财务报销自动化、OCR+RPA发票审核、税务系统对接
店铺招牌识别 提取街景或实拍图中的商铺招牌文字信息 地图建图、商户信息采集、LBS数据服务更新
身份证/行驶证识别 定位并识别证件中的姓名、证件号、有效期等字段 用户实名认证、车险理赔、政务信息录入
快递面单识别 识别快递单号、寄收人、地址等信息 快递分拣、仓储入库、客服查件系统
银行卡识别 识别银行卡号、银行名称、持卡人信息 远程开户、支付系统绑定、银行柜台辅助
表单文字识别 精细识别表格或表单中的手写或印刷文字 阅卷系统、保险单据、业务流程数字化
多语种OCR识别 识别中英混排、日韩文、阿拉伯文等多语种文字 出海产品本地化、国际合同处理、旅游助手
视频文字识别 从视频中提取字幕、路标、车牌等文字信息 视频内容理解、交通监控、短视频分析

基于 PP-StructureV3 的文档解析应用场景

PP-StructureV3 提供了强大的文档解析能力,可以将PDF/图片 秒变高质量Markdown文档,然后结合文心大模型能力,打造文档智能解析和关键信息提取应用。

应用名称 任务目标 产业场景
表格结构提取与还原 从图像或PDF中还原原始表格的行列结构 财务报表解析、电子票据还原、科研数据整理
金融/医疗/学术文档结构化 抽取文档中的指标、术语、专业字段 医疗病历结构化、财报审计、论文摘要提取
通用文档解析 解析PDF、扫描件、照片等不同来源的文档 企业档案处理、图书馆数字化、办公文档接入
图文重排与阅读顺序重建 输出结构化的逻辑文本顺序,支持语义重排 文档再出版、辅助阅读、可读性增强
文档问答预处理 构建支持问答的结构化输入信息 政策手册问答、智能客服、内部知识库
文档标签化与归档 按文档结构和关键词打标签并归类存储 档案数字化、文档检索、电子卷宗生成
多页文档结构分析 分析跨页文档的逻辑结构与编号顺序 多页报告处理、长合同识别、自动文档拆分

基于 PaddleOCR MCP Server 构建智能体工作流

PaddleOCR MCP Server 提供的 PP-OCRv5 和 PP-StructureV3 服务能力,结合文心大模型,打造 AI Agent 工作流。

应用名称 任务目标 产业场景
智能发票审核助手 利用OCR识别发票内容并调用规则判断异常或重复 财务机器人、RPA流程、企业合规性检查
多证件识别与验证 Agent 自动识别身份证、驾照、营业执照等证件信息,并对接实名认证或风控系统 金融开户、政务系统、平台入驻审核
快递面单解析助手 批量提取物流单信息,支持异步处理和字段映射 快递入库、客服查件、仓储系统
合同结构化抽取 Agent 使用结构化解析组件提取合同信息(人名、金额、条款、签署时间) 法律文书审阅、合同归档、审计支持
文档表格抽取 Agent 调用表格检测和还原组件,提取图像/PDF表格为结构化数据 财务报表数字化、科研表格分析、票据入库
多语种图文翻译助手 使用OCR检测多语言文本后集成翻译模型生成目标语言文本 跨境电商客服、旅游助手、海外合同处理
论文翻译Agent 对PDF格式的论文,保持格式不变的情况下,完成翻译 论文阅读助手

激励体系

项目评级

项目评级 达标标准 基础奖励 额外激励机会
加精&平台置顶 评分≥90分(技术深度+创新性) 200元京东卡 + 200A币资源 Fork量TOP10获得「社区人气奖」(奖品见下文)
加精项目 评分≥70分(完整实现+实用性) 100元京东卡 + 100A币资源 可参与月度「技术先锋」抽奖(100%中奖)
潜力项目 未加精但通过基础审核 100小时V100算力码 + 平台周边抽奖资格 新作者专属:额外赠飞桨开发者技术专家项目指导,助力项目加精

多维度奖励加成

  • 伯乐扶持激励

    • 近一年有加精项目的开发者帮助新开发者成功加精1个项目,双方各得 50元京东卡
    • 新作者首项目直接获得基础奖励的双倍算力时长
  • 优质项目冲刺

    • 加精项目数量 ≥3个 → 200元京东卡 + P10笔记本电脑金属支架
    • 加精项目数量 ≥5个 → 500元京东卡 + 小度智能音箱旗舰版
  • 社区人气奖(Fork量TOP10)

    • 官方周边礼盒(价值300+元)
    • 飞桨星河社区最佳实践项目奖证书
  • 惊喜彩蛋池(0成本参与,100%有奖)

    • 所有投稿作者均可参与:
      • 幸运轮盘:抽取平台限定卫衣、T恤、多种周边(周边中奖率30%)
      • 终极成就抽奖:项目评分第1名将获得小度智能屏X10第二代

开发者权益说明

  • 算力资源:可用于平台AI训练/高性能计算任务(有效期6个月)
  • 京东卡:活动结束后发放,全国通用
  • 实物奖品:活动结束后统一寄送
  • 激励结算:活动期间内投稿的PaddleOCR项目以本活动激励方式为准,不再重复参与技能树成长计划

参与方式

项目标题添加标签 【PaddleOCR】 在项目大厅进行投稿。


评分标准

  • 技术深度 (30%)
  • 完整度 (25%)
  • 创新性 (25%)
  • 文档质量 (20%)

大家的支持和参与将持续助力我们打造更加优质、开放和强大的 OCR 生态!
心动不如行动!快来报名参与吧!

Metadata

Metadata

Type

No type

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions