青岛网站设计软件,衙门口网站建设,什么是自主设计网站,给我免费的视频在线观看文档智能#xff08;DI, Document Intelligence#xff09;主要指对于网页、数字文档或扫描文档所包含的文本以及丰富的排版格式等信息#xff0c;通过人工智能技术进行理解、分类、提取以及信息归纳的过程。文档智能技术广泛应用于金融、保险、能源、物流、医疗等行业…文档智能DI, Document Intelligence主要指对于网页、数字文档或扫描文档所包含的文本以及丰富的排版格式等信息通过人工智能技术进行理解、分类、提取以及信息归纳的过程。文档智能技术广泛应用于金融、保险、能源、物流、医疗等行业常见的应用场景包括财务报销单、招聘简历、企业财报、合同文书、动产登记证、法律判决书、物流单据等多模态文档的关键信息抽取、文档解析、文档比对等。随着企业数字化、信息化进程不断加速这类需求越来越强烈工业界急需前沿技术与易用工具来解决这些问题。百度开源的文心ERNIE-Layout以及自然语言处理开发工具PaddleNLP来得很及时强烈安利文心ERNIE-Layout重磅开源近期百度文档智能团队基于多语言跨模态布局增强的文档智能大模型文心ERNIE-Layout刷新了五类11项文档智能任务效果。▲ 百度文档智能技术指标继文心ERNIE-Layout1.0后文心ERNIE-Layout再次登顶DocVQA榜单并成为榜单首个突破90分大关技术方案[1]。同时基于文心ERNIE-Layout的开放文档抽取问答模型DocPrompt 首次以文档智能模型登顶网页问答榜单WebSRC[2]。▲ DocVQA、WebSRC榜单飞桨自然语言处理模型库PaddleNLP第一时间为大家开源了文档智能十一边形战士系列模型。文心ERNIE-Layout多语言跨模态布局增强文档智能大模型 文心ERNIE-Layout依托文心ERNIE基于布局知识增强技术融合文本、图像、布局等信息进行联合建模能够对多模态文档如文档图片、PDF文件、扫描件等进行深度理解与分析为各类上层应用提供SOTA模型底座。前往GitHub获取详情https://github.com/PaddlePaddle/PaddleNLP/tree/develop/model_zoo/ernie-layout欢迎STAR收藏跟踪最新开源工作DocPrompt开放文档抽取问答模型基于ERNIE-Layout文档智能技术广泛应用于金融、保险、能源、物流、医疗等行业常见的应用场景包括各类多模态文档的关键信息抽取、文档解析、文档比对等。基于前沿的文档智能技术PaddleNLP正持续开源一系列产业实践范例解决开发者们实际应用难题。前往GitHub获取详情https://github.com/PaddlePaddle/PaddleNLP/tree/develop/applications/document_intelligence本次重磅开源的DocPrompt开放文档抽取问答模型以文心ERNIE-Layout为底座可精准理解图文信息推理学习附加知识准确捕捉图片、PDF等多模态文档中的每个细节。通过PaddleNLP Taskflow仅用三行Python代码即可快速体验DocPrompt功能。from paddlenlp import Taskflow
docprompt Taskflow(document_intelligence, modeldocprompt)
docprompt({doc: ./invoice.jpg, prompts: [发票金额, 左侧抬头日期是什么?]})DocPrompt零样本问答效果非常强悍能够推理学习空间位置语义准确捕捉跨模态文档信息轻松应对各类复杂文档。▲ 可支持空间位置语义理解▲ 可准确捕捉图文混排多模态语义针对网页、表格和试卷等复杂布局文档DocPrompt也能结合上下文及表头信息给出精准答案。▲ 网页理解优于半结构化抽取方案▲ 支持多维度无框线表格问答▲ 试卷解析问答以文心ERNIE-Layout为底座的DocPrompt还具备跨语言多语种的抽取亮点▲ 支持10语种的多语言提问推荐大家访问Huggingface 文心ERNIE-Layout空间快速体验DocPrompt带来的惊喜https://huggingface.co/spaces/PaddlePaddle/ERNIE-Layout▲ Huggingface 文心ERNIE-Layout空间直播课预告10月25日文心ERNIE-Layout论文作者百度高工将带来直播讲解介绍文档智能的前沿技术深度解读多语言跨模态布局增强文档智能大模型文心ERNIE-Layout与开放文档抽取问答模型DocPrompt并带来基于PaddleNLP的实践范例。欢迎扫码入群获取直播课程链接。入群还有更多福利与百度飞桨官方技术团队深度交流官方团队整理的10GB NLP学习大礼包TextMind智能文档分析平台合作咨询核心技术方案文心ERNIE-Layout以文心ERNIE为底座融合文本、图像、布局等信息进行跨模态联合建模创新性引入布局知识增强提出阅读顺序预测、细粒度图文匹配等自监督预训练任务升级空间解耦注意力机制。输入基于VIMER-StrucTexT大模型[3]提供的OCR结果在各数据集上效果取得大幅度提升相关工作已被EMNLP 2022 Findings 会议收录[4]。▲ 文心ERNIE-Layout 技术框架文心ERNIE-mmLayout为进一步探索不同粒度元素关系对文档理解的价值在文心ERNIE-Layout的基础上引入基于GNN的多粒度、多模态Transformer层实现文档图聚合Document Graph Aggregation表示。最终在多个信息抽取任务上以更少的模型参数量超过SOTA成绩相关论文被ACM MM 2022会议收录[5]。▲ 文心ERNIE-mmLayout 技术框架文档智能技术体系与应用平台文档智能DI, Document Intelligence主要指对于网页、数字文档或扫描文档所包含的文本以及丰富的排版格式等信息通过人工智能技术进行理解、分类、提取以及信息归纳的过程[6]。百度文档智能技术体系立足于强大的NLP与OCR技术积累以多语言跨模态布局增强文档智能大模型文心ERNIE-Layout为核心底座结合图神经网络技术支撑文档布局分析、抽取问答、表格理解、语义表示多个核心模块满足上层应用各类文档智能分析功能需求。▲ 文档智能技术体系百度TextMind智能文档分析平台[7]可提供包括文档信息抽取、文本内容审查、企业文档管理、文档格式解析、文档内容比对等全方位一站式的文档智能服务已形成一套完整的企业文档场景化解决方案满足银行、券商、法律、能源、传媒、通信、物流等不同行业和场景的文档处理需求以AI助力企业的办公智能化升级和数字化转型。开源地址https://github.com/PaddlePaddle/PaddleNLP【更多精彩直播推荐】*本文封面图背景由文心ERNIE-ViLG大模型生成欢迎点击参考链接[8]体验更多百度AI开放能力。参考链接[1]DocVQA榜单https://rrc.cvc.uab.es/?ch17comevaluationtask1 [2]网页问答榜单WebSRChttps://x-lance.github.io/WebSRC/index.html[3]VIMER-StrucTexThttps://github.com/PaddlePaddle/VIMER#structext[4]文心ERNIE-Layout: Layout-Knowledge Enhanced Multi-modal Pre-trainingfor Document Understanding https://arxiv.org/abs/2210.06155[5]文心ERNIE-mmLayout: Multi-grained MultiModal Transformer for Document Understandinghttps://arxiv.org/abs/2209.08569[6]崔磊,徐毅恒,吕腾超,韦福如. 文档智能: 数据集、模型和应用[J]. 中文信息学报, 2022, 36(6): 1-19.[7]百度AI开放平台——智能文档分析平台https://ai.baidu.com/tech/nlp/Textanalysis[8]文心ERNIE-ViLGhttps://wenxin.baidu.com/moduleApi/ernieVilg