腾讯OCR团队斩获18项官方认证,展示全球一流水平

文章最后更新时间:2023-10-22,由天天资讯负责审核发布,若内容或图片失效,请联系客服!

广告3宽

在文本识别(OCR)领域的全球顶级赛事ICDAR 2023上,腾讯OCR团队基于自研算法斩获四项冠军。 这是他们自2017年、2019年、2021年以来连续第四次参加该会议并同时取得了良好的成绩。 荣获18项官方认证冠军,展现了腾讯OCR技术的全球一流水平。

ICDAR会议是全球文档图像分析与识别领域公认的权威学术会议。 每两年举办一次。 此次赛事吸引了来自100多个国家的近8000支队伍参加。 ICDAR竞赛以其极高的技术难度和极强的实用性享誉国内外。 与赛后的非正式排名不同,由ICDAR官方认证的正式比赛使用新的数据集,并且比赛期间不会公布参赛队伍的信息和信息。 结果虽然限制了结果提交的时间和数量,但“盲打”是非常困难的。

今年,腾讯OCR团队由腾讯数据平台部和微信技术架构部共同组成。 重点参加了(密集小文本视频文本识别)和SVRD(结构化信息提取)两大竞赛,并获得了4个赛道的冠军。 冠军。

赛道上,腾讯双夺冠军

(密集小文本视频文本识别)竞赛设置了两个任务:视频文本跟踪和视频文本端到端识别。 由于文字很密且很小,加上环境干扰(相机抖动、运动模糊、灯光变化等)和后期剪辑(多镜头切屏、人工背景、游戏界面切换等),从视频帧中很难准确地检测和跟踪,识别文本需要算法具有很高的鲁棒性,极具挑战性。 部分游戏视频帧如下所示:

腾讯大赛2020_腾讯大赛_

ICDAR-竞争框架

在两项比赛任务中,腾讯OCR团队均以绝对领先优势获得冠军。

其中,任务1旨在跟踪视频中的所有文本流,并聚合视频帧之间属于同一文本实例的检测帧。 评价指标为MOTA。 腾讯以领先第二名12.04%的优势夺得冠军。

腾讯大赛__腾讯大赛2020

视频文本跟踪:冠军证书

在任务2中,旨在评估视频文本识别的端到端性能。 该任务需要正确检测每帧上的文本、正确跟踪视频帧以及在序列级别正确识别。 评价指标为OCR-MOTA,腾讯以领先第二名11.93%的优势夺冠。

腾讯大赛_腾讯大赛2020_

视频文本端到端识别:冠军证书

SVRD赛道上,腾讯以绝对优势夺得两项冠军

SVRD(结构化信息抽取)竞赛包括HUST-CELL和BAIDU-FEST两大赛道,共4个任务:复杂文档实体关系抽取(E2E)、复杂文档实体语义抽取(E2E)、零样本结构化信息提取(E2E)。 零样本文本(Zero-shot Text)和小样本结构化信息提取(Few-shot Text)。 由于文档图像布局复杂、结构多样,自然场景图像采集不规则,背景复杂,存在破损、弯曲、变形等问题,比赛颇具挑战性。 部分比赛图片如下:

腾讯大赛2020__腾讯大赛

ICDAR-SVRD结构化信息提取竞赛示例

腾讯OCR团队在SVRD大赛中共获得2项冠军。

其中,任务2(E2E)旨在从复杂的文档图像中提取语义实体,如标题、组织名称、日期、金额、数字、产品名称、个人姓名等。腾讯在该任务中以较大优势获得冠军。

腾讯大赛2020_腾讯大赛_

E2E:冠军证书

任务4(E2E Few-shot Text)需要从10个不同场景的图像中提取关键信息,例如银行卡、营业执照、出租车发票、购物收据、交通等,同时提供极少量的训练数据。 腾讯还获得了发票、定额发票、票据等场景关键信息的冠军。

E2E少镜头文本:冠军证书

据介绍,腾讯OCR团队是腾讯内部致力于OCR技术研发的专业团队。 技术上,团队自主研发了高精度、高稳定性的文字检测识别技术。 在应用方面,支持腾讯内部数据、腾讯广告、微信、QQ、腾讯云、腾讯视频、腾讯信息流产品等数百种业务场景。

继续阅读:

广告3宽
文章版权声明:除非注明,否则均为演示站原创文章,转载或复制请以超链接形式并注明出处。

相关tags文章

取消
微信二维码
微信二维码
支付宝二维码