腾讯OCR团队斩获18项官方认证，展示全球一流水平

文章最后更新时间：2023-10-22，由天天资讯负责审核发布，若内容或图片失效，请联系客服！

在文本识别（OCR）领域的全球顶级赛事ICDAR 2023上，腾讯OCR团队基于自研算法斩获四项冠军。这是他们自2017年、2019年、2021年以来连续第四次参加该会议并同时取得了良好的成绩。荣获18项官方认证冠军，展现了腾讯OCR技术的全球一流水平。

ICDAR会议是全球文档图像分析与识别领域公认的权威学术会议。每两年举办一次。此次赛事吸引了来自100多个国家的近8000支队伍参加。 ICDAR竞赛以其极高的技术难度和极强的实用性享誉国内外。与赛后的非正式排名不同，由ICDAR官方认证的正式比赛使用新的数据集，并且比赛期间不会公布参赛队伍的信息和信息。结果虽然限制了结果提交的时间和数量，但“盲打”是非常困难的。

今年，腾讯OCR团队由腾讯数据平台部和微信技术架构部共同组成。重点参加了（密集小文本视频文本识别）和SVRD（结构化信息提取）两大竞赛，并获得了4个赛道的冠军。冠军。

赛道上，腾讯双夺冠军

（密集小文本视频文本识别）竞赛设置了两个任务：视频文本跟踪和视频文本端到端识别。由于文字很密且很小，加上环境干扰（相机抖动、运动模糊、灯光变化等）和后期剪辑（多镜头切屏、人工背景、游戏界面切换等），从视频帧中很难准确地检测和跟踪，识别文本需要算法具有很高的鲁棒性，极具挑战性。部分游戏视频帧如下所示：

腾讯大赛2020_腾讯大赛_

ICDAR-竞争框架

在两项比赛任务中，腾讯OCR团队均以绝对领先优势获得冠军。

其中，任务1旨在跟踪视频中的所有文本流，并聚合视频帧之间属于同一文本实例的检测帧。评价指标为MOTA。腾讯以领先第二名12.04%的优势夺得冠军。

腾讯大赛__腾讯大赛2020

视频文本跟踪：冠军证书

在任务2中，旨在评估视频文本识别的端到端性能。该任务需要正确检测每帧上的文本、正确跟踪视频帧以及在序列级别正确识别。评价指标为OCR-MOTA，腾讯以领先第二名11.93%的优势夺冠。

腾讯大赛_腾讯大赛2020_

视频文本端到端识别：冠军证书

SVRD赛道上，腾讯以绝对优势夺得两项冠军

SVRD（结构化信息抽取）竞赛包括HUST-CELL和BAIDU-FEST两大赛道，共4个任务：复杂文档实体关系抽取（E2E）、复杂文档实体语义抽取（E2E）、零样本结构化信息提取（E2E）。零样本文本（Zero-shot Text）和小样本结构化信息提取（Few-shot Text）。由于文档图像布局复杂、结构多样，自然场景图像采集不规则，背景复杂，存在破损、弯曲、变形等问题，比赛颇具挑战性。部分比赛图片如下：

腾讯大赛2020__腾讯大赛