各位朋友,
大家是否还记得我们?我们又回来了,为大家带来更多精彩的内容!
今天,我们将详细介绍天池的新赛事!
如果你对图像识别感兴趣,请继续关注这篇文章。
阿里巴巴“图像和美”团队联合华南理工大学共同举办的ICPR MTWI(Multi-Type Web Image)2018 挑战赛现已正式启动,并开放了业内首个基于网络图片的中英混合数据集——MTWI数据集。
天池数据众智平台(tianchi.com)作为中国最大的数据开发者社区,为本次挑战赛提供了平台支持及运营保障。天池已经成功举办了60多场高质量的数据类竞赛,吸引了来自全球89个国家和地区的近17万名数据开发者。凭借其严谨的赛制,天池确保本次大赛能够公平公正地进行。
大赛介绍
ICPR(国际模式识别会议)2018 是图像识别与机器视觉领域的顶级国际学术会议。互联网世界中,图片是传递信息的重要工具。特别是在电子商务、社交和搜索等领域,每天都有海量的图像在流通。基于深度学习的图片文字识别(OCR)技术正在迅速发展,并对信息的交互和传递方式产生深远影响。然而,在学术领域,尽管图片中的文字识别(OCR)是研究的重点之一,但目前行业内仍缺乏基于网络图片的、以中文为主的OCR数据集。
本次大赛专注于突破和解决OCR领域中的实际问题,旨在与全球AI科研人才共同推动OCR技术在工业界的应用与发展。
数据说明
本次大赛的数据集来源于真实的网络场景,既考虑了学术价值也兼顾了工业适用性。该数据集中的图片大多是由作者设计或二次加工而成,不仅包含部分场景图片和文档图片,还包含在这些图片基础上添加设计好的文字而成的新图片。
数据集涵盖了数码合成、物体表面、封面类印刷的中英文以及少量的日文、韩文等类型的文字。从文字版式上看,数据集包含了各种字体类型的单字、横排、竖排、倾斜排列、曲线排列、复杂混排(不同字号、不同字体、不同字间距的混合排布)等。
因此,本次大赛的数据集既有图片文字识别的共性,也有自身的独特之处,能够突出前沿技术尚未解决或遗漏的问题,并基于OCR领域乃至计算机视觉领域的前沿指标,设置文本检测、文本行识别、端到端的整图文字识别三个层次的赛题。
大赛日程
参赛对象
奖项设置
比赛前三名的队伍将被邀请参加在北京举行的ICPR 2018大会并接受颁奖。
点击链接立即参赛!