![视觉大数据智能分析算法实战](https://wfqqreader-1252317822.image.myqcloud.com/cover/579/47216579/b_47216579.jpg)
上QQ阅读APP看书,第一时间看更新
1.2 答题卡预处理
本案例选择某实际考试的答题复印/扫描图作为实验对象,重点对选择题的答题区域做图像增强处理,提高目标内容的对比度。
如图1-1所示,答题区域集中在试卷头部的网格区域,并且呈现黑白文字图的特点,因此我们可以采用基本的图像灰度化、图像二值化及图像反色来进行预处理,提高区域对比度,关键代码如下所示。
![](https://epubservercos.yuewen.com/31DDB8/26580980701213406/epubprivate/OEBPS/Images/Figure-P22_3432.jpg?sign=1739283801-DVdoYNUnY5hypA6MeZtJkh5sTnP9NNKj-0-e52cec183e50e1bded6e603c0cea1ef8)
![](https://epubservercos.yuewen.com/31DDB8/26580980701213406/epubprivate/OEBPS/Images/Figure-P23_3436.jpg?sign=1739283801-KBU0dRv1hxbYcEbQEy99Pm1Ni0wXKmjV-0-9d478abdc98c6819cea0e7127e15fd88)
图1-1 答题卡图像示例
程序首先通过imread用于读取指定路径的图像得到数字图像矩阵,rgb2gray用于将RGB图转换为灰度图矩阵;然后通过graythresh用于计算灰度图的otsu阈值,im2bw用于进行二值化变换并反色;最后采用形态学水平闭合操作突出答题区域并通过bwareafilt提取最大面积的连通区域,经imwrite函数写到指定的图像文件。运行后,得到的结果如图1-2所示。
如图1-2所示,通过预处理得到了对比度增强的二值化图,突出了答案区域的文本内容,可以发现答案区域呈现出了网格划分、数字题号、字母答案的特点,并且每个题的答案是单选的A、B、C、D之一,可考虑通过图像分割及模板匹配等方案进行答案定位及识别。
![](https://epubservercos.yuewen.com/31DDB8/26580980701213406/epubprivate/OEBPS/Images/Figure-P24_4659.jpg?sign=1739283801-ARfcFErmQiQHI5d76C8qFLGlSB5jwAnQ-0-0e86a78f88b8681174ff2b9aeb27b6cd)
图1-2 答题卡图像预处理