目标检测终极指南

时间:2024-06-18 17:31:01

作者:星辉注册科技

浏览: 次

计算机视觉是当前人工智能最热门的领域之一,而目标检测在其快速发展中发挥了关键作用。


image.png 


什么是物体检测?

对象检测是计算机视觉领域,它处理图像或视频中包含的对象的定位和分类。


简而言之:对象检测归结为在检测到的对象周围绘制边界框,这使我们能够在给定场景中定位它们


image.png 


对象检测与图像分类

在继续之前,让我们澄清一下图像识别和物体检测之间的区别。


图像分类通过分类器(例如深度神经网络)发送整个图像,以便它吐出标签。分类器会考虑整个图像,但不会告诉您标签在图像中出现的位置。


对象检测稍微高级一些,因为它会在分类对象周围创建一个边界框。


image.png 


分类有其优势——对于没有真正物理边界的标签(例如“模糊”或“晴天”)来说,这是一个更好的选择。然而,物体检测系统在发现确实存在物质的物体(例如汽车)方面几乎总是优于分类网络。


对象检测与图像分割

图像分割是定义在图像中找到对象类的哪些像素的过程。


语义图像分割将标注属于该标签的所有像素,但不会定义每个对象的边界。


相反,对象检测不会分割对象,而是会用一个框清楚地定义每个单独对象实例的位置。


将语义分割与对象检测相结合导致实例分割,它首先检测对象实例,然后在检测到的框内分割每个实例(在这种情况下称为感兴趣区域)。


image.png 


被拉长的对象 - 使用实例分割。

检测到铅笔等长而细的物品时,其所占箱子面积不到10%。这使模型偏向于背景像素而不是对象本身。


没有物理存在的对象——使用分类

图像中的事物,例如“阳光”、“明亮”或“倾斜”等标签,最好通过图像分类技术来识别——让网络获取图像并找出与这些标签相关的特征。


不同角度没有明确边界的对象——使用语义分割

航拍图像中的天空、地面或植被实际上并没有明确的界限。语义分割在“绘制”属于这些类别的像素时更有效。物体检测仍然会选择“天空”作为物体,但它会更加努力地处理这些物体。


经常被遮挡的对象——尽可能使用实例分割

在两阶段检测网络中,遮挡的处理比一次性方法要好得多。在检测器的这个分支中,实例分割模型在理解和分割被遮挡对象方面将比单纯的边界框检测器做得更好。


物体检测的类型和模式

2013 年深度学习起飞之前,几乎所有的目标检测都是通过经典的机器学习技术完成的。


这些将检测图像中的许多共同特征,并使用逻辑回归、颜色直方图或随机森林对它们的集群进行分类。今天基于深度学习的技术大大优于这些技术。


物体检测应用

最后,让我们看看一些最常见的对象检测用例。


人脸检测

大多数人脸识别系统都是由物体检测驱动的。它可用于检测人脸、对情绪或表情进行分类,并将生成的框输入图像检索系统,以识别群体中的特定人。


人脸检测是最流行的对象检测用例之一,当您用人脸解锁手机时,您可能已经在使用它了。


人员检测也常用于计算零售店的人数或确保社交距离指标。


image.png 


智能视频分析

对象检测可用于智能视频分析 (IVA),只要零售场所有闭路电视摄像机,即可了解购物者如何与产品互动。这些视频流通过匿名管道来模糊人脸并对个人进行去识别化。一些 IVA 用例通过仅查看人的鞋子、将摄像头放置在膝盖以下并确保系统捕捉到人的存在来保护隐私,而无需直接查看他们的可识别特征。IVA 通常用于工厂、机场和交通枢纽,以跟踪排队长度和进入限制区域。


image.png 


自动驾驶汽车

自动驾驶汽车使用物体检测来发现道路上的行人、其他汽车和障碍物,以便安全地四处移动。配备激光雷达的自动驾驶汽车有时会使用 3D 对象检测,即在对象周围应用长方体。


image.png 


智能视频手术

手术视频是在关键手术期间从内窥镜获取的非常嘈杂的数据。物体检测可用于发现难以看到的物品,例如需要外科医生立即关注的息肉或病变。它还被用来通知医院工作人员手术的状态。


image.png 


缺陷检查

制造公司可以使用对象检测来发现生产线中的缺陷。可以训练神经网络来检测微小的缺陷,从织物的褶皱到注塑塑料中的凹痕或闪光。


与传统的机器学习方法不同,基于深度学习的对象检测还可以发现变化很大的对象中的缺陷,例如食物。


image.png 


行人检测

它是应用于机器人、视频监控和汽车安全的最重要的计算机视觉任务之一。行人检测在目标检测研究中起着关键作用,因为它为视频片段的语义理解提供了基本信息。


尽管其性能相对较高,但该技术仍面临挑战,例如外观风格多样或存在遮挡配件会降低现有探测器的准确性。


image.png 


人工智能无人机导航

如今,无人机配备了令人难以置信的摄像头,并且可以利用托管在云中的模型来评估它们遇到的任何物体。


例如,它们可用于检查桥梁中难以到达的区域是否存在裂缝和其他结构损坏,或检查电力线,以取代危险的常规直升机操作。


image.png 


结论

让我们回顾一下我们今天学到的所有内容:

对象检测是处理图像或视频中对象定位和分类的最有用和最流行的计算机视觉技术之一。


其他计算机视觉任务包括图像分类和图像分割。


图像分类通过分类器运行图像以分配标签,而无需指定标签在图像中的定位。


图像分割定义了在图像中找到对象类的哪些像素。


如果您的对象没有边界,请使用分类器,如果您需要非常高的准确度,请改用实例分割。


对象检测是图像识别的第二个最容易获得的形式(在分类之后),并且是高速发现许多对象的好方法。


对象检测可应用于自动驾驶汽车、资产检查、行人检测或视频监控等领域。

 


做AI行业客户的数据参谋