工程案例

致力于产品的良好用户体验、有效的网络营销效果而努力

用不到 30 行 Python 代码实现 YOLO

发布时间:2025-01-11 03:43:47 来源:工程案例

  You Only Look Once是一个实时对象检测算法,它避免了在生成区域建议上花费太多的时间。它不能完美地定位物体,而是第一先考虑速度和识别。

  像 faster R-CNN 这样的架构是准确的,但是模型本身相当复杂,有多个输出,每个输出都是潜在的错误来源。一旦接受训练,他们仍然没有足够的速度来实时运行。

  设想一辆无人驾驶汽车看到这条街道。对于一辆无人驾驶汽车来说,能够探测到周围物体的位置是至关重要的,比如行人、汽车和交通灯。最重要的是,这种检测必须在接近实时的情况下进行,这样汽车才能安全行驶在街道上。汽车并不总是必须了解到所有这些物体是什么?它只是需要必须了解到,绝对不能撞到这些物体,另外,它也确实需要识别红绿灯、自行车和行人,以便能够正确遵守道路规则。在下面的图中,我使用YOLO算法来定位和分类不同的对象,有一个定位每个对象的包围框和相应的类标签。

  假设我们有一个CNN,它被训练来识别几个类,包括交通灯、汽车、人和卡车。我们给了它两种类型的锚盒,一种高的和一种宽的,这样它就能处理不一样的形状的重叠对象。一旦CNN经过训练,我们现在能够最终靠输入新的测试图像来检测图像中的物体。

  什么是anchor box ?YOLO可以很好地工作于多个对象,其中每个对象都与一个网格单元关联。但是在重叠的情况下,一个网格单元实际上包含两个不同对象的中心点,我们大家可以使用anchor box 来允许一个网格单元检测多个对象。

  在上图中,我们正真看到我们在图像中有一个人和一辆汽车重叠。因此,汽车的一部分被遮挡了。我们还能够正常的看到,边界框,汽车和行人的中心都落在同一个网格单元中。由于每个网格单元的输出向量只能有一个类,因此它将被强制选择汽车或人。但是通过定义 Anchor Boxes ,我们大家可以创建一个更长的网格单元格向量,并将多个类与每个网格单元关联起来。Anchor Boxes 具有定义的纵横比,并且他们试图检测恰好适合具有该比率的箱子的物体。例如,由于我们正在检测宽车和站立的人,我们将定义一个大致与汽车形状相似的 Anchor Box,这个箱子比它高的宽。我们将定义另一个 Anchor Box,它可以容纳一个站立的人,它的高度比它宽。

  首先将测试图像分解成网格,然后网络产生输出向量,每个网格单元一个。这些向量告诉我们一个单元格中是否有一个对象,该对象是什么类,以及该对象的边界框。由于个人会使用两个 Anchor Box,我们将为每个网格单元获得两个预测的锚箱。实际上,大多数预测的锚箱都有很低的PC(物体存在概率)值。在生成这些输出向量之后,个人会使用非最大抑制来消除不可能的边界框。对于每个类,非最大抑制消除了PC值低于某个给定阈值的边界框。

  YOLO使用非极大抑制(NMS)仅保留最佳边界框。 NMS的第一步是删除检测概率小于给定NMS阈值的所有预测边界框。在下面的代码中,我们将此NMS阈值设置为0.6。这在某种程度上预示着将删除检测概率小于0.6的所有预测边界框。

  什么是交并比阈值(IOU)?在删除具有低检测概率的所有预测边界框之后,NMS中的第二步是选择具有最高检测概率的边界框,并消除其 交并比 (IOU)值高于给定的所有边界框。 IOU门槛。在下面的代码中,我们将此IOU阈值设置为0.4。这在某种程度上预示着将删除所有相对于最佳边界框的IOU值大于0.4的预测边界框。

  然后选择PC值最高的边界框,并删除与此太相似的边界框。它将重复此操作,直到每个类的所有非最大边界框都被删除为止。最终的结果将如下图所示,我们大家可以看到黄色已经有效地检测到了很多物体在图像中比如这样的一辆车和一个人。雷锋网雷锋网雷锋网

  现在您已经了解了YOLO的工作原理,您能够正常的看到为什么它是当今使用最广泛的对象检测算法之一。

  YOLO(),以获得YOLO算法的代码实现,并真正了解它怎么检验测试不同场景中的对象和不同程度的置信水平。

  100本Python中文电子书,6份源代码,Python从入门到出家,一条龙服务。

  包含Python基础、进阶、爬虫、算法实现、深度学习、TensorFlow、NLP等等

你觉得这篇文章怎么样?

0 0

网友评论

管理员

该内容暂无评论

贝博平台官网入口扫一扫咨询微信客服
在线客服
服务热线
微信咨询
贝博bb平台体育app官网
返回顶部