农夫色综合,同桌啊哈轻点嗯在上课呢

非最大抑制算法是如何工作的？

2022-01-20 14:14

簡(jiǎn)介

你曾經(jīng)使用過物體檢測(cè)算法嗎？如果是，則很有可能你已經(jīng)使用了非最大抑制算法。也許這是你使用的深度學(xué)習(xí)模式的一部分，你甚至沒有注意到。因?yàn)榧词故欠浅?fù)雜的算法也會(huì)面臨這個(gè)問題，它們會(huì)多次識(shí)別同一個(gè)對(duì)象。今天，想向你展示非最大抑制算法是如何工作的，并提供一個(gè)python實(shí)現(xiàn)。首先向你展示，邊界框是包圍圖像中檢測(cè)到的對(duì)象的矩形。然后我將介紹非最大抑制的代碼。該算法逐個(gè)刪除冗余的邊界框。它通過移除重疊大于閾值的框來實(shí)現(xiàn)。邊界框我們使用邊界框來標(biāo)記圖像中已識(shí)別出感興趣對(duì)象的部分。

在本例中，要識(shí)別的對(duì)象是方塊A中的大方塊。邊界框始終是垂直的矩形。因此，我們只需要存儲(chǔ)所有邊界框的左上角和右下角。

當(dāng)使用目標(biāo)檢測(cè)方法時(shí)，同一個(gè)目標(biāo)在稍有不同的區(qū)域被多次檢測(cè)到的情況經(jīng)常發(fā)生。

大多數(shù)情況下，我們只想檢測(cè)一次對(duì)象。為了實(shí)現(xiàn)這一點(diǎn)，我們通過應(yīng)用非最大值抑制來刪除冗余的邊界框。非最大抑制現(xiàn)在，向你展示了執(zhí)行非最大抑制的完整功能代碼，這樣你就有了一個(gè)概覽。但別擔(dān)心，我會(huì)帶你看一下代碼。

def NMS（boxes， overlapThresh ＝ 0．4）：
＃返回一個(gè)空列表，如果沒有給出框

if len（boxes）＝＝ 0：
return ［］
x1 ＝ boxes［：， 0］＃ x左上角的坐標(biāo)
y1 ＝ boxes［：， 1］＃ y左上角的坐標(biāo)
x2 ＝ boxes［：， 2］＃ x右下角的坐標(biāo)
y2 ＝ boxes［：， 3］＃ y右下角的坐標(biāo)

＃計(jì)算邊界框的面積，并對(duì)邊界進(jìn)行排序

＃邊框的右下角y坐標(biāo)

areas ＝（x2 － x1 ＋ 1）＊（y2 － y1 ＋ 1）＃需要加1

＃開始時(shí)所有框的索引。

indices ＝ np．a(chǎn)range（len（x1））

for i，box in enumerate（boxes）：
＃創(chuàng)建臨時(shí)索引
temp＿indices ＝ indices［indices�。絠］
＃找出相交方塊的坐標(biāo)
xx1 ＝ np．maximum（box［0］， boxes［temp＿indices，0］）
yy1 ＝ np．maximum（box［1］， boxes［temp＿indices，1］）
xx2 ＝ np．minimum（box［2］， boxes［temp＿indices，2］）
yy2 ＝ np．minimum（box［3］， boxes［temp＿indices，3］）
＃找出交叉框的寬度和高度
w ＝ np．maximum（0， xx2 － xx1 ＋ 1）
h ＝ np．maximum（0， yy2 － yy1 ＋ 1）
＃計(jì)算重疊的比例
overlap ＝（w ＊ h）／ areas［temp＿indices］
＃如果實(shí)際的邊界框與其他框的重疊部分大于閾值，刪除它的索引
if np．a(chǎn)ny（overlap）＞ treshold：
indices ＝ indices［indices ！＝ i］
＃只返回其余索引的方框
return boxes［indices］．a(chǎn)stype（int）

非最大抑制（NMS）函數(shù)接收一組框，閾值默認(rèn)值0．4。

def NMS（boxes， overlapThresh ＝ 0．4）：

框的數(shù)組必須進(jìn)行組織，以便每行包含不同的邊界框。

如果它們重疊更多，則兩個(gè)中的一個(gè)將被丟棄。重疊樹閾值為0．4意味著兩個(gè)矩形可以共享其40％的面積。矩形的面積是用它的寬度乘以它的高度來計(jì)算的。我們?cè)黾?，因?yàn)檫吔缈蛟谄瘘c(diǎn)坐標(biāo)和終點(diǎn)坐標(biāo)上都有一個(gè)像素。

areas ＝（x2 － x1 ＋ 1）＊（y2 － y1 ＋ 1）

然后，我們?yōu)樗锌騽?chuàng)建索引。稍后，我們將逐個(gè)刪除索引，直到只有對(duì)應(yīng)于非重疊框的索引。

indices ＝ np．a(chǎn)range（len（x1））

在循環(huán)中，我們迭代所有框。對(duì)于每個(gè)框，我們檢查它與任何其他框的重疊是否大于閾值。如果是這樣，我們將從索引列表中刪除該框的索引。

我們創(chuàng)建包含方框索引的索引，其中不包含box［i］的索引。

temp＿indices ＝ indices［indices�。絠］

為了計(jì)算重疊，我們首先計(jì)算相交框的坐標(biāo)。這段代碼是矢量化的，以加快速度，我們計(jì)算長(zhǎng)方體［i］與其他長(zhǎng)方體的交點(diǎn)。

xx1 ＝ np．maximum（box［0］， boxes［temp＿indices，0］）
yy1 ＝ np．maximum（box［1］， boxes［temp＿indices，1］）
xx2 ＝ np．minimum（box［2］， boxes［temp＿indices，2］）
yy2 ＝ np．minimum（box［3］， boxes［temp＿indices，3］）

這可能有點(diǎn)混亂，但零點(diǎn)在左上角。因此，我們通過選擇？？？？1及？？？？1的最小值，？？？？2及？？？？2的最大值來獲得相交框的坐標(biāo)。

然后計(jì)算相交框的寬度和高度。我們?nèi)∽畲笾?和計(jì)算的寬度和高度，因?yàn)樨?fù)的寬度和高度會(huì)擾亂重疊的計(jì)算。

w ＝ np．maximum（0， xx2 － xx1 ＋ 1）
h ＝ np．maximum（0， yy2 － yy1 ＋ 1）

重疊就是相交框的面積除以邊界框的面積。在我們的例子中，所有邊界框的大小都相同，但該算法也適用于大小不同的情況。

overlap ＝（w ＊ h）／ areas［temp＿indices］

然后，如果box［i］與任何其他框的重疊大于treshold，則我們從剩余的索引中排除索引i。

if np．a(chǎn)ny（overlap）＞ treshold：
indices ＝ indices［indices �。� i］

然后，我們返回帶有未刪除索引的框。像素坐標(biāo)必須是整數(shù)，所以我們轉(zhuǎn)換它們只是為了安全。

return boxes［indices］．a(chǎn)stype（int）

基于模板匹配的目標(biāo)檢測(cè)你可能會(huì)問自己，我最初是如何得到這些邊界框的。我使用了一種叫做模板匹配的簡(jiǎn)單技術(shù)。你只需要一個(gè)圖像和一個(gè)模板，即你要搜索的對(duì)象。我們的形象將是方塊A。

我們的模板將是圖像中間的方塊。

請(qǐng)注意，模板的方向和大�。ㄒ韵袼貫閱挝唬┍仨毰c要在圖像中檢測(cè)的對(duì)象大致相同。

我們需要opencv。如果你還沒有，可以在終端中安裝。

pip install opencv－python

我們導(dǎo)入cv2。

import cv2

要執(zhí)行模板匹配并從中生成邊界框，我們可以使用以下函數(shù)。

def bounding＿boxes（image， template）：
（tH， tW）＝ template．shape［：2］＃獲取模板的高度和寬度
imageGray ＝ cv2．cvtColor（image， 0）＃將圖像轉(zhuǎn)換為灰度
templateGray ＝ cv2．cvtColor（template， 0）＃將模板轉(zhuǎn)換為灰度

result ＝ cv2．matchTemplate（imageGray， templateGray， cv2．TM＿CCOEFF＿NORMED）＃模板匹配返回相關(guān)性
（y1， x1）＝ np．where（result ＞＝ treshold）＃對(duì)象被檢測(cè)到，其中相關(guān)性高于閾值
boxes ＝ np．zeros（（len（y1）， 4））＃構(gòu)造一個(gè)零數(shù)組
x2 ＝ x1 ＋ tW ＃用模板的寬度計(jì)算x2
y2 ＝ y1 ＋ tH ＃計(jì)算y2與模板的高度
＃填充邊框數(shù)組
boxes［：， 0］＝ x1
boxes［：， 1］＝ y1
boxes［：， 2］＝ x2
boxes［：， 3］＝ y2
return boxes．a(chǎn)stype（int）

cv2．matchTemplate函數(shù)返回圖像不同部分與模板的相關(guān)性。

然后，我們選擇圖像的部分，其中相關(guān)性在閾值之上。

（y1， x1）＝ np．where（result ＞＝ treshold）

我們還需要一個(gè)函數(shù)將邊界框繪制到圖像上。

def draw＿bounding＿boxes（image，boxes）：

for box in boxes：
image ＝ cv2．rectangle（copy．deepcopy（image），box［：2］， box［2：］，（255，0，0）， 3）
return image

完整代碼

import cv2

import pyautogui

import cv2

import numpy as np

import os

import time

import matplotlib．pyplot as plt

import copy

def NMS（boxes， overlapThresh ＝ 0．4）：

＃返回一個(gè)空列表，如果沒有給出框

if len（boxes）＝＝ 0：

return ［］

x1 ＝ boxes［：， 0］＃ x左上角的坐標(biāo)

y1 ＝ boxes［：， 1］＃ y左上角的坐標(biāo)

x2 ＝ boxes［：， 2］＃ x右下角的坐標(biāo)

y2 ＝ boxes［：， 3］＃ y右下角的坐標(biāo)

＃計(jì)算邊界框的面積，并對(duì)邊界進(jìn)行排序

＃邊框的右下角y坐標(biāo)

areas ＝（x2 － x1 ＋ 1）＊（y2 － y1 ＋ 1）＃需要加1

＃開始時(shí)所有框的索引。

indices ＝ np．a(chǎn)range（len（x1））

＃只返回其余索引的方框

return boxes［indices］．a(chǎn)stype（int）

def bounding＿boxes（image， template）：

（tH， tW）＝ template．shape［：2］＃獲取模板的高度和寬度
imageGray ＝ cv2．cvtColor（image， 0）＃將圖像轉(zhuǎn)換為灰度
templateGray ＝ cv2．cvtColor（template， 0）＃將模板轉(zhuǎn)換為灰度

def draw＿bounding＿boxes（image，boxes）：
for box in boxes：
image ＝ cv2．rectangle（copy．deepcopy（image），box［：2］， box［2：］，（255，0，0）， 3）
return image

if ＿＿name＿＿＝＝＂＿＿main＿＿＂：

time．sleep（2）

treshold ＝ 0．8837 ＃關(guān)聯(lián)閾值，以便識(shí)別一個(gè)對(duì)象

template＿diamonds ＝ plt．imread（r＂templates／ace＿diamonds＿plant＿template．jpg＂）
ace＿diamonds＿rotated ＝ plt．imread（r＂images／ace＿diamonds＿table＿rotated．jpg＂）
boxes＿redundant ＝ bounding＿boxes（ace＿diamonds＿rotated， template＿diamonds）＃計(jì)算邊界盒
boxes ＝ NMS（boxes＿redundant）＃刪除多余的包圍框
overlapping＿BB＿image ＝ draw＿bounding＿boxes（ace＿diamonds＿rotated，
boxes＿redundant）＃使用所有多余的邊框繪制圖像
segmented＿image ＝ draw＿bounding＿boxes（ace＿diamonds＿rotated，boxes）＃在圖像上繪制邊界框
plt．imshow（overlapping＿BB＿image）
plt．show（）
plt．imshow（segmented＿image）
plt．show（）

結(jié)論

我們可以使用非最大值抑制來刪除冗余的邊界框。它們是多余的，因?yàn)樗鼈兌啻螛?biāo)記同一對(duì)象。

NMS算法利用相交三角形的面積計(jì)算三角形之間的重疊。如果邊界框與任何其他邊界框的重疊高于閾值，則將刪除該邊界框。

?原文標(biāo)題:非最大抑制?