學(xué)習(xí)使用計算機視覺進行人臉檢測
概述
在本文中,我們將制作一個人臉檢測應(yīng)用程序,它將檢測圖像中的單個人臉并同時檢測多個人臉,因此,整篇文章將重點介紹使用計算機視覺進行人臉檢測。在這里,我們將使用 HAAR 級聯(lián)分類器進行檢測;出于檢測目的,我們將學(xué)習(xí)檢測圖像中人臉?biāo)婕暗乃屑夹g(shù)和過程。

人臉檢測的應(yīng)用
1. 人臉識別:人臉識別是進一步做的事情,即在人臉檢測之后,進行人臉識別。
2. 濾鏡:如今,我們生活在社交媒體的世界里,我們可以看到全球市場上有各種各樣的濾鏡和有趣的應(yīng)用程序;要進行此類應(yīng)用,我們還需要先檢測人臉,然后應(yīng)用濾鏡。
3. 人臉解鎖應(yīng)用程序:我們經(jīng)常在手機中使用此功能,但我們知道,這也需要檢測人臉。
所以讓我們開始吧!
加載必要的庫
# Import the necessary libraries
import numpy as np
import cv2
import matplotlib.pyplot as plt
%matplotlib inline
加載圖像
# Loading the image to be tested
test_image = cv2.imread('data/baby1.png')
# Here we are converting the colored image into gray image
if(test_image is not None):
test_image_gray = cv2.cvtColor(test_image, cv2.COLOR_BGR2GRAY)
test_image_gray
# Displaying grayscale image
plt.imshow(test_image_gray, cmap='gray')
輸出:

我們很清楚 OpenCV 的檢測器功能默認(rèn)讀取 BGR 格式的現(xiàn)有圖像,但最終用戶通常不會考慮 BGR 格式;因此我們需要將 BGR 格式的圖像轉(zhuǎn)換為 RGB 格式,即彩色圖像,它具有負(fù)責(zé)創(chuàng)建彩色圖像的所有 3 個通道(R-Red、G-Green、B-Blue)。
因此,我們將創(chuàng)建一個函數(shù)來將 BGR 圖像轉(zhuǎn)換為 RGB 圖像。
def convertToRGB(image):
return cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
HAAR 級聯(lián)文件
HAAR 級聯(lián)是計算機視覺領(lǐng)域的一個很好的術(shù)語。當(dāng)我們談?wù)?HAAR 級聯(lián)分類器時,不僅僅是人臉預(yù)訓(xùn)練分類器,我們可以得到經(jīng)過訓(xùn)練來檢測微笑、汽車、公共汽車的分類器,這些級聯(lián)文件總是采用 XML 文件格式,通常我們使用現(xiàn)有的級聯(lián)文件,但事實上我們也可以在這里創(chuàng)建它們,為了簡單起見,我們將使用 HAAR 級聯(lián)正面人臉分類器來檢測圖像中人臉的位置。
加載正面分類器
haar_cascade_face = cv2.CascadeClassifier('data/haarcascades/haarcascade_frontalface_alt2.xml')
人臉檢測
對于人臉檢測,我們需要從坐標(biāo)中獲取人臉的坐標(biāo),我的意思是 X、Y 坐標(biāo)以及人臉的高度和寬度,然后我們可以在給定的坐標(biāo)下在圖像上繪制一個矩形,我們有detectMultiScale函數(shù),它將為我們提供所有需要的坐標(biāo)來規(guī)劃矩形。
face_coordinate = haar_cascade_face.detectMultiScale(test_image_gray, scaleFactor = 1.2, minNeighbors = 5);
# Let us print the no. of faces found
print('Faces found: ', len(face_coordinate))
輸出:
Faces found: 1
所以之前,在使用 detectMultiScale 函數(shù)時,我們獲取了圖像的 x 坐標(biāo)和 y 坐標(biāo)以及高度和寬度,現(xiàn)在我們將使用這些點循環(huán)遍歷圖像的每個點并在臉部上繪制厚度為 2 個像素的矩形。
for (x_face,y_face,w_face,h_face) in face_coordinate:
cv2.rectangle(test_image, (x_face, y_face), (x_face+w_face, y_face+h_face), (0, 255, 0), 2)
由于現(xiàn)在已經(jīng)完成了完整的過程,是時候檢查我們到目前為止執(zhí)行的所有步驟是否正確,在Matplotlib 的 show 函數(shù)的幫助下,我們將看到處理后的圖像,看看它是否可以檢測到圖像中的人臉。
#convert image to RGB and show image
plt.imshow(convertToRGB(test_image))
輸出:

自動人臉檢測過程的函數(shù)
def detect_faces(cascade, test_image, scaleFactor = 1.1):
# Here with the help of copy() function we will hold the copy of the original image
image_copy = test_image.copy()
# Here with the help of cvtColor function we are converting the image from BGR format to gray image
gray_image = cv2.cvtColor(image_copy, cv2.COLOR_BGR2GRAY)
# Finally we are using the haar cascade function with detectMultiscale to get the coordiates of the faces in the given image
faces_rect = cascade.detectMultiScale(gray_image, scaleFactor=scaleFactor, minNeighbors=1)
for (x_face, y_face, w_face, h_face) in faces_rect:
cv2.rectangle(image_copy, (x_face, y_face), (x_face+w_face, y_face+h_face), (0, 255, 0), 2)
return image_copy
代碼分解:在這里,我們構(gòu)建了檢測人臉的函數(shù);讓我們看看這里發(fā)生了什么:
1. 首先,我們使用copy函數(shù)來存儲原始圖像,這樣任何不需要的更改都不應(yīng)該存在于原始圖像中
2. 然后我們將BGR 格式的圖像轉(zhuǎn)換為灰度圖像,因為 cv2 以灰度格式讀取圖像只是為了更好的可讀性。
3. 然后,在 detectMultiScale 函數(shù)的幫助下, 評論中已經(jīng)提到了這一點。
4. 最后,利用 detectMultiScale 函數(shù)得到的坐標(biāo),繪制出 2 像素厚的綠色矩形
在新圖像上測試
#loading image
test_image2 = cv2.imread('data/baby2.png')
#call the function to detect faces
faces = detect_faces(haar_cascade_face, test_image2)
#convert to RGB and display image
plt.imshow(convertToRGB(faces))
輸出:

檢測多個人臉的測試
#loading image
test_image2 = cv2.imread('data/group.png')
#call the function to detect faces
faces = detect_faces(haar_cascade_face, test_image2)
#convert to RGB and display image
plt.imshow(convertToRGB(faces))
輸出:

保存圖像
cv2.imwrite('image1.png',faces)
輸出:
True
結(jié)論
1. 因此,在使用計算機視覺進行人臉檢測時,我們首先導(dǎo)入必要的庫并加載我們需要執(zhí)行人臉檢測的圖像。
2. 然后我們了解了 HAAR 級聯(lián)文件和正面分類器。除此之外,還學(xué)習(xí)了 detectMultiScale 函數(shù)的使用。
3. 當(dāng)我們意識到整個檢測過程非常耗時的時候,我們嘗試構(gòu)建一個函數(shù)來自動化這個過程。
4. 然后使用函數(shù),我們可以檢測到圖像的多張人臉。
5. 最后,我們保存了檢測到的人臉圖像。
因此,以上是使用計算機視覺準(zhǔn)備人臉檢測應(yīng)用程序時必須遵循的步驟
原文標(biāo)題 : 學(xué)習(xí)使用計算機視覺進行人臉檢測
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
即日-5.20立即下載>> 【限時免費】物理場仿真助力生物醫(yī)學(xué)領(lǐng)域技術(shù)創(chuàng)新
-
精彩回顧立即查看>> 【直播】 智測未來·2026海克斯康春季產(chǎn)品創(chuàng)新日
-
精彩回顧立即查看>> 【線下論壇】新唐科技×芯唐南京 2026 年度研討會
-
精彩回顧立即查看>> OFweek 2026(第十五屆)中國機器人產(chǎn)業(yè)大會
-
精彩回顧立即查看>> 維科杯· OFweek 2025中國機器人行業(yè)年度評選
-
精彩回顧立即查看>> 【在線會議】液冷服務(wù)器信號完整性及冷卻液關(guān)鍵電參數(shù)測試
推薦專題
- 1 AI狂歡遇上油價破百,全球股市還能漲多久? | 產(chǎn)聯(lián)看全球
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實測:中文穩(wěn)、細(xì)節(jié)炸,設(shè)計師慌了
- 3 6000億美元估值錨定:字節(jié)跳動的“去單一化”突圍與估值重構(gòu)
- 4 Tesla AI5芯片最新進展總結(jié)
- 5 連夜測了一波DeepSeek-V4,我發(fā)現(xiàn)它可能只剩“審美”這個短板了
- 6 熱點丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 7 AI界的殺豬盤:9秒刪庫跑路,全員被封號,還繼續(xù)扣錢!
- 8 2026,人形機器人只贏了面子
- 9 DeepSeek降價90%:價格屠夫不是身份,是戰(zhàn)略
- 10 AI Infra產(chǎn)業(yè)鏈卡在哪里了?
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市


分享













