如何利用PCA和SVM建立一个人脸识别模型-电子发烧友网

在本文中，我们将使用主成分分析和支持向量机来建立人脸识别模型。

首先，让我们了解PCA和SVM是什么：

主成分分析：主成分分析（PCA）是一种机器学习算法，广泛应用于探索性数据分析和建立预测模型，它通常用于降维，通过将每个数据点投影到前几个主成分上，以获得低维数据，同时尽可能保留数据的变化。

Matt Brems的文章全面深入地介绍了该算法。现在，让我们用更简单的术语来理解算法：假设我们现在正在收集数据，我们的数据集产生了多个变量、多个特征，所有这些都会在不同方面影响结果。我们可能会选择删除某些特征，但这意味着会丢失信息。因此我们开源使用另一种减少特征数量（减少数据维数）的方法，通过提取重要信息并删除不重要的信息来创建新的特征，这样，我们的信息就不会丢失，但起到减少特征的作用，而我们模型的过拟合几率也会减少。支持向量机支持向量机（SVM）是一种用于两组分类问题的有监督机器学习模型，在为每个类别提供一组带标签的训练数据后，他们能够对新的测试数据进行分类。

支持向量机基于最大化间隔的平面对数据进行分类，决策边界是直的。支持向量机是一种很好的图像分类算法，实验结果表明，支持向量机在经过3－4轮相关优化后，其搜索精度明显高于传统的查询优化方案，这对于图像分割来说也是如此，包括那些使用改进的支持向量机。Marco Peixeiro的文章解释了需要有一个最大间隔超平面来分类数据，开源帮助你更好地理解SVM！人脸识别人脸是由许多像素组成的高维数据。高维数据很难处理，因为不能用二维数据的散点图等简单技术进行可视化。我们要做的是利用PCA对数据的高维进行降维处理，然后将其输入到SVM分类器中对图像进行分类。下面的代码示例取自关于eigenfaces的sklearn文档，我们将一步一步地实现代码，以了解其复杂性和结果。导入相关库和模块首先，我们将导入所需的库和模块，我们将在后文深入讨论我们为什么要导入它们。import pylab as pl

import numpy as np

from matplotlib import pyplot as plt

from sklearn．model＿selection import train＿test＿split

from sklearn．datasets import fetch＿lfw＿people

from sklearn．model＿selection import GridSearchCV

from sklearn．metrics import classification＿report

from sklearn．metrics import confusion＿matrix

from sklearn．decomposition import PCA as RandomizedPCA

from sklearn．svm import SVC

将数据加载到Numpy数组中接下来，我们将数据下载到磁盘中，并使用fetch＿lfw＿people将其作为NumPy数组加载到sklearn．datasetslfw＿people ＝ fetch＿lfw＿people（min＿faces＿per＿person＝70， resize＝0．4）

lfw数据集包括一个用于研究无约束人脸识别问题的人脸图像数据库，它从网络收集的13000多张照片中包含了超过13000张照片，每个人脸都贴上了照片，1680个人脸在数据集中有两张或两张以上不同的照片。图像采用灰度值（像素值＝0－255）。

如何利用PCA和SVM建立一个人脸识别模型

图像Numpy数组接下来，我们将寻找图像数组图片的形状。我们使用NumPy shape属性，该属性返回一个元组，每个索引都有对应元素的数量。

n＿samples， h， w ＝ lfw＿people．images．shape

np．random．seed（42）

从变量explorer可以看到，我们有1288个样本（图片），高度为50px，宽度为37px（50x37＝1850个特征）Numpy数组我们使用lfw＿people 的data数组，直接存储在X中，我们将在以后的处理中使用这些数据。X ＝ lfw＿people．data

n＿features ＝ X．shape［1］

X中的数据有1288个样本，每个样本有1850个特征。label接下来，我们将定义label，这些label是图片所属人的id。y ＝ lfw＿people．target

target＿names ＝ lfw＿people．target＿names

n＿classes ＝ target＿names．shape［0］

这里，y代表目标，它是每个图片的标签。标签由target＿names变量进一步定义，该变量由7个要识别的人的姓名组成。

如何利用PCA和SVM建立一个人脸识别模型

target是一个1288x1的NumPy数组，它包含1288张图片对应名称的0–6值，因此，如果id＝0的目标值为5，则表示该人脸为“Hugo Chavez”，如target＿names中所示：

因此，y是数字形式的目标，target＿names是名称中的任何目标／标签，n＿classes是存储类数量的变量，在我们的例子中，我们有7个：Ariel SharonColin PowellDonald RumsfeldGeorge W BushGerhard SchröderHugo ChavezTony Blair

让我们打印出变量：print（＂Total dataset size：＂）

print（＂n＿samples：％d＂， n＿samples）

print（＂n＿features：％d＂， n＿features）

print（＂n＿classes：％d＂， n＿classes）

所以，我们有1288个样本（图片），每个样本总共有1850个特征（50px37px）和7个类（人）。划分训练集和测试集接下来，我们使用sklearn．model＿selection将数据（X－特征和y－标签）分为训练数据和测试数据，其中25％用于测试，其余75％用于训练模型。X＿train， X＿test， y＿train， y＿test ＝ train＿test＿split（X， y， test＿size＝0．25， random＿state＝42）

以下是变量X－train、X＿test、y＿train和y＿test：

基于PCA的降维方法现在，我们从 sklearn．decomposition中选择PCA 以训练模型。我们已经在第一段代码中导入了PCA在我们的例子中，我们在训练集X＿train中总共有966个特征，我们使用PCA（维数缩减）将它们减少到50个：n＿components ＝ 50

pca ＝ RandomizedPCA（n＿components＝n＿components， whiten＝True）．fit（X＿train）

这个过程需要不到一秒钟的时间，这可以通过使用时间函数进行验证（让我们暂时跳过它）。现在我们将重塑PCA组件并定义特征脸，这是在人脸识别的计算机视觉问题中使用的一组特征向量的名称：eigenfaces ＝ pca．components＿．reshape（（n＿components， h， w））

如何利用PCA和SVM建立一个人脸识别模型

如截图所示，特征脸是一个50×50×37的Numpy数组，50对应于特征的数量。接下来，我们使用PCA在X＿train 和X＿test 上的transform 函数来降低维数。X＿train＿pca ＝ pca．transform（X＿train）

X＿test＿pca ＝ pca．transform（X＿test）

从上面的截图可以看出，通过PCA算法，X＿train和X＿test的维数都被降低了，每一个都将特征从1850个减少到50个（正如我们在算法中定义的那样）。训练SVM分类器一旦我们完成了降维，就开始分类了。首先，我们将训练SVM分类模型。我们使用GridSearchCV，这是一个库函数，它是一种调整超参数的方法，它将系统地为网格中指定的算法参数的每个组合建立和评估模型，并在最佳估计量，参数在参数网格中给出：print（＂Fitting the classifier to the training set＂）

param＿grid ＝｛

＇C＇：［1e3， 5e3， 1e4， 5e4， 1e5］，

＇gamma＇：［0．0001， 0．0005， 0．001， 0．005， 0．01， 0．1］，

｝

clf ＝ GridSearchCV（SVC（kernel＝＇rbf＇， class＿weight＝＇balanced＇）， param＿grid）

clf ＝ clf．fit（X＿train＿pca， y＿train）

print（＂Best estimator found by grid search：＂）

print（clf．best＿estimator＿）

我们数据的最佳分类器是SVC，参数如下：SVC（C＝1000， class＿weight ＝ ‘balanced’， gamma＝0．01）预测现在让我们在测试数据上预测这些人的名字，我们使用从GridSearchCV中找到的分类器，它已经在训练数据拟合。print（＂Predicting the people names on the testing set＂）

y＿pred ＝ clf．predict（X＿test＿pca）

分类报告和混淆矩阵一旦预测完成，让我们打印分类报告，它显示了模型的精度、召回率、F1分数和支持分数，这使我们对分类器的行为有了更深入的直觉。print（classification＿report（y＿test， y＿pred， target＿names＝target＿names））

让我们打印混淆矩阵：print（confusion＿matrix（y＿test， y＿pred， labels＝range（n＿classes）））

混淆矩阵打印真正例、假正例和假反例的值，并提供分类器的概述。绘图最后，我们将绘制人物肖像和特征脸！我们将定义两个函数：title在测试集的一部分绘制预测结果，plot＿gallery通过绘制它们来评估预测：def title（y＿pred， y＿test， target＿names， i）：

pred＿name ＝ target＿names［y＿pred［i］］．rsplit（＇＇， 1）［－1］

true＿name ＝ target＿names［y＿test［i］］．rsplit（＇＇， 1）［－1］

return ＇predicted：％strue：％s＇％（pred＿name， true＿name）

def plot＿gallery（images， titles， h， w， n＿row＝3， n＿col＝4）：

＂＂＂绘制肖像库的帮助函数＂＂＂

plt．figure（figsize＝（1．8 ＊ n＿col， 2．4 ＊ n＿row））

plt．subplots＿adjust（bottom＝0， left＝．01， right＝．99， top＝．90， hspace＝．35）

for i in range（n＿row ＊ n＿col）：

plt．subplot（n＿row， n＿col， i ＋ 1）

plt．imshow（images［i］．reshape（（h， w））， cmap＝plt．cm．gray）

plt．title（titles［i］， size＝12）

plt．xticks（（））

plt．yticks（（））

现在让我们在测试集的一部分绘制预测结果：prediction＿titles ＝［title（y＿pred， y＿test， target＿names， i）

for i in range（y＿pred．shape［0］）］

plot＿gallery（X＿test， prediction＿titles， h， w）

现在让我们绘制特征面。我们使用在上面代码块中定义的eigenfaces变量。eigenface＿titles ＝［＂eigenface ％d＂％ i for i in range（eigenfaces．shape［0］）］

plot＿gallery（eigenfaces， eigenface＿titles， h， w）

plt．show（）

最后，我们来绘制PCA＋SVM模型用于人脸识别的精度：from sklearn．metrics import accuracy＿score

score ＝ accuracy＿score（y＿test， y＿pred）

print（score）

我们的准确分数是0．81！虽然这并不是一个完美的分数，还有很大的改进空间，但PCA和SVM的人脸识别为我们提供了进一步强大算法的起点！结论本文利用PCA和SVM建立了一个人脸识别模型。主成分分析算法被用来减少数据的维数，然后利用支持向量机进行分类，通过超参数调整寻找最佳估计量。我们对这些肖像进行了分类，准确度得分为0．81。

责任编辑：gt

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

人脸识别

人脸识别

+关注

关注
76

文章
4011

浏览量
81867
机器学习

机器学习

+关注

关注
66

文章
8408

浏览量
132575

FacenetPytorch人脸识别方案--基于米尔全志T527开发板

。FaceNet通过将人脸图像映射到一个高维空间，使得同一个人的不同图像在这个空间中的距离尽可能小，而不同人的图像距离尽可能大。这种嵌入表示可以直接用于

发表于 11-28 15:57

深度识别人脸识别有什么重要作用吗

深度学习人脸识别技术是人工智能领域的一个重要分支，它利用深度学习算法来识别和验证

发表于 09-10 14:55 •501次阅读

深度识别人脸识别在任务中为什么有很强大的建模能力

深度学习人脸识别技术是人工智能领域中的一个重要分支，它利用深度学习算法来识别和验证

发表于 09-10 14:53 •375次阅读

人脸识别技术的原理介绍

人脸识别技术是一种基于人脸特征信息进行身份识别的生物识别技术。它通过分析

发表于 07-04 09:22 •1153次阅读

如何设计人脸识别的神经网络

人脸识别技术是一种基于人脸特征信息进行身份识别的技术，广泛应用于安全监控、身份认证、智能门禁等领域。神经网络是实现

发表于 07-04 09:20 •647次阅读

人脸识别模型训练流程

人脸识别模型训练流程是计算机视觉领域中的一项重要技术。本文将详细介绍人脸识别

发表于 07-04 09:19 •945次阅读

人脸识别模型训练失败原因有哪些

人脸识别模型训练失败的原因有很多，以下是一些常见的原因及其解决方案：数据集质量问题数据集是训练人脸识

发表于 07-04 09:17 •610次阅读

人脸识别模型训练是什么意思

人脸识别模型训练是指通过大量的人脸数据，使用机器学习或深度学习算法，训练出一个能够

发表于 07-04 09:16 •585次阅读

人脸检测模型的精确度怎么算

人脸检测模型的精确度评估是一个复杂的过程，涉及到多个方面的因素。本文将从以下几个方面进行介绍：人脸检测模

发表于 07-04 09:14 •498次阅读

人脸检测模型有哪些

人脸检测是计算机视觉领域的一个重要研究方向，它涉及到从图像或视频中检测出人脸的位置和大小。随着深度学习技术的发展，人脸检测

发表于 07-03 17:05 •1010次阅读

人脸检测和人脸识别的区别是什么

人脸检测和人脸识别是计算机视觉领域的两个重要技术，它们在许多应用场景中都有广泛的应用，如安全监控、身份验证、社交媒体等。尽管它们在某些方面有相似之处，但它们之间存在

发表于 07-03 14:49 •1189次阅读

人脸检测与识别的方法有哪些

人脸检测与识别是计算机视觉领域中的一个重要研究方向，具有广泛的应用前景，如安全监控、身份认证、智能视频分析等。本文将详细介绍人脸检测与

发表于 07-03 14:45 •709次阅读

人脸识别闸机在楼宇出入中的应用

人脸识别闸机的应用在楼宇出入管理中引起了广泛关注。人脸识别闸机作为一种创新的出入口管理设备，已广泛运用于各类楼宇，如办公大楼、住宅小区、学校

发表于 05-27 10:14 •419次阅读

人脸识别终端 10寸人脸机

终端人脸识别

深圳市远景达物联网技术有限公司
发布于 :2024年04月22日 16:01:46

人脸识别技术的原理是什么人脸识别技术的特点有哪些

人脸识别技术的原理人脸识别技术是一种通过计算机以图像或视频为输入，识别、检测、跟踪和分析

发表于 02-18 13:52 •1879次阅读

搜索历史

如何利用PCA和SVM建立一个人脸识别模型

评论

FacenetPytorch人脸识别方案--基于米尔全志T527开发板

深度识别人脸识别有什么重要作用吗

深度识别人脸识别在任务中为什么有很强大的建模能力

人脸识别技术的原理介绍

如何设计人脸识别的神经网络

人脸识别模型训练流程

人脸识别模型训练失败原因有哪些

人脸识别模型训练是什么意思

人脸检测模型的精确度怎么算

人脸检测模型有哪些

人脸检测和人脸识别的区别是什么

人脸检测与识别的方法有哪些

人脸识别闸机在楼宇出入中的应用

人脸识别终端 10寸人脸机

人脸识别技术的原理是什么人脸识别技术的特点有哪些