计算机视觉可以学习美式手语，进而帮助听力障碍群体吗？-电子发烧友网

前言

计算机视觉可以学习美式手语，进而帮助听力障碍群体吗？数据科学家David Lee用一个项目给出了答案。

如果听不到了，你会怎么办？如果只能用手语交流呢？

当对方无法理解你时，即使像订餐、讨论财务事项，甚至和朋友家人对话这样简单的事情也可能令你气馁。对普通人而言轻轻松松的事情对于听障群体可能是很困难的，他们甚至还会因此遭到歧视。

在很多场景下，他们无法获取合格的翻译服务，从而导致失业、社会隔绝和公共卫生问题。为了让更多人听到听障群体的声音，数据科学家 David Lee 尝试利用数据科学项目来解决这一问题：计算机视觉可以学习美式手语，进而帮助听力障碍群体吗？

如果通过机器学习应用可以精确地翻译美式手语，即使从最基础的字母表开始，我们也能向着为听力障碍群体提供更多的便利和教育资源前进一步。

数据和项目介绍

出于多种原因，David Lee决定创建一个原始图像数据集。首先，基于移动设备或摄像头设置想要的环境，需要的分辨率一般是720p或1080p。现有的几个数据集分辨率较低，而且很多不包括字母「J」和「Z」，因为这两个字母需要一些动作才能完成。

为此，David Lee 在社交平台上发送了手语图像数据收集请求，介绍了这个项目和如何提交手语图像的说明，希望借此提高大家的认识并收集数据。

数据变形和过采样

David Lee 为该项目收集了 720 张图片，其中还有几张是他自己的手部图像。由于这个数据集规模较小，于是 David 使用 labelImg 软件手动进行边界框标记，设置变换函数的概率以基于同一张图像创建多个实例，每个实例上的边界框有所不同。下图展示了数据增强示例：

经过数据增强后，该数据集的规模从 720 张图像扩展到 18，000 张图像。

建模

David 选择使用 YOLOv5 进行建模。将数据集中 90% 的图像用作训练数据，10% 的图像用作验证集。使用迁移学习和 YOLOv5m 预训练权重训练 300 个 epoch。

在验证集上成功创建具备标签和预测置信度的新边界框。

由于损失值并未出现增长，表明模型未过拟合，因此该模型或许可以训练更多轮次。模型最终获得了 85.27% 的 mAP@.5：.95 分数。

图像推断测试

David 额外收集了他儿子的手部图像数据作为测试集。事实上，还没有儿童手部图像用于训练该模型。理想情况下，再多几张图像有助于展示模型的性能，但这只是个开始。

26 个字母中，有 4 个没有预测结果（分别是 G、H、J 和 Z）。四个没有得到准确预测：

D 被预测为 F；

E 被预测为 T；

P 被预测为 Q；

R 被预测为 U。

视频推断测试

即使只有几个手部图像用于训练，模型仍能在如此小的数据集上展现不错的性能，而且还能以一定的速度提供优秀的预测结果，这一结果表现出了很大的潜力。更多数据有助于创建可在多种新环境中使用的模型。如以上视频所示，即使字母有一部分出框了，模型仍能给出不错的预测结果。最令人惊讶的是，字母 J 和 Z 也得到了准确识别。

其他测试

执行其他一些测试，例如：左手手语测试

几乎所有原始图像都显示的是右手，但惊喜地发现数据增强在这里起到了作用，因为有 50% 的可能性是针对左手用户进行水平翻转。

儿童手语测试

儿童的手语数据未被用于训练集，但模型对此仍有不错的预测。

多实例

尽管手语的使用和视频中有所不同，但这个示例表明当多个人出现在屏幕上时，模型可以分辨出不止一个手语实例。

模型局限性

发现该模型还有一些地方有待改进。

距离

许多原始图像是用手机拍摄的，手到摄像头的距离比较近，这对远距离推断有一定负面影响。

新环境

这支视频来自于志愿者，未用于模型训练。尽管模型看到过很多字母，但对此的预测置信度较低，还有一些错误分类。

背景推断

该测试旨在验证不同的背景会影响模型的性能。

结论

这个项目表明：计算机视觉可用于帮助听力障碍群体获取更多便利和教育资源！该模型在仅使用小型数据集的情况下仍能取得不错的性能。即使对于不同环境中的不同手部，模型也能实现良好的检测结果。

而且一些局限性是可以通过更多训练数据得到解决的。经过调整和数据集的扩大，该模型或许可以扩展到美式手语字母表以外的场景。

责任编辑：lq

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

手势识别

手势识别

+关注

关注
8

文章
225

浏览量
47920
计算机视觉

计算机视觉

+关注

关注
8

文章
1702

浏览量
46225
数据集

数据集

+关注

关注
4

文章
1212

浏览量
24964

原文标题：YOLOv5的项目实践 | 手势识别项目落地全过程（附源码）

文章出处：【微信号：vision263com，微信公众号：新机器视觉】欢迎添加关注！文章转载请注明出处。

【小白入门必看】一文读懂深度学习计算机视觉技术及学习路线

一、什么是计算机视觉？计算机视觉，其实就是教机器怎么像我们人一样，用摄像头看看周围的世界，然后理解它。比如说，它能认出这是个苹果，或者那边有辆车。除此之外，还能把拍到的照片或者视频转换

发表于 10-31 17:00 •682次阅读

【小白入门必看】一文读懂深度<b class='flag-5'>学习</b><b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>技术及<b class='flag-5'>学习</b>路线

计算机视觉有哪些优缺点

计算机视觉作为人工智能领域的一个重要分支，旨在使计算机能够像人类一样理解和解释图像和视频中的信息。这一技术的发展不仅推动了多个行业的变革，也带来了诸多优势，但同时也伴随着一些挑战和局限性。以下是对

发表于 08-14 09:49 •1270次阅读

机器视觉和计算机视觉有什么区别

机器视觉和计算机视觉是两个密切相关但又有所区别的概念。一、定义机器视觉机器视觉，又称为计算机

发表于 07-16 10:23 •711次阅读

计算机视觉的五大技术

计算机视觉作为深度学习领域最热门的研究方向之一，其技术涵盖了多个方面，为人工智能的发展开拓了广阔的道路。以下是对计算机视觉五大技术的详细解析

发表于 07-10 18:26 •1739次阅读

计算机视觉的工作原理和应用

图像和视频中提取有用信息，进而进行决策和行动。自1960年代第一批学术论文问世以来，计算机视觉技术已经取得了长足的发展，并在多个领域展现出巨大的应用潜力和价值。

发表于 07-10 18:24 •2489次阅读

计算机视觉与人工智能的关系是什么

引言 计算机视觉是一门研究如何使计算机能够理解和解释视觉信息的学科。它涉及到图像处理、模式识别、机器学习等多个领域的知识。人工智能则是研究如

发表于 07-09 09:25 •855次阅读

计算机视觉与智能感知是干嘛的

引言 计算机视觉（Computer Vision）是一门研究如何使计算机能够理解和解释视觉信息的学科。它涉及到图像处理、模式识别、机器学习等

发表于 07-09 09:23 •1226次阅读

计算机视觉和机器视觉区别在哪

计算机视觉和机器视觉是两个密切相关但又有明显区别的领域。一、定义 计算机视觉 计算机

发表于 07-09 09:22 •586次阅读

计算机视觉和图像处理的区别和联系

计算机视觉和图像处理是两个密切相关但又有明显区别的领域。 1. 基本概念 1.1 计算机视觉 计算机视觉

发表于 07-09 09:16 •1660次阅读

计算机视觉在人工智能领域有哪些主要应用?

与分类是计算机视觉的基础应用之一。通过训练机器学习模型，计算机可以识别和分类各种图像，如动物、植物、物体等。这种技术在许多领域都有应用，如搜

发表于 07-09 09:14 •1850次阅读

计算机视觉属于人工智能吗

属于，计算机视觉是人工智能领域的一个重要分支。引言 计算机视觉是一门研究如何使计算机具有视觉能

发表于 07-09 09:11 •1547次阅读

深度学习在计算机视觉领域的应用

随着人工智能技术的飞速发展，深度学习作为其中的核心技术之一，已经在计算机视觉领域取得了显著的成果。计算机视觉，作为

发表于 07-01 11:38 •1129次阅读

机器视觉与计算机视觉的区别

在人工智能和自动化技术的快速发展中，机器视觉（Machine Vision, MV）和计算机视觉（Computer Vision, CV）作为两个重要的分支领域，都扮演着至关重要的角色。尽管它们在

发表于 06-06 17:24 •1601次阅读

计算机视觉的主要研究方向

计算机视觉（Computer Vision, CV）作为人工智能领域的一个重要分支，致力于使计算机能够像人眼一样理解和解释图像和视频中的信息。随着深度学习、大数据等技术的快速发展，

发表于 06-06 17:17 •1307次阅读

开源项目！设计一款智能手语翻译眼镜

和精确的手语翻译。这款智能手语翻译眼镜不仅是一个技术突破，更是通向无障碍沟通世界的一大步。硬件部分本项目中，需要一台功能强大的单板计算机（SBC）来处理

发表于 05-20 15:59

搜索历史

计算机视觉可以学习美式手语，进而帮助听力障碍群体吗？

评论

【小白入门必看】一文读懂深度学习计算机视觉技术及学习路线

计算机视觉有哪些优缺点

机器视觉和计算机视觉有什么区别

计算机视觉的五大技术

计算机视觉的工作原理和应用

计算机视觉与人工智能的关系是什么

计算机视觉与智能感知是干嘛的

计算机视觉和机器视觉区别在哪

计算机视觉和图像处理的区别和联系

计算机视觉在人工智能领域有哪些主要应用?

计算机视觉属于人工智能吗

深度学习在计算机视觉领域的应用

机器视觉与计算机视觉的区别

计算机视觉的主要研究方向

开源项目！设计一款智能手语翻译眼镜