谷歌升级浏览器中的虹膜追踪模型-电子发烧友网

虹膜追踪(Iris tracking) 可广泛应用于多个领域，如辅助技术中的免触摸界面，以及了解除点击和手势以外的用户行为。虹膜追踪同时也是一项具有挑战性的计算机视觉问题。眼睛在环境光照条件不同时会经常变化，且眼睛经常会被遮挡住，而当观察对象转动头部或做不同的表情时，其眼睛形状也可能随之变化。现有的解决方法非常依赖专用硬件，通常需要使用昂贵的头戴式设备或远程的眼动追踪器系统。这些方法并不适合计算资源有限的移动设备。

实现眼球重新着色的示例

今年 3 月，我们宣布推出了一个可在浏览器中检测面部特征点的新软件包。今天，我们很高兴可以通过 TensorFlow.js 面部特征点检测模型将虹膜追踪添加到此软件包中。而这要归功于 MediaPipe Iris 模型。我们已弃用原来的 Facemesh 模型，因此我们之后将为面部特征点检测模型提供更新。

TensorFlow.js 面部特征点检测模型
https://www.npmjs.com/package/@tensorflow-models/face-landmarks-detection

MediaPipe Iris 模型
https://google.github.io/mediapipe/solutions/iris

原来的 Facemesh 模型
https://www.npmjs.com/package/@tensorflow-models/facemesh

请注意，虹膜追踪不会推断人们正在注视的位置，也不会提供任何形式的身份识别。在我们模型的文档和随附的模型卡中，我们详述了模型的预期用途、限制和公平性属性（与 Google 的 AI 原则保持一致）。

Google 的 AI 原则
https://www.blog.google/technology/ai/ai-principles/

MediaPipe Iris 模型能够使用单个 RGB 摄像头实时追踪涉及虹膜和瞳孔的特征点，而无需借助专用硬件。模型还能返回眼睑和眉毛区域的特征点，实现对眨眼等轻微眼球运动的检测（立即在浏览器中尝鲜）。

尝鲜

https://storage.googleapis.com/tfjs-models/demos/face-landmarks-detection/index.html

faceLandmarksDetection简介

熟悉我们现有 Facemesh 模型的用户，只需更改少量的代码，就可以升级到新的 faceLandmarksDetection 模型，详细的操作说明将在下方列出。faceLandmarksDetection 对 Facemesh 进行了三项重大改进：

虹膜关键点检测

改进了对眼睑轮廓的检测

改进了对转动的面部的检测

我们在上方的 GIF 中突出显示了这些改进，该 GIF 展示了对于同一个图像序列，faceLandmarksDetection 和 Facemesh 所返回的特征点有何不同。

安装

faceLandmarksDetection 软件包有两种安装方法：

1. 通过脚本标记：

2. 通过 NPM（使用 yarn(https://yarnpkg.com/) 软件包管理工具）：

$ yarn add @tensorflow-models/face-landmarks-detection@0.0.1 $ yarn add @tensorflow/tfjs@2.6.0

用法

安装软件包后，您只需加载模型权重，然后输入图像即可开始检测面部特征点：

// 如果您使用 NPM，需请求加载模型。如果您使用脚本标签，您可以跳过此步骤，因为 faceLandmarksDetection 在全局范围内已经可用 const faceLandmarksDetection = require('@tensorflow-models/face-landmarks-detection'); // 加载 faceLandmarksDetection 模型 const model = await faceLandmarksDetection.load( faceLandmarksDetection.SupportedPackages.mediapipeFacemesh); // 将视频流输入模型，并从 MediaPipe 计算图中获取真检测到的面部数组。 // 对于 Node 用户，estimateFaces API 还接受 tf.Tensor3D 或 ImageData 对象。 const video = document.querySelector("video"); const faces = await model.estimateFaces({ input: video });

对 estimateFaces 的输入可以是视频、静态图像、“tf.Tensor3D”函数，甚至是供 node.js 管道使用的 ImageData 对象。FaceLandmarksDetection 随后会为输入的面部返回一组预测对象，其中包括每个面部的相关信息（例如，置信度得分和面部 478 个特征点的位置）。

tf.Tensor3D
https://js.tensorflow.org/api/latest/#tensor3d

ImageData
https://developer.mozilla.org/en-US/docs/Web/API/ImageData

以下是预测对象示例：

{ faceInViewConfidence: 1, boundingBox: { topLeft: [232.28, 145.26], // [x, y] bottomRight: [449.75, 308.36], }, mesh: [ [92.07, 119.49, -17.54], // [x, y, z] [91.97, 102.52, -30.54], ... ], // 每个面部特征值在输入空间中的 x,y,z 位置 scaledMesh: [ [322.32, 297.58, -17.54], [322.18, 263.95, -30.54] ], // x,y,z 位置的语意分组 annotations: { silhouette: [ [326.19, 124.72, -3.82], [351.06, 126.30, -3.00], ... ], ... } }

请参阅我们的 README，了解更多有关此 API 的详情。

README
https://github.com/tensorflow/tfjs-models/tree/master/face-landmarks-detection

性能

FaceLandmarksDetection 是轻量级软件包，其占用空间仅有 3MB 左右，因此非常适合用于在各种移动设备上执行实时推理。在测试时，请注意 TensorFlow.js 还会提供几种不同的后端供您选择，包括 WebGL 和带 XNNPACK 的 WebAssembly (WASM)，可在搭载低端 GPU 的设备上使用。下表显示的是该软件包在几种不同的设备和 TensorFlow.js 后端中的表现：

桌面设备：

移动设备：

XNNPACK
https://github.com/google/XNNPACK

所有基准测试结果均收集自 Chrome 浏览器。如需详细了解如何为 TF.js WebAssembly 后端激活 SIMD，请参阅这篇文章。

展望

TensorFlow.js 和 MediaPipe 团队都计划利用经过改进的虹膜坐标，为我们的面部特征点检测解决方案添加深度预测功能。我们坚信分享代码可以实现研究重现、快速实验，并期待看到 MediaPipe Iris 模型在社区中得到更广泛的使用。

快来尝鲜！

通过此链接在您的网络浏览器中试用我们的新软件包。我们期待看到您在自己的应用中使用此模型。

此链接
https://storage.googleapis.com/tfjs-models/demos/face-landmarks-detection/index.html

更多信息

点击此处以详细了解 MediaPipe Iris 模型：MediaPipe Iris

MediaPipe Iris
https://google.github.io/mediapipe/solutions/iris.html

了解模型的预期用途、限制和公平性属性：模型卡

模型卡
https://mediapipe.page.link/iris-mc

阅读我们宣布推出 MediaPipe Iris 的原始 Google AI 文章：推出 MediaPipe Iris: 不受限的虹膜跟踪和深度估

阅读我们在 arXiv 上发表的论文：《用于数字木偶的单目视频实时瞳孔追踪》Z(Real-time Pupil Tracking from Monocular Video for Digital Puppetry)

用于数字木偶的单目视频实时瞳孔追踪
https://arxiv.org/abs/2006.11341

责任编辑：xj

原文标题：推出 MediaPipe Iris，升级浏览器中的虹膜追踪模型！

文章出处：【微信公众号：TensorFlow】欢迎添加关注！文章转载请注明出处。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

谷歌

谷歌

+关注

关注
27

文章
6166

浏览量
105340
浏览器

浏览器

+关注

关注
1

文章
1024

浏览量
35343
虹膜识别

虹膜识别

+关注

关注
4

文章
425

浏览量
39548

原文标题：推出 MediaPipe Iris，升级浏览器中的虹膜追踪模型！

文章出处：【微信号：tensorflowers，微信公众号：Tensorflowers】欢迎添加关注！文章转载请注明出处。

讯飞星火浏览器插件全新升级

时刻陪伴，星火插件让你的浏览器变成真正的生产力工具。

发表于 12-25 09:48 •103次阅读

美司法部要求谷歌剥离Chrome浏览器及安卓系统

近期，美国司法部在一份提交给法院的文件中，正式提出了对谷歌的严厉要求。他们请求法官裁定，要求谷歌剥离其广受欢迎的Chrome浏览器业务。此举意味着，

发表于 11-22 13:46 •242次阅读

AWTK 最新动态：支持浏览器控件

导读AWTK浏览器控件，基于webview项目实现，将浏览器嵌入到AWTK应用程序中，让开发者可以方便的集成在线帮助和调用地图等功能。awtk-widget-web-view是基于webview实现的AWTK

发表于 11-20 01:05 •198次阅读

美国司法部将推动谷歌出售Chrome浏览器

美国司法部近日表示，将推动谷歌出售其Chrome浏览器业务，旨在打破谷歌在互联网领域的垄断地位。此外，司法部还要求谷歌采取措施，允许网站选择不使用人工智能技术。

发表于 11-19 16:22 •256次阅读

写一个Chrome浏览器插件

一、什么是浏览器插件 浏览器插件是依附于浏览器，用来拓展网页能力的程序。插件具有监听浏览器事件、获取和修改网页元素、拦截网络请求、添加快捷菜单等功能。使用

发表于 11-18 17:12 •314次阅读

谷歌Chrome浏览器新增三大AI功能，提升用户体验

谷歌近日宣布，在其广受欢迎的Chrome浏览器中引入了三项前沿的AI技术功能，旨在为用户提供更加智能、便捷的浏览体验。这些新功能由Gemini技术强力驱动，目前已在Chrome桌面版上

发表于 08-05 11:26 •674次阅读

Opera浏览器引领潮流，全球首接端侧AI大模型

昆仑万维旗下海外平台Opera宣布，其旗舰浏览器Opera One和游戏浏览器Opera GX将正式接入端侧AI大模型，成为全球首个实现这一突破的主流浏览器。

发表于 06-03 09:18 •736次阅读

Opera联手谷歌云，搭载Gemini大模型，助力浏览器AI助手Aria图像升级

据悉，Aria 是 Opera 原生浏览器内置的 AI 助手，由 Opera multi-LLM Composer AI 引擎驱动，支持用户根据需求选用不同的大模型。

发表于 05-30 11:50 •439次阅读

谷歌迅速修复Chrome浏览器安全漏洞，已向用户推送更新

谷歌已向Mac/Windows及Linux平台分别推出125.0.6422.60/.61与125.0.6422.60版Chrome浏览器，预计数周内完成全网部署。

发表于 05-16 11:43 •440次阅读

Chrome浏览器新增Gemini Nano，实现文本生成等本地功能

据悉，谷歌早于去年已利用这一技术为Pixel 8及Pro版手机打造了本地运行的Gemini Nano模型。为使其适用于Chrome浏览器，谷歌对模型

发表于 05-15 11:22 •631次阅读

谷歌Chrome浏览器将提供激进的内存节省方案

谷歌Chrome浏览器自推出以来因过度消耗内存而广受诟病，因此，近日谷歌已上线“内存使用情况”工具，供用户查看当前标签页面所占内存容量（MB）。如今，谷歌计划实施更为高效的内存管理策略

发表于 05-09 16:25 •513次阅读

Mozilla Firefox浏览器推出Text Fragments功能，提升用户体验

早在2020年，谷歌即在Chrome浏览器中推出了“Scroll to Text Fragments”功能，而Edge、Opera、Brave、Vivaldi以及苹果Safari等基于Chromium的

发表于 04-08 10:21 •618次阅读

高通和谷歌宣布推出面向搭载骁龙的Windows PC的优化版Chrome浏览器

高通技术公司和谷歌今日宣布，即日起推出面向搭载骁龙的Windows PC的优化版Chrome浏览器，先于2024年年中即将发布的搭载骁龙®X Elite计算平台的PC面市。

发表于 03-27 14:05 •579次阅读

谷歌模型怎么用手机打开网页

请注意，谷歌模型本身是一个计算机程序，它并不能直接在手机浏览器上运行。但是，你可以使用手机上的谷歌浏览器来访问和

发表于 03-01 16:19 •632次阅读

谷歌宣布放弃Fuchsia OS引入完整Chrome/Chromium浏览器

此前的Chromium例行代码更新显示，谷歌决定终止将完整Chrome/Chromium浏览器引入至Fuchsia OS的计划。

发表于 01-16 14:02 •752次阅读

搜索历史

谷歌升级浏览器中的虹膜追踪模型

评论

讯飞星火浏览器插件全新升级

美司法部要求谷歌剥离Chrome浏览器及安卓系统

AWTK 最新动态：支持浏览器控件

美国司法部将推动谷歌出售Chrome浏览器

写一个Chrome浏览器插件

谷歌Chrome浏览器新增三大AI功能，提升用户体验

Opera浏览器引领潮流，全球首接端侧AI大模型

Opera联手谷歌云，搭载Gemini大模型，助力浏览器AI助手Aria图像升级

谷歌迅速修复Chrome浏览器安全漏洞，已向用户推送更新

Chrome浏览器新增Gemini Nano，实现文本生成等本地功能

谷歌Chrome浏览器将提供激进的内存节省方案

Mozilla Firefox浏览器推出Text Fragments功能，提升用户体验

高通和谷歌宣布推出面向搭载骁龙的Windows PC的优化版Chrome浏览器

谷歌模型怎么用手机打开网页

谷歌宣布放弃Fuchsia OS引入完整Chrome/Chromium浏览器