闪亮的手机屏幕能够安抚哭闹的孩子,然而,21世纪的父母必须权衡儿童使用手机的利弊,防止他们沉迷王者荣耀、“吃鸡”游戏或者不知不觉地在淘宝、亚马逊上购买玩具。
幸运的是,由南卡罗来纳大学和中国浙江大学的研究人员开发的新软件(iCare)可以帮助解决这个育儿难题。
在iCare中研究人员开发了一种算法,用于测量用户与移动设备的互动,并可以可靠地分辨出用户是成人还是小孩。如果软件检测到是孩子在用手机,它可以自动阻止访问零售商、电子邮件等应用程序以及儿童不宜的网站。
iCare能够记录像手指按压的表面积、手指施加的压力和滑动长度等度量数据。研究人员分别从一群3至11岁的儿童(共17人)和一群22至60岁的成年人(共14人)那里收集数据。其测试的准确率达到了84%,8次滑动之后,准确率可达到97%。
不过,该算法尚未被整合到操作系统中,论文已经发表在移动技术大会HotMobile上。
基本理念:儿童与成年人与手机互动的方式不同
人体工程学和运动机能学已经表明,我们可以在相似年龄段的人群中发现共同的特征。本项研究的主要假设是儿童与成年人以不同的方式与智能手机进行互动。我们希望从智能手机上的正常触摸操作中提取儿童用户的特征。我们的想法基于以下两个观察:
首先,在尺寸方面,儿童和成人之间手部几何结构不同:儿童手部较小,而手指触碰点较一般成人短。因此,儿童往往会在较窄的屏幕范围内接触,并以较短的轨迹滑动。
其次,与成年人相比,儿童与智能手机互动的灵巧性差。根据我们的观察,孩子们在智能手机上的每次触摸都比成人慢,速度也较慢。当他们尝试在两次触摸操作之间切换时,即从轻击到滑动时,情况也是如此。这可以归因于儿童的身体尚未成熟,因此这会影响他们在使用手指执行任务时的反应。
因此,当从触摸数据提取特征时,我们考虑手形和灵活性属性。
实验装置:解锁手机和玩2048游戏
我们的研究获得南卡罗来纳大学机构审查委员会的批准(IRB号码73819)。在实验中,我们使用与所有主题相同的智能手机(由LG生产的Google Nexus 5X,运行Android v.7.1.1),并关闭其自动旋转功能以消除与各种手持相关的偏差。我们基于智能手机的两项常见活动设计了一个两阶段应用程序:解锁手机(点击手势)和玩游戏(滑动手势)。
点击手势在第一阶段收集。如图2(a)所示,在屏幕的顶部出现一个PIN码,用户被要求输入它。我们的应用程序生成两个四位数和两个六位数的引脚号,每个引脚随机出现两次。如果每次都成功,每个用户都会将手机解锁八次。我们将解锁尝试的最大次数设置为十次。。
滑动手势在第二阶段收集。我们修改了一个名为2048的流行益智游戏,如图2(b)所示。
用户可以在任何方向滑动来玩游戏。令人惊讶的是,相当数量的孩子表示他们之前玩过这个特定的游戏或类似的游戏。大多数3-5岁的儿童能组成64或更大,而6-11岁之间的儿童至少组成128,而五年级学生(10岁)最高组成512。
实验数据
在我们的实验中,我们招募了两组用户:儿童组有17名3至11岁的儿童,成人组有14名20至59岁的成年人。表1总结了参与者的人口统计。所有的参与者都完成了两个阶段的任务。在解锁手机阶段,我们收集了儿童组中的1357个手指按压和成人组中的762个手指按压数据。
请注意,虽然3至5岁儿童的人数并不是最多,但与大龄儿童和成人相比,我们收集的手指按压数量最多。这是因为这个年龄组的孩子更可能输入错误,因此他们尝试多次。在第二阶段,我们分别从儿童组和成人组收集了3442和3658次。总的来说,成人组在2048年的比赛中表现更好。
表2给出了滑动数据的样本,表3是点击数据的样本。轻击一般由两个动作组成:向下(“0”)和向上(“2”),而滑动有一个动作:触摸移动(“1”)。滑动由一系列触摸点组成。它从触摸屏幕开始,以手指提升结束。在每个点上,我们记录发生的时间,X-Y坐标,触摸区域的压力和大小以及手指ID。事件时间以毫秒为单位,并基于智能手机自启动以来的非睡眠正常运行时间。压力和尺寸值均被标准化为0和1之间的范围,其中0意味着没有压力并且完全没有尺寸。
数据处理
我们从所收集的触摸数据中从两个方面提取特征:手的几何形状和灵活性。表4显示了滑动手势和轻击手势的功能描述。总共,我们提取了35个特征,并且点击了8个特征。
手部几何。手部几何形状的差异会导致触摸范围,触摸距离,触摸压力和尺寸方面的差异。特别地,表4中编号从1到19的特征是基于手部几何图形提取的。
灵活性。考虑到灵活性,我们提取了从20到35的16个特征。灵巧性主要影响速度,加速度和任务持续时间。
分类器和度量
分类选择。根据孩子和成人分类的以上特点,我们实现了三个机器学习分类器,即支持向量机(SVM),随机森林(RF)和k近邻(kNN)。支持向量机是二元分类的流行和强大的工具,它可以输出一个最优化的超平面,以最大化两个类之间的边界。最重要的是,它能够通过使用内核技巧将数据映射到更高维空间来解决非线性可分问题。
在这里,我们使用径向基函数(RBF)作为我们的非线性核。 kNN是一种非参数方法,它没有数据的基础假设,每个样本都基于其邻居的多数投票分配给一个类。神经网络不基于训练数据进行任何概括,但它非常简单而且快速,同时具有高度竞争的结果。 RF是另一种有效的算法,它能够准确地对大量数据进行分类。它是一种集成方法,它在训练时间内构造大量决策树,并输出所有模型中票数最多的类标签。它还给出了每个特征在分类中重要性的估计。
指标。为了评估二元分类器的性能,我们选择常用的性能指标:ROC(AUC)曲线下的面积和相等的错误率(EER)。 ROC曲线代表受试者工作特征曲线,并通过绘制真实接受率(TAR)与错误接受率(FAR)的关系来创建,因为阈值变化。 TAR是正确识别孩子的概率,而FAR是分类错误地接受孩子的概率。 AUC是介于0和1之间的值,较大的值通常更好。 EER是接受和拒绝误差相等时的速率,而这个值越低,分类者越好。
结果:
首先,我们将孩子的触摸数据分为两组,分成3至5岁的儿童和6至11岁的儿童两组。我们将所有成人数据视为阴性样本,并为每个组单独训练了一个RF分类器。
图4显示了两个年龄组的ROC曲线的比较。对于滑动和敲击,我们在对3至5岁的儿童组进行分类时有更好的表现。这是合理的,因为年龄较小的儿童在手部几何和灵活性方面往往与成年人更为不同。
多次滑动。在本节中,我们将探索将不同数量的连续滑动组合用于分类对性能的影响。到目前为止,我们只使用相对较大的滑动数据集来进行多笔划评估。首先,我们分开将数据集转换为训练和测试集。我们通过从每个年龄段的参与者中随机选择10%的连续样本来准备测试数据集。
总的来说,测试数据集由660个样本组成,均匀地分布在儿童和成人之间。我们使用剩余的样本训练RF模型,并选择树号为200。与其单独划分所有划动并通过大多数投票达成最终决定,我们在较早阶段将其多个连续输出与它们的概率组合,并取平均值作为我们的预测概率。
图5显示了ROC曲线,通过改变划分的次数来进行分类决策。增加滑动次数时,分类错误可以大大减少。随着我们将滑动次数增加到8次,EER本地收敛到3.0%。尽管数据集的有限大小不允许我们进一步增加滑动次数,但结果清楚地表明使用多次滑动可以提高准确性。
限制与未来探讨:儿童多样性、有限的手势等
有几个问题有待探讨。
1、由任务属性造成的偏差。虽然没有限制用户如何执行触摸手势,实验中使用的具体应用(任务)会影响手势几何。因此,依赖任务的多样性可能会影响iCare的准确性。值得研究手势和相应的特征如何随着不同的任务而变化。
2、儿童用户的多样性。考虑到女孩和男孩身体的不同发育率,应该检查不同性别的触摸模式。此外,随着儿童的行为每年发生显着变化,可能会降低整体的准确性。我们还观察到,3岁以上的儿童可以使用PIN码解锁智能手机,即使他们无法读取数字。
3、有限的手势。还有很多其他的手势(例如,滚动)在我们的研究中还没有探索过。实际上,用户可能需要在不同类型的手势之间来回切换,才能在智能手机上完成任务。将所有类型的手势融合在一起可以产生更快的分类决策并可能提高准确性。
4、提高准确性。鉴于连续8次滑动和准确性,我们的方法可以为现有的父母监控应用程序提供很好的补充。但是,在应用到现实世界之前,其准确性应该得到改善。我们可以通过解决上述三个限制来提高准确性。此外,智能手机上还有其他内置传感器(例如陀螺仪和加速计),可以利用这些传感器来导出用户的分类结果特征。
-
算法
+关注
关注
23文章
4622浏览量
93058
原文标题:【AI防熊孩子抢手机】浙大开发算法软件,轻松识别儿童玩手机
文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
评论