0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

羞羞的机器学习学术研究项目分解

电子工程师 来源:未知 作者:李倩 2018-11-06 09:57 次阅读

现在,机器学习已经应用在各行各业中,开发工程师队伍越发壮大,其中有一类工程师的工作内容在外行人眼里似乎更”丰富多彩“,那就是鉴黄师。现在我们看到的视频都是经过他们本人或他们研发的技术处理而来。就在大家致力从音、言、画等全方位鉴黄时,有一个逆风而上的团队,正在利用机器学习研究着一项非同一般的任务。

刚拿到这篇论文的时候,营长是拒绝的,毕竟原文作者都没有署名。目前就知道这项史无前例的工作是由德国一家公司 Very Intelligent Ecommerce Inc 委托进行的,并将研究和调研成果应用到项目 Autoblow AI 中,旨在使他们的成人智能玩具更加人性化。(关于这个项目大家可自行搜索了解更多... ...)

下面营长还是”竭尽所能“地为大家介绍一下这项羞羞的机器学习学术研究项目。研究人员通过分析并标记超过 108 小时的爱情动作视频,利用聚类分析发现了 16 种”典型“或”常见“的 blowjob(以下简称 bj)动作片段,以此设计和评估一个通过使用深度学习来生成完整全过程 bj 的系统。这个系统优于简单的马尔科夫链模型。虽然内容敏感,但,是真学术!(一本正经脸)欲知详情,下文继续为你分解。

数据集

我们将获取到的色(xue)情(xi)视频进行剪切,处理后仅包含 bj 的片段。然后手动对这些片段进行标注,并记录下嘴巴的位置信息序列,该位置记录为整数,其中1000和0分别表示尖端和基部。(向数据标注工程师献上我的膝盖)

为了便于研究,我们使用线性插值技术将视频和标注标准化为每秒16帧,最终把视频中剪切出来的1060个剪辑处理成6270467个标准化帧,这1060个剪辑由109个小时的视频中所得来。

动作分析

对 Autoblow AI的设定程序有一个基本的了解有助于分析此项研究。Autoblow AI有十种模式,每一种模式都代表着一系列的动作。上或下运动速度的不同就产生了不同的动作,其中速度可用电机来控制。两到三个不同的动作连续释放也可以创造出复杂的动作模式。图 1 给出了一个基于三种动作模式的分析例子:

图 1 基于三种不同模式而创造出的复杂模式示例

我们能够清楚地看到运动具有周期性以及随着时间的变化动作的状态情况,其中包括停顿和中断。基于上千个这类的片段,我们能够构建模型来识别数据集中常见或典型的动作。

k 均值聚类

我们首先使用k均值聚类算法来进行研究,该算法虽然存在很多缺点,但是它的运算速度快。

我们将每个视频分割成一个个一秒钟的窗口,按每个窗口的位置序列给出一组16维的向量。之后采用k均值来找到16个聚类。下图 2 和 3 给出了每一个类别位置序列的平均值,以及每一个类别中100个样本的具体位置序列。

图 2 16 种类别中嘴位置序列的平均值

图 3 每一类别上100个样本中嘴的具体位置序列

为了进一步验证我们的假设,我们使用了最近开发的一种被称为UMAP的降维技术来减少聚类的数量,以便能在二维和三维中对数据进行可视化。其结果如图 4 所示。

图 4 使用 UMAP 降维后数据的分布图

我们能从图中看到许多令人信服的结构。比如类别5和类别2的数据,它们分别代表着在顶部和底部附近进行活动,而图中这两类数据也是处在相互对立的点上。再比如类别1和5的数据,它们都代表着在顶部进行活动,图中这两类数据正好也是彼此相邻。我们还能从图中观察到一条介于两端点之间密集的线,这条线贯穿了所有表示低强度的动作(5,12,7,3,13,2)的数据点,这一结构也与现实中 bj时,从最高点到最低点来回活动相符。

这个图表值得我们去细细分析,在目前这些验证就足以让我们去相信数据之间是呈现出某种趋势的。这些数据能够为我们建立更加复杂的动作模型做支撑。

程序生成

如上所述,一个完整的 bj过程是由一系列的动作来组成的。在上一节中,我们已经确定了在一秒钟内发生的典型动作。下一步我们要做的是找到这些动作之间常见的演变顺序。

这个问题与自然语言中‘猜猜下一个词会是啥’的问题有颇多相似之处。以下漫画最能说明这个问题。

我们希望从上一节中构建出来的模块来组成一个典型的 bj过程。我们首先建立了一个以马尔可夫链为基线的简单模型,之后又设计了一个深度学习模型来作为替代,并定量比较了两种模型的优劣。

马尔可夫链模型

马尔可夫链背后的原理很简单:假设下一步的动作仅取决于当前的位置,而不是先前的动作。例如:假设我们刚刚完成了动作1;在此基础上,我们知道我们再次做动作1的概率为50%,30%的概率做动作2,15%的概率做动作3,等等。然后根据概率随机选择下一个动作来生成一个‘唯一’的动作顺序。

因此,我们先计算了一个模式由另一个模式引起的频率,并验证了此概率与直觉相符。之后采用这些概率生成唯一的动作顺序,并使用简单的移动平均进行平滑处理。结果如下图 5 所示。

图 5 一个由马尔可夫链模型生成的完整‘不可描述动作’ 过程

马尔可夫链的问题很明显,就是假设下一状态的概率仅取决于当前的状态。而事实上,下一状态的概率会取决于先前的许多状态。

另一个问题是在预测下一状态时,还需知道先前状态哪一个对下一状态影响最大。深度学习能够在“复杂又非显而易见相关性”的问题上大展身手。

Dense Neural Network (DNN) 模型

在本节中,我们设计了一个DNN架构,该架构能够基于先前的状态预测出下一步的状态。

本文中,使用了一个简单的两层体系结构,把最后的16种状态作为模型的输入,输出为范围在0到1之间的关于16种状态的概率值。用零矢量来表示“缺失”状态(如视频开始前的一小段)。通过纵向连接先前的状态向量来创建输入,以交叉熵作为损失函数,训练数据与测试数据的比值为8:2。

模型性能的好坏很大程度上取决于训练数据与测试数据的切分情况,为了解决这一随机误差带来的影响,我们重复了10次试验,每次都使用不同的随机种子来分割数据。下面我们将定性地分析一个由模型产生的动作演变顺序(如图 6 所示)。

图 6由 DNN 模型产生的一个完整 bj过程

模型比较

在本节中,我们将定量地分析这两种模型。定性地说,DNN模型具有更好的鲁棒性,因为它被锁定在单一状态下的可能性要小很多。对于预测来讲,首先要考虑的是预测的准确性。图 7 表示DNN在不同任务上的预测准确率。

图 7 DNN 在不同任务上的预测准确率

通过计算得到的马尔可夫链模型的准确率约为58.08%,略低于神经网络的平均精度。

为了证明结果的可信度,我们还引入了“相对错误”这一度量指标。下面给出一个小例子以便理解相对错误。当你在预测是否会下雨时,如果回答百分百下雨,但结果没下雨,那么你的预测就完全错误。但如果你预测百分之八十下雨,结果没下雨,那么意味着你只错了百分之八十。

根据这一思路,我们重新计算了两种模型的平均绝对误差,DNN模型的误差如图 8 所示,而马尔可夫链模型的误差计算结果为1.126。从这一结果也能表明DNN模型优于马尔可夫链模型。

图 8 DNN 模型在不同任务上的平均绝对误差

未来的研究

第一,我们相信程序生成能够被改善。DNN架构的替代方案包括循环神经网络、卷积神经网络和生成对抗网络。我们之后打算使用这些技术来改善动作演变顺序的真实性。当然,演变顺序得以物理硬件的限制为前提。

第二,我们认为类似的分析可以适用于其他情色行为,本文中以 bj 为主题,服务于Autoblow AI。

第三,我们希望能将研究扩展到图像识别和视频分类中去。现在我们已经开发出一个可用于识别静止帧中是否存在 bj行为的模型,并且正在研究更为复杂的视频分析问题。接下来研究的重点会着眼于如何将性玩具与色情内容实现同步。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像识别
    +关注

    关注

    9

    文章

    520

    浏览量

    38267
  • 机器学习
    +关注

    关注

    66

    文章

    8406

    浏览量

    132563

原文标题:关于那些羞羞的不可描述的动作分析,一个正经的机器学习项目

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    工程领域学术研究的基本规律和原则

    的创造性;但无论如何,都必须“应用”。搞工程科学讲究“顶天立地”,“顶天”指要接触到学科前沿, “立地”指要结合工程实际。搞工程科学不做“梁上君子”。在工程领域的学术研究方面,这应该也是一条准则。
    发表于 05-08 12:07

    【MiCOKit申请】学术研究开发

    申请理由:1.应用STM32F4芯片做成了六足机器人,其拥有18个舵机,分别用杯土轴承与主体连接,应用2576做驱动,电源盒给系统供电;2.应用飞思卡尔的XS128系列研成了智能导航车,充分发挥OV
    发表于 08-20 09:14

    【下载】《机器学习》+《机器学习实战》

    强化学习等.下载链接:[hide][/hide]2.机器学习实战简介:机器学习是人工智能研究领域
    发表于 06-01 15:49

    【瑞芯微RK1808计算棒试用申请】基于机器学习的视觉机械臂研究与设计

    项目名称:基于机器学习的视觉机械臂研究与设计试用计划:申请理由本人在深度学习领域有四年开发经验,申请理由:基于视觉的机械臂伺服控制系统,并根
    发表于 09-23 15:39

    怎样去设计一种基于PLC的搬运机器手控制系统

    摘□□要随着国家大力发展自动化工厂,以搬运机器手为首的自动化生产加工设备,成为了建立自动化工厂的核心设施。双轴伺服控制系统作为搬运机器手、分拣机械手的主要执行机构成为目前学术研究的热点。双轴伺服
    发表于 09-17 06:34

    11个机器学习开源项目

    随着机器学习越来越受到开发者关注,出现了很多机器学习的开源项目,在本文列举的11个机器
    发表于 02-14 14:25 2818次阅读

    什么是机器学习机器学习能解决什么问题?(案例分析)

    随着大数据时代的到来,机器学习成为解决问题的一种重要且关键的工具。不管是工业界还是学术界,机器学习都是一个炙手可热的方向,但是
    发表于 05-18 13:13 1.6w次阅读
    什么是<b class='flag-5'>机器</b><b class='flag-5'>学习</b>?<b class='flag-5'>机器</b><b class='flag-5'>学习</b>能解决什么问题?(案例分析)

    机器学习研究中的四大危机是什么?

    有缺陷的学术研究可能会误导大众,并阻碍学术未来的研究。实际上,这些问题有许多是在人工智能的历史(更广泛地说,是在科学研究)中循环出现的。1976年,Drew Mc-Dermott[1]
    的头像 发表于 07-14 09:15 3783次阅读

    NVIDIA在西雅图开设机器研究实验室,聚集跨学科研究团队

    NVIDIA今天在西雅图开设了机器研究实验室,该实验室将容纳50名机器人专家、20名来自NVIDIA的研究人员,以及其他更广泛的学术研究
    发表于 01-13 09:51 670次阅读

    机器学习所需的数学知识你能够有效使用吗

    开始机器学习之旅,需要什么层次的数学功底? 尤其是对于那些没有学过数学和统计学的同学们来说,这个问题当前不甚清楚,在这篇文章中,我将要为那些使用机器学习技术来开发产品或做
    的头像 发表于 02-02 17:10 1961次阅读

    苹果在人工智能和机器学习领域属于“后来者”

    作为市值超过两万亿美元、现金流领跑业界的科技巨头,苹果拥有十分雄厚的学术研究后盾。不过,在人工智能和机器学习(AI & ML)学术领域,我们更多听到的是来自谷歌、Facebook、微软
    的头像 发表于 09-17 16:42 2449次阅读
    苹果在人工智能和<b class='flag-5'>机器</b><b class='flag-5'>学习</b>领域属于“后来者”

    六个构建机器学习模型需避免的错误

    近年来,机器学习学术研究领域和实际应用领域得到越来越多的关注。但构建机器学习模型不是一件简单的事情,它需要大量的知识和技能以及丰富的经验,
    发表于 05-05 16:39 1418次阅读

    基于Spark的学术论文热点数据挖掘方法

    通过优化 Spark mllib机器学习库中的隐含狄利克雷分布(LDA)主题模型,提出一种改进的学术研究热点挖掘方法。采用LDA主题模型对学术论文关键词进行建模,利用困惑度确定主题模型
    发表于 06-02 14:47 4次下载

    深度学习顶级学术会议ICLR 2023录用结果已经公布!

    很快就获得了学术研究者们的广泛认可,被认为是深度学习的顶级会议。在 Google Scholar 的学术会议 / 杂志排名中,ICLR 目前排名第十位,要高于 NeurIPS。
    的头像 发表于 02-07 11:10 1610次阅读

    机器学习笔记之优化-拉格朗日乘子法和对偶分解

    优化是机器学习中的关键步骤。在这个机器学习系列中,我们将简要介绍优化问题,然后探讨两种特定的优化方法,即拉格朗日乘子和对偶分解。这两种方法在
    的头像 发表于 05-30 16:47 1891次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>笔记之优化-拉格朗日乘子法和对偶<b class='flag-5'>分解</b>