0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI看了100部电影,学会了接吻是什么样子

DPVg_AI_era 来源:lq 2019-07-13 08:19 次阅读

斯坦福大学研究人员给AI模型看了100部好莱坞电影,让AI看懂了什么是接吻,并从视频片段中分割识别出接吻的镜头场景,而且把接吻和***场景区分开来。嗯,想开车的朋友可能要等等,但想看吻戏的朋友这回可以一次看个够了。

和大多数没有接过吻的人一样,AI学接吻这件事最开始也是通过观看爱情电影片段进行的。AI通过看电影来了解关于接吻的基本知识,尤其是看看那些好莱坞明星的嘴唇动作究竟是什么样的。

研究人员对熟练掌握识别面部识别和目标识别的深度学习算法进行了训练,识别由专业演员戏剧化的热吻场景,这表明,AI系统已经能够更深入地了解最亲密的人类“交流”活动。

电影《泰坦尼克号》中男女主角著名的“船头接吻”镜头

这项研究来自Netflix的高级数据科学家Amir Ziai,他正在斯坦福大学攻读AI专业研究生。Ziai从过去一个世纪的好莱坞电影数据库中挑选了100部电影的代表性片段。然后手动将不同的电影片段标记为接吻/非接吻场景,并使用来自这些片段的静止图像帧和声音片段来训练深度学习算法,以检测影片中亲吻的场景和声音。

寻找非交叉接吻动作分割片段的算法伪代码

不过请不要误会,目前还不清楚这个测吻的方法是否可以用于亲吻之外的进一步***场景的识别。对此,Ziai 表示:“在我的训练数据集中有意远离了过度的***场景,以确保模型不会混淆接吻和***”。

Ziai目前的雇主Netflix没有参与斯坦福大学的这项研究,该研究一发表在预印本服务器arXiv上。Ziai尚未研究该技术在Netflix上的能否获得一些应用前景。但不难想象,这类视频识别技术可能会让Netflix或其他公司(如YouTube,Facebook,InstagramTikTok)很感兴趣,由此技术开发出的商业应用可以处理大量流媒体或存储视频。

2019年4月,谷歌宣布其Pixel智能手机已经能够接收Photobooth功能更新,可以在智能手机摄像头拍摄的视频中检测到接吻时进行自动拍照。Ziai展示了与视频有关的接吻检测技术,未来的应用可以对视频内容进行自动分类,为用户打造个性化的视频推荐列表,甚至可能充当在线视频审核的部分作用,对某些内容的视频进行筛选。

“这是一个很好的例子,说明现代计算机视觉技术如何能够相当容易地开发特定的'感知和响应'软件,提示定性/非结构化的东西(如场景中的接吻),”OpenAI策略与转播主管杰克·克拉克说,他的导入人工智能新闻通讯,最近突出了亲吻检测研究。“我认为这是AI改变个人软件开发方面,未来受关注潜力最高的领域之一。”

目前对亲吻场景识别最成功的深度学习模型是ResNet-18,这是一种图像分类算法,已经基于ImageNet数据库中的超过一百万张图像进行了预训练。为了能够正确识别接吻的声音,使用名为VGGish的深度学习模型,利用每个接吻场景的一秒钟片段的后960毫秒的音频进行了训练。

使用这种双管齐下的训练方式,AI模型处理接吻的图像和音频的方式,让整个模型获得了高达的0.95的F1分数 - 这一分数用于衡量算法(对于误报和假阴性的)精度的加权平均值。

但是,面对一些电影场景中视频编辑过多,以及和摄像机角度问题时,模型可能会无能为力。拍摄演员接吻的远景镜头有时会骗过算法,因为这种情况下,大部分相机镜框内都是风景背景。快节奏的视频剪辑和不包括两个演员的镜头也证明是具有挑战性的。

要弄清究竟是AI模型究竟是根据哪些特定数据模式进行预测是比较困难的事情。人类尝试理解AI逻辑的一种方法是使用显着性图来突出显示在分析过程中受到AI最多关注的数据。在好莱坞电影中的亲吻场景中,深度学习模型似乎更加关注与演员面部相关的图像像素。

Ziai说,一些“有限的实验”也表明,AI模型更依赖视觉特征,而不是音频特征来识别接吻场景。实验表明,利用更加“精心调整的数据集”会更有利于接吻探测系统的性能发挥,并且可能利用更多的背景信息,而不仅仅是靠静止图像来识别接吻场景。

电影《幽灵》(1990)中的接吻场景

目前还不清楚AI模型在全部100部好莱坞电影中的识别表现如何,如《安娜·卡列尼娜》(1935),《幽灵》(1990)和《皇家赌场》(2006)将在更大的电影数据集中发挥作用。但是,在训练数据集超过80个视频后,该模型仅仅出现了“边际化的性能提升”,Ziai说。好莱坞电影数据集和一些计算资源由斯坦福大学计算机科学助理教授Kayvon Fatahalian实验室提供。

另一个问题是,这种接吻AI识别模型是否能够在检测社交媒体上常见的视频中的接吻场景时表现出相当的精度。这一挑战可能需要对更大的视频数据集进行额外的训练。尽管如此,一些初步测试仍然表明,这种方式有望诞生更广泛的AI接吻检测应用。

“这项研究的尝试是使用多样化的数据集,让模型不会过度适应任何特定类型的电影,”Ziai说。“有趣的是,它似乎在我发现的一些YouTube视频上的性能表现相当不错。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30098

    浏览量

    268375
  • 面部识别
    +关注

    关注

    1

    文章

    375

    浏览量

    26617
  • 深度学习
    +关注

    关注

    73

    文章

    5492

    浏览量

    120965

原文标题:斯坦福研究人员让AI看了100部好莱坞大片,养出一个“吻戏识别大师”

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    小米成立AI平台

    近日,小米公司进行了一系列的人事调整与组织架构优化,其中一项重要举措便是成立了AI平台。这一新部门的成立,标志着小米在人工智能领域的发展迈出了更为坚实的一步。 据了解,AI平台隶属
    的头像 发表于 11-14 13:57 361次阅读

    设置ADS1291的 IN1P和IN1N导联脱落检测的电流为AC交流模式,这个AC的波形是什么样子的?

    您好,我设置ADS1291的 IN1P和IN1N导联脱落检测的电流为AC交流模式,这个AC的波形是什么样子的?方波还是正弦波,我要计算他的有效值,然后计算出此时的输入阻抗,谢谢
    发表于 11-14 07:04

    TPA3118在失真的情况下输出是什么样子的波形,是对输出波形的削顶失真?

    TPA3118D2现使用TPA3118D2芯片,在调试过程中,发现几个问题,希望得到帮助解答。 1、TPA3118在失真的情况下输出(LC网络以后的输出)是什么样子的波形,是对输出波形的削顶失真
    发表于 10-25 07:17

    AI模拟器

    问题, 第二:下次发送,先清除之前提问,避免重复提问 第三步:获取ai反馈相关问题答案,目前虚拟数据,可自行设置答案结果 四、效果展示 五:代码展示: import { MsgRoleEnum
    发表于 08-22 17:28

    索尼电影摄影机在未来电影制作教育中的作用

    日本大学艺术学院自成立以来,作为日本第一所艺术学院,100多年来培养了许多从事专业电影制作人才。在电影研究系,引入了索尼电影摄影机“FX9”、“FX6” 和 “FX30” 进行实践教学
    的头像 发表于 08-16 11:06 626次阅读

    数十万一台的电影机,需要何种传感器与之匹配

    还是CMOS都用到了可靠性和性能最高的硬件,尤其是对于CMOS而言,图像质量才是对其唯一的要求。   安森美   在高端电影机市场占比第一的Arri,至今已经有了100多年的历史,在2024年奥斯卡的10最佳影片提名中,有6
    的头像 发表于 04-27 00:56 3433次阅读
    数十万一台的<b class='flag-5'>电影</b>机,需要何种传感器与之匹配

    看了这篇文章,如何维修伺服电机的故障你就全会了

    伺服电机因为长期连续不断使用或者使用者操作不当,会经常发生电机故障,维修又相对复杂的。今天收集了伺服电机发生的13种常见的故障问题的维修方法,供大家学习借鉴。 一、起动伺服电机前需做的工作有哪些 1)测量绝缘电阻(对低电压电机不应低于0.5M)。 2)测量电源电压,检查电机接线是否正确,电源电压是否符合要求。 3)检查起动设备是否良好。 4)检查熔断器是否合适。 5)检查电机接地、接零是否良好。 6)检查传动装置是否有缺陷。
    的头像 发表于 03-25 08:40 1261次阅读

    荣耀已投入100亿元AI研发费用

    在近日举行的荣耀笔记本AI PC技术沟通会上,荣耀公司公布了其在人工智能领域的显著投入与成果。据悉,荣耀至今已累计投入高达100亿元的AI研发费用,取得了令人瞩目的专利成果,成功申请并获得了超过
    的头像 发表于 03-22 14:05 599次阅读

    怎么在NanoEdge AI Studio设定交叉编译器呢?

    20231009\", 那么问题来了,怎么在NanoEdge AI Studio设定交叉编译器呢,比如设置为armcc、armclang、iccram,因为我需要将库加到keil或者iar工程里面。 看样子这个软件生成的库是arm-gcc编译的,那它只能用于官方的STM
    发表于 03-07 06:28

    英伟达:预计下一代AI芯片B100短缺,计划扩产并采用新架构

    近期热门的 H100 芯片运期短缩数天后,英伟达新型 AI 旗舰芯片 B100搭载全新的 Blackwell,有望使 AI 计算性能提升至 2~3 倍。鉴于
    的头像 发表于 02-25 09:29 866次阅读

    基于HTTP/3构建SSH协议会是什么样呢?

    来自UCLouvain的François Michel 和Olivier Bonaventure在研究中思考了一个问题:如果使用最新的网络技术来重新设计SSH协议,那新协议会是什么样子呢?
    的头像 发表于 02-20 17:07 624次阅读
    基于HTTP/3构建SSH协议会是<b class='flag-5'>什么样</b>呢?

    华谊兄弟电影乐园联合亮风台解锁新玩法,邀你在电影元宇宙里“过大年”

    2024年贺岁档即将来到,九影片燃爆集结,堪称“神仙打架”!看电影一直都是“春节主菜”,而就在大年初一(2月10日),苏州华谊兄弟电影乐园的电影工坊将解锁酷炫观影新方式,让游客“酥酥
    的头像 发表于 02-19 12:18 2926次阅读
    华谊兄弟<b class='flag-5'>电影</b>乐园联合亮风台解锁新玩法,邀你在<b class='flag-5'>电影</b>元宇宙里“过大年”

    没有10年工作经验,我猜你都不会用电磁场来分析高速问题吧?

    问了很多朋友,总结了研究高速信号的三个阶段:工作2年学会了从时域上看波形和眼图;工作5年学会了从频域去研究通道性能;工作10年了,咋滴,还没学会结合电磁场来分析和定位问题吗?
    的头像 发表于 02-01 14:46 353次阅读
    没有10年工作经验,我猜你都不会用电磁场来分析高速问题吧?

    在发生超范围情况时,ADC的输出数据是什么样子

    在发生超范围情况时,ADC的输出数据是什么样子
    发表于 12-21 06:20

    中国机械工业学会、工业和信息化调研海默机器人

    由中国机械工业学会、工程院战略咨询中心、工业和信息化电子第五研究所、湖北省机器人产业创新联盟及其专家委员会专家、南京航空航天大学组成联合调研组共
    的头像 发表于 12-04 08:12 496次阅读
    中国机械工业<b class='flag-5'>学会</b>、工业和信息化<b class='flag-5'>部</b>调研海默机器人