0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI为表情包生成搞笑文字说明

NVIDIA英伟达企业解决方案 来源:未知 作者:胡薇 2018-07-31 17:38 次阅读

制作表情包还能获得研究生学分?如果使用深度学习技术来实现的话,是有可能的。

23岁的Lawrence Peirson正在攻读斯坦福大学的理论天体物理学博士学位,但今年却决定进修几门AI课程。在一个班级项目中,他和自己的同班同学E.Meltem Tolunay开发了一个神经网络,可为表情包生成说明文字。他们发布了一份关于该网络的白皮书,其标题十分贴切:“Dank Learning”(“Dank”是“Cool”的同义词)。

虽然现在已经存在很多训练深度学习模型为图片生成文字说明的例子。例如,准确地为一张图片生成说明性文字“踏着冲浪板的男人”或“拿着蛋卷冰淇淋的孩子”。但对于表情包,Peirson想挑战一下神经网络能否突破字面解释,创造出具有幽默感的文字说明。

尽管一开始Peirson对所生成表情包的趣味性持怀疑态度,但最终他发现深度学习模型确实可以生成“一些非常有趣的原创幽默内容”。

获得“深度表情包”

该神经网络为一类流行的动物表情包生成说明文字。为了收集用于训练该深度学习模型所需的数据,Peirson从memegenerator.net网站上搜集了大约40万个由用户生成的表情包。该网站提供各类表情包模板,并允许用户自己搭配文字说明。

该数据集包含大约3000个基本图像,每个图像都配有多种不同的文字说明。由于输入数据均来自用户,深度学习模型所处理的表情包文字说明的质量良莠不齐。

“我们使用了40万个表情包,其中的大部分没有那么有趣,但是至少它们能够教会系统表情包是什么,以及什么样的笑话才是与图片内容相关的,”他说道。

互联网表情包在网络上早已流传多年,Reddit、Facebook、9GAG和Quick Meme等网站是它们的大本营。最火爆的表情包可能会配有超过200万种原创文字说明。

表情包引用的通常是流行文化、时事或某个特定的互联网亚文化群体才明白的“梗”。(Peirson创建了一个名为“The specific heat capacity of europium at standard temperature and pressure”的表情包页面。)

这些表情包同时汲取了数字文化的精华与糟粕。其论文指出,训练数据中大多是关于咒骂、种族主义和性别歧视的表情包。Peirson觉得需要在未来训练中过滤掉这些内容,但他指出这一问题并不是表情包所独有的,“这在自然语言处理中是一个普遍存在的大问题”。

该深度学习模型利用CUDA语言编写,使用了一块NVIDIA GPU。Peirson和Tolunay同时尝试了使用无标记的数据和标有表情包标题的数据(例如,成功小子或暴走漫画),但并没有发现表情包的质量有任何显著差异。

“这些表情包非常有趣,不过是‘也还说得过去,但其实并不是那么搞笑’这种程度,” Peirson说道,“表情包就是借用了这种幽默感。

该神经网络为此类动物表情包生成了说明文字。

让表情包变酷可不容易

为了评估深度学习模型成功与否,两人开发了一个“困惑指数”(perplexity score),用其检查神经网络是否可以明确识别出数据的模式。他们针对几百张带有预设格式的表情包计算出了“困惑指数”。如Boromir(电影《魔戒》中的角色)表情包,该表情包的文字说明始终都带有“one does not simply”的字样。

但对于表情包的真正考验在于其是否搞笑。

在一项定性调查中,Peirson与其白皮书的共同作者同时向受访者展示了人类创作的表情包和深度学习模型生成的表情包。他们向受访者提出了两个问题:“表情包是由人类创作的还是由计算机创作的?”,以及“如何评价表情包的幽默程度?”。

Peirson表示,访问结果显示深度学习模型创作的表情包“与人类创作的表情包几乎无法区分”。

他们还研究了其神经网络如何为训练数据集之外的表情包生成文字说明。在这种情况下,算法会基于其在训练数据中看到的内容推理未知图像的模式。为了测试这一点,Peirson甚至向深度学习系统展示了他自己的照片,生成的文字也相当有趣。

Peirson在深度学习模型中输入了自己的照片,模型生成了这张表情图。

表情包通常会进行病毒式传播,并成为“网红”,而以表情包为主题的白皮书也受到了欢迎。当该项目获得媒体报道并受到关注时,Peirson表示自己“倍感震惊”。一款名为Dank Learning的移动应用也即将登陆App Store。

他说,这个项目让他打开了新的视角:原来表情包的影响力如此巨大。每天,全球有数百万用户在社交媒体网站上传播表情包。

在Peirson看来,强大的AI有潜力根据时事“突发奇想”,生成表情包,从而影响公众认知。而广告主也可以使用表情包提升品牌知名度:“让表情包进行病毒式传播是一种绝妙的营销方式。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    29611

    浏览量

    267910
  • 深度学习
    +关注

    关注

    73

    文章

    5456

    浏览量

    120856

原文标题:表情包生产基地:AI像人类一样为图像生成搞笑文字说明

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    生成AI工具作用

    生成AI工具是指那些能够自动生成文本、图像、音频、视频等多种类型数据的人工智能技术。在此,petacloud.ai小编为您整理生成
    的头像 发表于 10-28 11:19 106次阅读

    三行代码完成生成AI部署

    OpenVINO2024.2版本跟之前版本最大的不同是OpenVINO2024.2分两个安装分别是基础生成AI支持
    的头像 发表于 08-30 16:49 352次阅读
    三行代码完成<b class='flag-5'>生成</b>式<b class='flag-5'>AI</b>部署

    Freepik携手Magnific AI推出AI图像生成

    。Freepik Mystic自诩目前市场上最先进的AI图像生成器,其独特之处在于能够直接生成全高清图像,这在业界尚属首例。
    的头像 发表于 08-30 16:23 1037次阅读

    STAR AI进军美股科技星智能领跑生成AI赛道

    自ChatGPT问世以来,从文字chatbot到视频生成和机器人,生成式人工智能(Generative AI)的商业应用已经成为全球最具爆炸性效应的赛道,
    的头像 发表于 08-22 08:56 234次阅读
    STAR <b class='flag-5'>AI</b>进军美股科技星智能领跑<b class='flag-5'>生成</b>式<b class='flag-5'>AI</b>赛道

    NVIDIA携手Meta推出AI服务,企业提供生成AI服务

    NVIDIA近日宣布了一项重大举措,正式推出NVIDIA AI Foundry服务与NVIDIA NIM(NVIDIA Inference Microservices)推理微服务,这两项创新成果与同步问世的Llama 3.1系列开源模型强强联合,全球企业构建强大的
    的头像 发表于 07-25 16:57 468次阅读

    NVIDIA AI Foundry 全球企业打造自定义 Llama 3.1 生成AI 模型

    Foundry 提供从数据策管、合成数据生成、微调、检索、防护到评估的全方位生成AI 模型服务,以便部署自定义 Llama 3.1 NVIDIA NIM 微服务和新的 NVIDIA NeMo
    发表于 07-24 09:39 667次阅读
    NVIDIA <b class='flag-5'>AI</b> Foundry <b class='flag-5'>为</b>全球企业打造自定义 Llama 3.1 <b class='flag-5'>生成</b>式 <b class='flag-5'>AI</b> 模型

    bootloader在线生成的压缩空文件夹怎么解决?

    在线生成bootloader,同样的Bootloader配置,成功生成过一次,再次生成之后文件夹内空,压缩172B,试了很多次都一样
    发表于 07-18 07:32

    旷视AI开源新突破:上传照片即可生成表情视频!

    为了展示其泛化性,MegActor甚至可以将VASA中的人物肖像和视频组合生成,得到生动的表情视频。即使与阿里EMO的官方案例相比,MegActor也能生成近似的效果。
    的头像 发表于 07-12 11:20 295次阅读
    旷视<b class='flag-5'>AI</b>开源新突破:上传照片即可<b class='flag-5'>生成</b><b class='flag-5'>表情</b><b class='flag-5'>包</b>视频!

    原来这才是【生成AI】!!

    随着ChatGPT、文心一言等AI产品的火爆,生成AI已经成为了大家茶余饭后热议的话题。可是,为什么要在AI前面加上“生成式”这三个字呢?
    的头像 发表于 06-05 08:04 290次阅读
    原来这才是【<b class='flag-5'>生成</b>式<b class='flag-5'>AI</b>】!!

    阿里云视频生成技术创新!视频生成使用了哪些AI技术和算法

    电子发烧友网报道(文/李弯弯)日前,阿里云宣布通义实验室研发的视频生成模型EMO正式上线通义App,免费对所有人开放。借助这一功能,用户可以在歌曲、热梗、表情中任选一款模板,然后通过上传一张肖像
    的头像 发表于 05-08 00:07 3282次阅读

    京东推出AI全能服务

    京东近日在“春晓计划”中隆重推出了全新的“AI全能服务”,旨在通过一系列先进的AI工具,帮助商家轻松生成图文、视频和直播内容,进而实现运营成本的大幅降低,据称可节省高达50%的运营成
    的头像 发表于 03-14 11:48 696次阅读

    第一拨靠Sora赚钱的人已经出现

    随着OpenAI最新发布的人工智能文生视频大模型Sora的问世,科技与创意产业再掀热潮。据悉,Sora不仅能根据文字说明创造出逼真且富有想象力的场景,更因其强大的生成能力引发了市场与消费者的极大兴趣。
    的头像 发表于 02-22 14:05 655次阅读

    RZ/V2L DRP-AI支持版本.7.41发布说明

    电子发烧友网站提供《RZ/V2L DRP-AI支持版本.7.41发布说明.pdf》资料免费下载
    发表于 02-01 10:07 0次下载
    RZ/V2L DRP-<b class='flag-5'>AI</b>支持<b class='flag-5'>包</b>版本.7.41发布<b class='flag-5'>说明</b>

    因为生成AI兴起《纽约时报》起诉OpenAI和微软

    《纽约时报》把这个难题抛给了美国纽约南区的美国联邦法院。 因为此前《纽约时报》与微软和OpenAI的谈判没有达成任何有效的解决方案。《纽约时报》在美国纽约南区的美国联邦法院起诉OpenAI和微软,指控他们的生成AI侵犯了其文字
    的头像 发表于 12-28 17:08 641次阅读

    生成AI技术的应用前景

    生成AI(人工智能)与我们熟知的 AI 有何不同?这篇文章将为我们一探究竟!
    的头像 发表于 11-29 12:20 1246次阅读