0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一群追星星的人,对AI的盼与怕

脑极体 来源:脑极体 作者:脑极体 2024-07-15 18:35 次阅读

wKgaomaU-2aABw2nAAidA3olJ7c285.jpg

面对AI,有人害怕,有人期盼。

“AI和画画的、开网约车的、写东西的人有仇吗?”近来成了很多从业者的心声。大模型技术驱动了AI的能力进化过临界点,我们普通人根本就跟不上,或快或慢被淘汰。看起来,AI正在给人类制造新的困境。

怕AI可以理解,那盼AI的人,到底在期盼什么呢?

前不久我在WAIC 2024上,发现了一个由孤独症儿童的父母、志愿者所组成的普通开发者团体,用AI给“来自星星的孩子”做绘本,这将“星宝”照护者们拉出了困境。

如何平衡AI的利弊,引导其健康发展,是我们这个时代亟需面对的重要课题。那些长期被我们忽略、存量问题待解的“小场景”,或许更需要先一步感受到AI。

wKgZomaU-2eAEfNGAAUnTj-c0-A099.jpg

wKgaomaU-2iAfKQ1AAJ64Y3lRtg603.jpg

“孤独症儿童的照护没有结果(可能无法治愈),能做的就是维持一定的生活质量,仅此而已。”

“每天要绞尽脑汁地给孩子编故事。一旦编不出来了,孩子就不睡觉了,大人孩子都很崩溃。”

“为了照护每天都不能出门、不能睡觉,我有时真的想死。”

孤独症儿童也被称为“来自星星的孩子(星宝)”,在社交、沟通、行为方面有特殊需求,照护难度很大。精力不足,无法充足的睡眠,是“星宝”照护者们普遍的困境。

除了照顾“星宝”们的日常生活,照护者往往还希望提升孩子的生活质量,让他们也能感受到快乐和愉悦。“读绘本”就是一个能给星宝们带来幸福感的事情。

但定制绘本的缺失,让照护者们承受着情感上的痛苦。

孤独症AI绘本项目的发起人之一,就是“星宝”图图的爸爸。他提到:“我家图图特别爱听故事,特别是睡前故事,几乎每天晚上都要听故事入睡。但是由于孤独症孩子他们是有明显的兴趣狭隘和刻板这些特性的,他只喜欢听他感兴趣的几个话题,例如说安全常识,去郊外探险,孙悟空等,或者说这几个元素要融在一起才行,但市面上很难找到这样的绘本故事。”

既然市面上没有满足“星宝”个性化阅读需求的绘本,能不能自己做一个呢?

以公益产品“追星星的AI”为例,就通过大模型的三种能力,让这件事成为可能。

1.生成能力。“追星星的AI”通过家长或教师输入的一句话故事梗概(提示词),自动生成定制化的、图文并茂的绘本,包括常识认知、社交礼仪、心智解读、趣味故事等。

2.多模态能力。“追星星的AI” 调用了通义大模型的文生图、语音合成等AI多模态能力,可以让一句话变成能被朗读的有声绘本,丰富阅读体验。

3.交互能力。大语言模型的核心技术特点之一,就是能够与人类进行更为自然、流畅的对话。“追星星的AI”APP中,上海美术电影制片厂授权的孙悟空、大耳朵图图等动画形象,可以作为主角给孩子们讲故事,增强交互感。

wKgaomaU-2mAaRs5AAE9HOl2zic771.jpg

20世纪50年代初,AI概念初现曙光之际,人们对技术的愿景是,它能倾听并理解人类的需求,为那些最为亟需的人群伸出援手。

当AIGC之光照进星宝们的世界,让星宝家庭和照护者感受到来自科技的温暖与关怀,才是我们所期待的,技术在现实中的回响。

wKgaomaU-2mAYTc5AAIIIPMr2HE986.jpg

长期以来,将AI用于社会公益项目的尝试,屡见不鲜。为什么“追星星的AI”会引起我们的注意?

有一个特别的地方是:这个产品的开发,全部是由星宝照护者和志愿者来完成的。

非技术背景的普通人也可以掌握AI吗?跟“追星星的AI”工作人员聊了聊,或许可以给大家提供一些投身AI开发的思路。

首先,垂类应用要深入理解需求。

用AIGC生成绘本,这件事看起来非常简单易操作,几乎所有国产大模型平台都有全栈工具来支持从数据到精调、优化的所有步骤。但难点在于,每个应用所要求的细节都有很大差异。

比如星宝们可能没有办法理解过于复杂的图片信息

“我们最开始生成出来的那一版图画,画面风格就有些复杂,出来好多星星点点的叶子、小花,被大家提出了意见,现在生成的就是这种比较干净的画面,一张图就是一个主体。”

“有的星宝对某些食物、动物会怕,是不能看见的,我们就设置了一个屏蔽功能,不会生成带有那些内容的图片。”

该项目的参与者既有星宝家庭成员,也有孤独症儿童干预机构,以及多年从事孤独症研究的高校学者。最终,结合星宝的认知水平层级,确定了最简洁的画面形式,突出人物,对话平实直接,确保AIGC生成方便星宝理解的画面。

其次,线上分布式协作方式。

一群家长和志愿者,到底要用多长时间才能做出一个AIGC应用?“追星星的AI”的开发时间是两个月。

坦率来说,这比很多“零门槛AI开发平台”、大模型社区所宣传的时间更长。目前,借助APP Inventor、APPMakr等简化开发工具,一个专业开发者创建一个功能丰富、交互复杂的应用,大概只需要两周甚至更短的时间。为什么“追星星的AI”落地时间要数月呢?

这是一个完全由大量在职志愿者完成的项目。其中有星宝的父母,有特教老师,大多数人以前都没有接触过AI。而且,他们分布在世界各地,平时还有全职工作,利用晚上或周末的时间来沟通和写代码,采用线上分布式协作的方式推动项目。

移动互联网时代有个著名的段子,有创业者说,“创意有了,钱也融到了,就差个程序员了”。AI开发,可能是有史以来第一次“去中心化”,普通人也可以通过线上分布式协作来参与到技术世界当中。

此外,多机构的支持也必不可少。

一方面,绘本涉及动画形象,需要大量图片作为训练素材。其中上海美术电影制片厂授权并提供了悟空、图图等经典动画形象图库。另外,这些经典动画形象深入人心,要求模型的生成结果不能出现误差,尤其是“身体像面条一样”的悟空形象,一开始训练出来的效果并不理想。工作人员提到,后来上海美术电影制片厂的老师们并没有介意,后续又提供了更多的图库素材来帮助训练。

不难发现,“追星星的AI”是在很多非技术背景的人与机构的帮助下,才一点点搭建起来的。

wKgaomaU-2uATO01AAJ_Uq9qkUg135.jpg

近期以来,“担心被AI抢走工作”的焦虑已经出现了人传人现象。

尽管很多技术从业者、科普作家会反复强调,技术进步会让一些岗位消失,也会创造一些新的岗位,应该尽快主动地探索与规划未来职业。但客观来说,被AI淘汰的人,未必能快速适配新创造的岗位的技能要求。

难道人类社会就要毫不反思、毫不抵抗地加速迈入高度自动化、无人化阶段吗?我想起一句话:不要温和地走进那个良夜。

一方面,等待AI带来改变的场景很多,类似孤独症儿童照护这样的需求大量存在,以前并没有被很好地解决,智能技术的互动性、个性化等带来了前所未有的解题思路,这是技术应该最先到达的地方。

另一方面,每个人都能用好AI来解决实际问题,但他们需要得到实际的支持。除了科技企业搭建的平台和社区之外,支持有不同需求的国民继续学习、终身学习,已经成为很多国家的共识。

“哈佛幸福课”的讲师泰勒·本·沙哈尔说过:“一旦我们意识到自己的选项是什么,就很容易在短时间内作出决定。其中的关键点在于,意识到自己有选择,要比选择本身难得多。”

从这个角度说,“追星星的AI”让我看到了一群人关于AI的选择,或许也是你我更好的选择。

AI与人为敌,还是与人为友,选择权始终都掌握在人的手里。

wKgaomaU-2yAQBwqAAHhr2__jeY148.jpg

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30315

    浏览量

    268572
收藏 人收藏

    评论

    相关推荐

    的人机交互入口?大模型加持、AI眼镜赛道开启百镜大战

    电子发烧友网报道(文/莫婷婷)随着智能眼镜的出现,加之AI技术的应用,AI智能眼镜被认为是下代人机交互的入口。在今年,不少品牌厂商都推出了AI智能眼镜新品,包括李未可推出的Meta
    的头像 发表于 11-21 00:57 2541次阅读
    新<b class='flag-5'>的人</b>机交互入口?大模型加持、<b class='flag-5'>AI</b>眼镜赛道开启百镜大战

    汇川运动控制解决方案助力3D建筑打印规模化发展

    最近,汇川的一群“搬砖人”,将运控控制与3D混凝土打印技术相结合,探索出了这项技术在印度的新应用。
    的头像 发表于 09-27 10:59 369次阅读

    专为全平台备份而生,晖专注强韧数据安全,聚焦应用体化未来

    数据未来"。Synology 晖科技在企业数据领域积累多年经验,晖观察到,企业现今所面临的数字化转型、AI 技术发展和应用、新质生产力、合规的数据安全……这些都将给数据管理带来更大的挑战。
    的头像 发表于 09-26 11:46 418次阅读

    创转型新动向:或将涉足AI半导体封装

    在显示面板行业深耕多年的创光电,近年来正积极寻求业务转型,以拓宽其市场影响力。近日,据中国台湾业界消息,创光电似乎与全球知名的存储芯片大厂进行了深入接触,意图将其旗下的台南四厂转型至AI相关的半导体领域,主要专注于后段封装应
    的头像 发表于 06-18 16:15 354次阅读

    什么是AI麦克风阵列解决方案?

    什么是AI麦克风阵列解决方案? 想象下,你站在个音乐会的舞台上,周围有一群超级聪明的小助手,他们每个人手里拿着只麦克风,分散在舞台的
    的头像 发表于 06-14 16:19 661次阅读
    什么是<b class='flag-5'>AI</b>麦克风阵列解决方案?

    个哪够?是时候让一群AI替你打工了

    大模型的下个突破方向是什么?斯坦福大学教授吴恩达的答案是AI智能体工作流。在今年4月的次演讲中,吴恩提到多个智能体起工作,分配任务并讨论和辩论想法,能够提出比单个智能体更好的解决
    的头像 发表于 06-08 08:04 121次阅读
    <b class='flag-5'>一</b>个哪够?是时候让<b class='flag-5'>一群</b><b class='flag-5'>AI</b>替你打工了

    联将在台北国际电脑展展出创新AI与储存技术

    随着台北国际电脑展的盛大开幕,联电子紧跟行业趋势,将最新的创新技术和产品带到Computex的舞台上。该公司积极响应近期生成式AI落地应用需求的上升,致力于扩大其独家专利的生成式AI落地微调运算方案「aiDAPTIV+」的普及
    的头像 发表于 06-04 14:14 507次阅读

    国产卫星星座,为什么定要“走出去”?

    和规模也在持续扩大。卫星星座布局的窗口期旦结束,产业格局也将基本确定,新的玩家再想进入,就很难了。在卫星应用方面,发展速度也同样惊人。面向手机终端的卫星通信服务,
    的头像 发表于 05-31 08:04 112次阅读
    国产卫<b class='flag-5'>星星</b>座,为什么<b class='flag-5'>一</b>定要“走出去”?

    巴菲特谈自动驾驶和AI 巴菲特也AI诈骗

    巴菲特谈自动驾驶和AI 巴菲特也AI诈骗 股神巴菲特的一举一动都牵动着亿万人心,巴菲特的伯克希尔·哈撒韦公司(Berkshire Hathaway)日前在美国内布拉斯加州的奥马哈市召
    的头像 发表于 05-06 19:00 1101次阅读

    研华携手联 共同打造边缘运算与工控应用生成式AI平台

    赋能安全可靠&平民化的地端GenAI环境   导读: 4月17日,联电子(Phison)宣布与研华科技(Advantech)携手合作,共同打造GenAI运算平台。该平台将致力于协助工控应用客户打造
    发表于 04-26 17:28 235次阅读
    研华携手<b class='flag-5'>群</b>联 共同打造边缘运算与工控应用生成式<b class='flag-5'>AI</b>平台

    联电子:Home Computing助力平民化生成式AI

    与存储解决方案的开发。在2024年中国闪存市场峰会期间,联电子执行长潘健成向包括电子发烧友在内的媒体表示,这将是个极具创新的方案,我们不仅找到了闪存与生成式AI直接的关系,将闪存做了重新设计,带令生成式
    的头像 发表于 03-29 17:42 2360次阅读
    <b class='flag-5'>群</b>联电子:Home Computing助力平民化生成式<b class='flag-5'>AI</b>

    不会用AI的人被淘汰?讯飞AI鼠标AM30助你迎接AI时代

    不会用AI的人被淘汰?讯飞智能鼠标助你迎接AI时代 随着AI时代的到来,人们对于智能助手的需求也日益增长。 想在这个竞争激烈的时代中不被淘汰,就需要
    的头像 发表于 03-23 13:44 699次阅读
    不会用<b class='flag-5'>AI</b><b class='flag-5'>的人</b>被淘汰?讯飞<b class='flag-5'>AI</b>鼠标AM30助你迎接<b class='flag-5'>AI</b>时代

    NanoEdge AI的技术原理、应用场景及优势

    NanoEdge AI种基于边缘计算的人工智能技术,旨在将人工智能算法应用于物联网(IoT)设备和传感器。这种技术的核心思想是将数据处理和分析从云端转移到设备本身,从而减少数据传输延迟、降低
    发表于 03-12 08:09

    滤波器的延迟是什么?

    滤波器的延迟是什么? 滤波器的延迟是指滤波器对不同频率信号的延迟程度以及频率响应的相位响应之和。它是滤波器在处理输入信号时引入的总延迟,是滤波器稳定性、相位响应和信号失真的重要参数之。本文将从
    的头像 发表于 12-18 13:40 2960次阅读

    基于RZ/V2L AI MPU的人头计数应用

    瑞萨基于RZ/V2L AI MPU开发了大量可拿来即用的AI应用程序,并提供源代码、预编译应用程序二进制文件和预训练的人工智能模型对象。您可以从各种用例中选择感兴趣的应用程序,并立即在RZ/V2L评估板上运行。
    的头像 发表于 12-15 13:49 627次阅读