9月28日,在业内举足轻重的科技巨擘Google、Facebook、IBM、亚马逊和微软共同宣布成立一家非营利机构——AI合作组织(Partnership on Artificial Intelligence to Benefit People and Society),首次在人工智能领域建立合作关系。
这一组织的成立旨在对有关人工智能具体如何影响社会的伦理问题展开研究,令人工智能技术的开发更加可控和透明,同时也是为了遏制人们对这项日益精进的技术产生的担忧。
这是为“邪术”出笼前准备好的“十字架与圣水”,有悲观人士如斯评价。
我们已经自觉或不自觉地开始步入人工智能时代了。
几天前的Google硬件发布会上,CEO劈柴花大量时间介绍了Google Assistant(谷歌面向消费者的人工智能虚拟助手,其核心能力包括:知识图谱、自然语言处理、翻译、语音识别、图像识别)的进步和价值。 Google已将这一服务植入到了Google手机Pixel和Google Home以及更多的应用领域当中,甚至包括智能穿戴以及智能汽车。透露出Google领跑人工智能时代的野心。
科技巨头的野心预示着AI发展将进入更广更深的领域,产生更大的影响,使工业生产、金融、律师、管理顾问、记者等众多行业从业人员都面临被AI 替代的失业风险。英国BBC电视台甚至预测,将近一半的普通职业从业者面临着50%被人工智能取代的危险。AI对新闻媒体行业从业者也将会带来前所未有的强烈冲击。
比如Google最新开发出的“神经机器翻译”(Neural machine translation),已经非常接近人类的翻译。话说,新闻翻译的活儿是不是就可以直接交给机器来干了?
随着人工智能程序AlphaGo完胜九段棋手李世石,自动化新闻写作机器人的成功开发,不久的将来,新闻媒体记者是不是就要被替代呢?
什么是AI?
在探讨AI带给媒体行业的影响前,我们先要了解AI的正确含义。
AI是人工智能(Artificial Intelligence)的英文缩写,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
CrowdFlower众包数据处理公司的CEO Robin Bordoli在《关于人工智能的七大常见误解》一文中提出了人工智能的有3个互相连锁的关键概念:
1.训练数据(TrainingData,TD)训练数据是机器可以用来学习的起始数据来源集。训练数据有输入值和带有答案的输出值,这样机器学习模型可以从答案中寻找模式。比如,输入可以是客服单,带有客户和公司的客服代表之间的电子邮件。输出可以是基于公司某个分类定义的从1到5的分类标签。
2.机器学习(MachineLearning,ML)机器学习是软件从训练数据中学习到某种模式,并把它应用到新的输入数据中。比如,一个新的客服单,带有某位客户和某位公司客服代表的邮件来了,机器学习模型可以预测出一个分类,并告诉你它对该分类的把握有多大。机器学习的关键特征是,它不是通过固定的规则来学习。因此,当它消化新的数据后会调整其规则。
3.人机回圈(Human-in-the-Loop,HITL)人机回圈是人工智能的第三个核心部分。我们不能指望机器学习万无一失。一个好的机器学习模型大约只有70%的准确性。因此你需要一个人机回圈流程,当模型的可信度低时,还可以依靠人。
于是我们可以得到AI的基本公式:AI = TD + ML + HITL
由此我们可以总结出有关AI的3个关键信息:
1.人工智能不是一开始就具有高超智能的,而是需要一个数据样本集对其进行训练。
2.机器获得智能本质上是从大量的样本数据中学会了一种模式,并随样本数据的更新不断更新其对模式的认识。
3.至少在当今,人工智能要做到万无一失还少不了人工把关。
AI会给新闻业带来怎样的影响?
了解了AI的含义,让我们来看看AI在新闻领域的应用。
抓取历史数据并生成图表
2016年8月30日,路透社与语义技术公司Graphiq宣布合作,旨在让数据可视化变得触手可及。Graphic公司有一个集结了50多位研发人员和数据专家的团队,专门负责收集经济、体育、娱乐等各个领域的数据。路透社借此利用AI实现了迅速抓取历史数据并生成图表,增强了新闻的实效性和可视性。
筛选“热门话题”
Facebook在8月26日宣布趋势话题撤掉人工编辑,完全依靠算法筛选热门新闻的趋势话题,做出了拥抱AI的勇敢尝试。但打脸的是,还不到3天,就让一则关于美国福克斯新闻主播梅根?凯利的假新闻登上了版面。
据报道,这是由于Facebook机器筛选“热门话题”依赖于该话题的相关文章和贴文数量,而非对于内容的判断。由此可见在当前技术情况下想要避免假新闻还得要人工把关。
制作视频
2016年6月,原论坛报集团(Tribune Publishing)宣布将公司更名为Tronc,并专注于使用人工智能制作内容。在接受CNBC电视台采访时,公司CEO Michael Ferro表示Tronc将会使用人工智能制作大量视频。但就目前的AI技术来说,利用AI是否能作出高质量的视频引起业界人士的质疑。
撰写新闻
人工智能写新闻已经不是一件新鲜事了。
2015年7月,美联社和科技公司Automated Insights合作,采用人工智能技术来报道商业领域的企业财报新闻。从300份一季度到3000份一季度,这次合作帮助美联社大大地提高了财报数量,据顾客反映正确率也大大提高。
2015年9月10日,腾讯网财经频道发出题为《8月CPI同比上涨2.0% 创12个月新高》的第一篇由自动化新闻写作机器人完成的稿件,引起新闻界关注。
在今年的里约奥运会上,今日头条实验室自助研发的AI机器人张小明通过两种文本生成技术产出新闻:一是针对数据库中表格数据和知识库生成自然语言的比赛结果报道,即简讯;二是利用体育比赛文字直播精炼合成比赛过程的总结报道,即资讯。奥运会期间通过对接奥组委的数据库信息,实时撰写新闻稿件,在 6天共生成超200篇简讯和资讯。
用户分析,个性化推送
在信息爆炸,用户需求多样化个性化的时代, 媒体如果想为100万读者制作100万个他们需要的个性化头版,就只能依靠人工智能(算法)了。Youtube、SmartNews、今日头条等新闻媒体都依靠人工智能算法获得了成功。
由此可见,AI在抓取历史数据并生成图表;筛选“热门话题”;制作视频;撰写新闻;用户分析,个性化推送等方面都发挥着强大的作用,引领着新闻媒体行业走向一场深刻的变革。
但由于技术限制,当今的AI还有很多缺陷,短期内不可能完全取代新闻记者,但随着技术不断进步,AI逐步趋于完善,也许在不久的将来就会取代很多新闻记者。
尤其是通讯稿式的新闻,很快就可以只靠机器人加上简单的人工把控轻易而高效率的完成了,这就要求新闻业工作者不能只求时效性和数量,更要追求内容的质量与深度。简单传达信息的工作将会被机器人取代,我们要转而传达思考与文化。
ColdFusionTV在《阿尔法狗背后的谷歌DeepMind:能自我学习的人工智能》中深入分析AI对未来的影响后得出结论:“人工智能可以接管很多信息密集型的专业工作,只为我们留下创造力和情感为本质的工作,这些或许是人工智能永远无法习得的。”
这样的结论让我们感到些许欣慰,毕竟创造力和情感是机器无法与人比拟的。但是机器真的无法做出创造性的工作么?
AI有创造性么?
艺术领域一直被视为人类情感和感性的领域,但连这样的领域AI都开始涉足。
Oscar Schwartz在题为《电脑能写诗吗?》的TED演讲中证明了电脑是可以写诗的。
现在我们来做一个小测试,下图的两首诗一首是人类诗人创作的,而另一首是由机器生成的,你能猜出哪一个是机器所作么?
这是讲师在演讲现场给观众提出的问题。
但当时只有个别几个观众猜对了。
答案是,诗歌1是人类诗人格特鲁德斯泰因写成的,而第二首则是由RKCP的算法所写的。RKCP是由谷歌设计师总管雷科兹威尔设计的演算法。原理是你给RKCP一个原文本,而它通过原文本了解到人类如何使用语言,然后创造出一种和该文本相似的语言。即为在本文开头所提到的训练数据+机器学习原理。诗歌2其实是受到诗人艾美莉迪金森的影响写成的。
怎么样?你猜对了么?
其实早在20世纪50年代,计算机科学和密码学的先驱阿兰?麦席森?图灵就设计出了有名的图灵测试,其内容是,如果电脑能在5分钟内回答由人类测试者提出的一系列问题,且其超过30%的回答让测试者误认为是人类所答,则电脑通过测试。2014年6月8日,一台计算机成功让人类相信它是一个13岁的男孩,成为有史以来首台通过图灵测试的计算机。这被认为是人工智能发展的一个里程碑事件。
除了会写诗,AI最近又开始进军音乐领域。
最近,索尼音乐的计算机科学研究实验室(Sony CSL)发布了两首完全由人工智能作曲的流行歌曲,称这是有突破性的第一次。无数网友表示本以为会效果感人,但亲测真的很好听。旋律易记的《Daddy‘s Car》,是人工智能模仿The Beatles乐队的风格创作的,有种阳光明媚在路上吹风的感觉,大家有兴趣可以试听感受一下。
诗歌、音乐、语言。曾近被我们认为最需要人类感性的领域,实践证明AI同样也可以做的很好。
照这个逻辑,在人工智能不断发展下,不久的将来机器人写分析性预测性的文章,写深度长文报道,复杂选题的特稿是否也能得心应手呢?这不得不让众多媒体人感到恐慌。
机器人会取代媒体人么?
别着急,让我们先来仔细想想机器人是怎么创作诗和歌曲的吧。
在这两个案例中,机器人都是通过输入大量的源样本,从中进行模式学习,进而创作出有某人风格的作品,有的时候(如歌曲的最终完成)还需要加以人工辅助来完成的。
其实完全符合AI = TD + ML + HITL的公式。
即使是随着技术的进步,人机回圈的必要性越来越小,AI是否就可以取代新闻媒体记者,写出比人类更好的新闻报道呢?
也许你会说是的,毕竟阿尔法狗就战胜了人类。
但是围棋比赛和做新闻有本质区别。
记者的不断创新才是AI创作的源泉
围棋与创作最大的区别在于围棋有胜负,并且只有围棋本身的规律,不随时代而改变。在阿尔法狗的训练过程中,是先让其学习无数的人类下棋模式后,再让不同版本的阿尔法狗之间进行比赛,并对新的比赛过程进行学习,使其不断超越机器自身,最终才得以超越人类。
而创作领域没有输赢之分,好坏也是很主观的事情,所以没有办法让其自身不同版本之间进行竞争,也就很难想到方法让其只靠学习以前的文章就能持续提高水平,写出比人类记者更优秀的文章。
要写出好文章,就要输入大量优秀的的样本,而这些优秀的样本创造需要无数记者充分发挥创造力,如果没有无数记者的不断创新,只有机器人在现有的文章中不断学习,很难想象怎么能与时俱进地写出越来越好的文章以及新闻报道。
也许随着技术进步AI能写出比大多数普通记者都好的文章,这就对记者提出了更高的要求,但AI最终无法超越不断创新的广大记者群体。
AI的前进方向由媒体人决定
另外,更重要的是,在为AI机器人训练时,给它们怎样的样本取决于人类对这一工作本质的认识。
Oscar Schwartz讲师在演讲中提到,人工智能的发展是一面镜子,AI机器人并非会创作,它们只会通过学习来做的无限像人的某一个方面。而我们则需要决定“要让人工智能像人类的哪一个方面”。
这一决定需要我们对人本身,对新闻和媒介本身有更深的理解。
例如,如果要利用AI为用户个性化筛选新闻,我们首先要想明白作为一个用户最需要怎样的新闻,如何避免仅靠用户的浏览记录来推送文章时可能引发的信息娱乐化和狭窄化。
如果想要利用AI写出好的新闻深度报道,我们需要想明白究竟什么堪称优秀的新闻报道,需要从我们自己平时写深度报道时如何收集材料,如何归纳分析,如何创新中总结出一种规律。
如果写分析预测,我们则需要知道需要考虑到哪些因素,收集哪些数据来进行分析预测。
需要与用户进行互动,建立关系时,我们首先要知道用户需要怎样的关系,这个关系随时代怎么改变。
也就是说,AI说到底是增强人类某一方面能力的辅助,而需要增强哪一方面能力,需要怎么增强,这个最关键的方向性问题需要我们来思考。
正如ColdFusionTV所说“人工智能研究的原点是人脑,是人类对于自己大脑的理解的反映”,所有的规律和奥秘其实都在我们自身。
所以对于每一个媒体人来说,只有我们更深入地了解新闻媒体行业的本质和人类通过媒介获得信息、人的思考方式的本质,加深AI领域的人文探索,才能使AI更好的为我们所用。这是AI对所有媒体人全新的挑战。
评论
查看更多