0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

微软美国研究院和清华联合推出了一款开源的多领域端到端对话系统平台—ConvLab

nlfO_thejiangme 来源:lp 2019-04-23 10:42 次阅读

近年来对话系统迅速发展,同时也出现了一系列丰富的数据集。但对于刚刚进入这一领域团队来说,迅速搭建起对于特定任务的可用的对话系统依然充满挑战。这主要是由于这一领域内缺乏结构完善、易于使用的开源系统,让研究人员可以便捷的搭建和测评对话机器人

众所周知,基础性的开源系统为AI研究的突破打下了坚实的基础,在这一领域的Moses、HTK和CoreNLP等项目都被广泛用于机器翻译、语音识别和自然语言处理,推动了各层次研究的飞速发展。

为了促进这一领域的发展,微软美国研究院和清华联合推出了一款开源的多领域端到端对话系统平台—ConvLab,使得研究人员可以便捷地搭建对话系统、自动训练对话模型、构建并评测对话机器人的各方面表现。

ConvLab

为了便于用于构建不同类型任务导向的机器人、将更多的自动化引入构建、训练和测评过程中,ConvLab包含了丰富的模型工具和运行引擎、以及端到端的测评平台。简单来讲台中包含了基于模块和端到端两种架构类型的对话系统:基于模块的架构系统包含了自然语言理解(NLU)、对话系统追踪(DST)、对话策略(POL)和自然语言生成(NLG)等模块;完全端到端神经架构减少了手工编程的工作量,并减小了误差在工作流程中的传播。

与先前工具集集中于系统策略或者受限于固定的预训练模型不同,ConvLab基于全标注的数据集覆盖了所有可训练的统计模型,解决了先前对于系统性能度量的困难。

很多时候用户需要在多子域之间无缝衔接实现高层用户目标,多层级的对话系统对数据收集、标注以及模型的开发都提出了复杂的要求。有研究人员提出了MultiWOZ数据集(包含了旅行相关的多邻域对话内容),但目前却缺乏对应的开源平台来处理多域多意图对话。为了加速多领域对话的研究ConvLab研究了MultiWOZ任务的特征,并提供了一系列完整的参考模型(包含了独立的模块和端到端模型)、这些模型在为用户对话额外标注的MultiWOZ数据集上进行了训练。ConvLab目前还作为DSTC18多领域端到端对话追踪的标准平台,得到了更广泛的应用和实际的检验。为了更好的支持端到端评价、ConvLab提供了两个互补模块、分别集成了亚马逊Amazon Mechanical Turk平台用于人类测评、同时也集成了虚拟用户用于自动测评。针对用户仿真,平台同时提供了基于规则和基于数据驱动的模拟器。ConvLab在开发模拟用户的过程中也研发出了一系列先进的用户模拟技术

架构设计

整个系统基于模块化的设计保障了灵活性和适应性。为了支持多领域对话系统的搭建,平台使用了主体-环境-对话实体的组合设计(Agents-Environments-Bodies,AEB),除了单环境和单主体的配置外,系统还包含了一系列先进的研究实验、包括多任务学习、多主体学习和角色扮演、无需复杂的代码即可导入到实例中使用。

此外,为了系统性地对比不同的主体和环境,并实现自动超参数搜索,平台充分利用了SLM Lab和Ray^2 作为实验组件。他们提供了多层级的控制,从会话、尝试和试验上为每一层次生成评测报告。

其中会话用于初始化主体和环境、并以预设的轮次运行。随后利用随机种子来启动多个会话进行尝试、并最终在会话上分析并求平均。最后利用实验来确定不同超参数的表现。

对话主体和环境的配置

在系统中每个层代表了构建对话系统的不同方式,在下图中可以看到最上层代表了传统方式构建对话系统的架构路线图,包括了NLU,DST,POL,NLG。研究人员近年来通过引入词级对话状态追踪、对话策略和端到端模型等典型组件,探索了构建对话系统不同可能的组合实现形式。在ConvLab平台上,研究人员可以聚焦于下图中的任意组件,并以端到端的简单方式进行测试。

对于环境构建来说,可以由很可能的组件来进行构建。在研究对话策略优化的强化学习算法中,典型的方法是利用用户模拟器在对话行为层级上进行操作。对话主体会尽可能利用端到端的方式尝试减小对标注数据的需求,对于人类评测来说平台提供了基于Amazon Mechanical Turk来作为最后一层进行环境构建。

参考模型和跨域数据实验

在ConvLab中还涵盖了针对多重任务的模型供研究人员进行参考评测,包括了自然语言理解领域的Semantic Tuple Classi-fier (STC)、 OneNet以及作为拓展的Multi-intent LU (MILU);对话状态追踪引入了DSTCs基准模型、词级对话状态追踪领域集成了MDBT模型将域识别与置信状态追踪进行结合;在系统策略方面平台支持DQN,REINFORCE\PPO以及自模仿等;自然语言生成领域则使用了SC-LSTM方法。在词级策略上使用了Budzianowski等人提出的基准;在用户策略上ConvLab提供了基于agenda的方法和基于数据驱动(例如HUS等)的方法,模型在对话行为级别进行并可与NLU等模块协同构架出完整的用户模拟器;最后再端到端模型上则包含了Mem2Seq,Sequicity,并使得Sequicity实现了对于多域的支持。目前ConvLab主要支持MultiWOZ和Movie两个不同复杂度的数据域。其中MultiWOZ的主要任务是帮助旅客,其中引入了包含景点介绍和酒店预订等不同方面的内容。MultiWOZ中主要包含了7个子领域的问题:景点、医院、酒店、警察、餐厅、出租车、火车等方面的内容。其中包含了10438个标注对话。对于单领域和多领域的对话轮次平均为8.93和15.93轮。ConvLab对于用户对话行为进行了额外的标注、并为对话系统元件和用户模拟器提供了预训练基准模型、以及基于此数据训练的端到端的自然对话模型。Movie则来自于微软对话挑战赛,主要集中于电影票预订场景,包含了2890个标注对话,评论为7.5轮,同时还提供了针对主体和用户模拟器的一系列完整的参考模型。研究人员表示在未来还会加入Taxi和Restaurant等领域的任务不断丰富平台支持的领域。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6640

    浏览量

    104608
  • 开源
    +关注

    关注

    3

    文章

    3426

    浏览量

    42809
  • 模块化
    +关注

    关注

    0

    文章

    334

    浏览量

    21477

原文标题:微软与清华开源多领域端到端对话系统集成平台ConvLab,帮助研究人员迅速搭建对话系统

文章出处:【微信号:thejiangmen,微信公众号:将门创投】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    安谋科技与智源研究院达成战略合作,共建开源AI“芯”生态

    支持、生态系统建设与推广等系列深入合作,共同打造基于Arm架构的开源技术生态体系,赋能国内大模型与人工智能产业的高速发展。 图:现场签约照片 安谋科技销售及商务执行副总裁徐亚涛 表示:“当前,生成式AI在云边
    发表于 12-26 17:06 257次阅读
    安谋科技与智源<b class='flag-5'>研究院</b>达成战略合作,共建<b class='flag-5'>开源</b>AI“芯”生态

    自动驾驶技术研究与分析

    编者语:「智驾最前沿」微信公众号后台回复:C-0450,获取本文参考报告:《自动驾驶行业研究报告》pdf下载方式。 自动驾驶进入2024年,
    的头像 发表于 12-19 13:07 353次阅读

    智己汽车“”智驾方案推出,老司机真的会被取代吗?

    随着智能驾驶技术的发展,行业已经从早期基于简单规则和模块化逻辑的自动驾驶,逐步迈向依托深度学习的高复杂度智能驾驶解决方案,各车企也紧跟潮流,先后宣布了自己的智驾方案。就在近期,智己汽车
    的头像 发表于 10-30 09:47 393次阅读
    智己汽车“<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>”智驾方案<b class='flag-5'>推出</b>,老司机真的会被取代吗?

    InfiniBand网络解决LLM训练瓶颈

    ChatGPT对技术的影响引发了对人工智能未来的预测,尤其是模态技术的关注。OpenAI推出了具有突破性的模态模型GPT-4,使各个领域取得了显著的发展。 这些AI进步是通过大规模
    的头像 发表于 10-23 11:26 603次阅读
    <b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>InfiniBand网络解决LLM训练瓶颈

    字节跳动与清华AIR成立联合研究中心

    近日,清华大学智能产业研究院(AIR)与字节跳动共同宣布成立“可扩展大模型智能技术联合研究中心”(SIA Lab),并在清华大学举行了隆重的
    的头像 发表于 10-12 15:24 482次阅读

    测试用例怎么写

    编写测试用例是确保软件系统从头到尾能够正常工作的关键步骤。以下是个详细的指南,介绍如何编写
    的头像 发表于 09-20 10:29 611次阅读

    香港城市大学与富士康鸿海研究院成立联合研究中心

    计算等领域的创新研究项目。 近日,联合研究中心的揭幕仪式举行。主礼嘉宾包括城大校长梅彦昌教授、鸿海研究院执行长兼资通安全
    的头像 发表于 06-21 14:37 522次阅读
    香港城市大学与富士康鸿海<b class='flag-5'>研究院</b>成立<b class='flag-5'>联合</b><b class='flag-5'>研究</b>中心

    易华录无锡数据湖与清华大学苏州汽车研究院(吴江)合作挖掘智能驾驶数据新价值

    6月15日,易华录无锡数据湖与清华大学苏州汽车研究院(吴江)数字工业中心就“聚焦汽车智能驾驶领域,共同挖掘智驾数据新价值”举行了签约仪式。清华大学苏州汽车
    的头像 发表于 06-18 15:00 1011次阅读

    英维克、英特尔、宝德联合推出平台液冷铝冷板系统

    日前,科技界迎来了项重要创新——英特尔、宝德、英维克三大巨头联手,成功推出了兼容平台的液冷铝冷板
    的头像 发表于 06-18 14:07 599次阅读

    华为IPv6+解决方案通过信通IPv6+ 2.0 Advanced测试评估

    近日,华为IPv6+解决方案成功通过中国信息通信研究院(以下简称“信通”)IPv6+ 2.0 Advanced测试评估,获得业界首张
    的头像 发表于 05-17 10:00 964次阅读
    华为IPv6+<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>解决方案通过信通<b class='flag-5'>院</b>IPv6+ 2.0 Advanced测试评估

    长沙北斗研究院总部基地正式奠基

    主体建筑,4栋主体建筑分别对应北斗平台、中试平台、创新平台、孵化平台4个平台,长沙北斗研究院总部
    的头像 发表于 05-16 12:49 1286次阅读

    北京开源芯片研究院正式加入甲辰计划!

    北京开源芯片研究院正式加入甲辰计划,致力于在下个丙辰年(2036龙年)之前,基于RISC-V实现从数据中心到桌面办公、从移动穿戴智能物联网全信息产业覆盖的开放标准体系及
    的头像 发表于 05-10 08:33 867次阅读
    北京<b class='flag-5'>开源</b>芯片<b class='flag-5'>研究院</b>正式加入甲辰计划!

    人工智能模型公司Anthropic近日推出了一款Claude移动App

    制造Claude 3人工智能模型公司Anthropic近日推出了一款iOS应用程序,并为群组共享模型访问添加第二个付费层。
    的头像 发表于 05-08 09:55 795次阅读

    智行者联合清华完成国内首套全栈式自动驾驶系统的开放道路测试

    近日,智行者与清华大学车辆学院李克强院士、李升波教授领导的研究团队,完成了国内首套全栈式自动驾驶
    的头像 发表于 04-22 09:24 864次阅读
    智行者<b class='flag-5'>联合</b><b class='flag-5'>清华</b>完成国内首套全栈式<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>自动驾驶<b class='flag-5'>系统</b>的开放道路测试

    DEKRA Stan Zurkiewicz拜访清华大学苏州汽车研究院,探讨汽车行业安全发展

    3月12日,DEKRA德凯集团董事会主席兼首席执行官Stan Zurkiewicz先生行拜访清华大学苏州汽车研究院,探讨汽车行业安全发展。
    的头像 发表于 03-13 16:46 1090次阅读