日前,国际自然语言处理与计算语言学领域最高级别的学术会议ACL(Annual Meeting of the Association for Computational linguistics)录取了京东智能广告实验室(JD Intelligent Advertising Lab简称JD IAL)和 Rensselaer Polytechnic Institute(伦斯勒理工学院)联合发表的题为“基于多语言多任务的低资源序列标注架构”的学术论文。论文首次提出了一种多语言多任务的监督学习架构,该架构对中文自然语言处理以及低资源语言的学习效果提升具有积极意义。
众所周知,由于语言的多样性和复杂性,自然语言处理(NLP)在学术和工业应用上一直是非常具有挑战的领域。同时由于中文语言的独特性和高灵活特点,基于中文的自然语言处理任务会更加复杂。
京东在服务数以亿计的用户同时,积累了大量的文本信息,如商品的名称,属性,用户评论和问答等。有效利用好这些文本信息,就能大幅提升京东的服务质量和用户满意度。然而,由于文本形式口语化,文本内容丰富,用以训练模型的标注数据少等问题,工程师在实际NLP技术开发中遇到了很大的挑战。
针对以上挑战,京东智能广告实验室提出了一种多语言多任务的监督学习架构。该架构结合了多种迁移学习模型,通过利用多任务训练的方式,极大地提升了低资源语言的学习效果。例如,在标准测试数据上,相比于传统的单语言、单任务的学习方法,利用新方法在实体标注任务上取得了 4.5% 到 50% 的性能提升(F值)。
据京东集团副总裁、商业提升事业部总裁,同时也是京东智能广告实验室负责人颜伟鹏博士介绍,针对复杂和较少标注的中文数据,通过引入大量的英文标注数据,能够有效提升中文序列标注(Sequence Labeling)的效果。目前该技术已经应用到京东的商品推荐,排序和文本生成等实际应用中。
京东智能广告实验室隶属京东商城商业提升事业部,主要从事智能广告相关的基础研究和应用研究,研究范畴涵盖视频图像、NLP、大规模机器学习、深度学习、推荐技术、广告机制等多个领域。实验室成员包括有学术能力的硕士、博士研究生以及经由实验室招募的优秀学者、在行业内和学术圈内有技术影响力的科学家。目前京东智能广告实验室已累计研究成果数十项,其中多个项目荣获京东集团技术创新奖项,多篇论文被国内外知名学术机构收录。
-
京东智能
+关注
关注
0文章
8浏览量
5585 -
nlp
+关注
关注
1文章
487浏览量
22010
原文标题:中文自然语言处理实现突破,京东智能广告实验室论文被ACL收录
文章出处:【微信号:AI_Thinker,微信公众号:人工智能头条】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
评论