2018年国际顶尖学术会议上发表的机器学习和NLP相关论文的数据统计-电子发烧友网

剑桥大学数据科学家Marek Rei在个人博客上发布了2018年国际顶尖学术会议上发表的机器学习和NLP相关论文的数据统计。数据显示，无论是顶会论文发表数量还是会议出席人数，都表明AI领域仍处于快速的增长期，“AI寒冬”并未到来。

2018年已过经去，各类盘点还在继续。

近日，剑桥大学数据科学家Marek Rei在个人博客上更新了2018年国际顶尖学术会议上发表的机器学习和NLP相关论文的数据统计。

虽然2018年“AI寒冬”的警告不绝于耳，但Marek Rei的这份数据显示，去年在AI相关领域，无论是顶会论文发表数量还是会议出席人数，都表明AI领域仍处于快速的增长期，2018年的统计数据打破了此前的多项纪录。

最值得注意的是，今年的NeurIPS会议的门票在开票后仅11分38秒即告售罄，堪比春运火车票，令无数准备参会或围观大牛的热心观众唏嘘不已。

本文提供了关于这些统计数字的更精细的分类数据信息，一起来看看哪些作者和机构在特定的学术会议上发表的论文数最多。

今年的统计信息中涵盖了下列会议/期刊：

ACL、EMNLP、NAACL、EACL、COLING、TACL、CL，CoNLL、NeurIPS、ICML、ICLR和AAAI。

上述会议/期刊基本涵盖了全球最知名、级别最高的机器学习自然语言语言技术成果出处。与2017年的数据相比去掉了SemEval，因为该会议主要关注共享作者的论文，本次统计也没有将合作成果的数据收录在其他会议中。

今年的统计数据中新收录了AAAI，这是一个规模较大的会议，之前的统计中未收录。 NeurIPS（前NIPS）去年进行了更名，但为了保持一致性，在之前年份的数据内容中一律统一使用新名称。

统计数据的抓取和分析是通过一系列脚本自动完成的，多年来，这些自动脚本一直在不断改进。论文列表是通过在线程序抓取的，通常也附带有作者信息。组织机构名称需要直接从PDF中提取，这可能会导致一些错误。为此我已经采取各种方法来检测和映射不同类型的机构名，来尽量避免这些错误。

这篇文章重点介绍了近年来发表论文数量最多的作者和机构，但这里要指出，不能将发表论文的数量作为研究领域中一味追求或奖励的目标，而且论文数量的快速增长，并不代表研究质量的快速提高。

写出一篇具有开创性意义的论文，要比发表10篇很快就被人遗忘的论文更了不起。此文的目的是为了给相关领域的人员提供一个更广的视角，也可能为心怀优秀创意的新研究人员提供一些灵感。

关注每位作者在不同年份发表的论文数量，按照两年为单位，Chris Dyer仍然显得一枝独秀，Yue Zhang和 Ming Zhou紧随其后。

2012-2018年全球会议/期刊论文数量变化情况

先来看看2012-2018年间统计收录的会议上的会议论文。大多数机器学习会议上发表的论文数量都呈现持续增长态势，其中发表在AAAI和NeurIPS上的论文超过1000篇。 EMNLP和NAACL也逐年连创新高。ACL和COLING则变化不是很大。 EACL今年休会，TACL和CL的论文数量多年来保持相对平稳。

作者情况统计

接下来，看看2018年在这些会议上发表过论文的作者情况。有三位研究人员分别发表了22篇论文，论文数量排名并列第一，分别是：周明（微软），格雷厄姆·纽比格（卡内基梅隆大学）和谢尔盖·莱文（加州大学伯克利分校）。紧随其后的是张潼（曾供职腾讯AI，最近离职），孙茂松（清华大学）和Iryna Gurevych（达姆施塔特工业大学）。

再来看看2012-2018之间的发表论文总数，Chris Dyer（DeepMind）以97篇排名榜首。紧随其后的是周明（微软）、Yoshua Bengio（蒙特利尔大学），张岳（西湖大学）和Noah A.Smith（华盛顿大学）。大多数作者明显更倾向于在自然语言处理或机器学习的核心会议，Percy Liang可能是个例外，在期刊和会议上发表的论文数量基本差不多。

还可以查看不同年份每位作者的论文数量。可以看到，Chris Dyer在2015-2016年间发表的论文数量增长惊人。

一作情况统计

接下来是关于论文第一作者的统计数据。论文的第一作者通常是那些实际操作、实验并撰写论文的大部分内容的人，是反映作者对论文成果贡献度的重要指标之一。

在这项统计中，位列榜首的是Yi Tay（南洋理工大学），他是一名三年级博士生，在2018年的学术会议上共发表了10篇一作论文，令人印象深刻。第二名为朱泽园（Zeyuan Allen-Zhu），去年共发表6篇一作论文。排在之后的分别是Mikel Artetxe，Jiatao Gu（香港大学），Dinghan Shen（杜克大学）和Nathan Kallus（康奈尔大学）去年共发表5篇一作论文。

再来看看发表论文总数，李纪为（香侬科技）发表了 22 篇一作论文。其后是朱泽园（微软）、Young-Bum Kim（亚马逊）、Ryan Cotterell（剑桥大学）和 Ivan Vulić（剑桥大学）。

组织机构发表论文情况

接下来是企业和研究机构发表论文的统计数据。与前两年一样，CMU在2018年发文数仍然位居第一，自然语言处理和机器学习主题之间的论文数量差距相对均匀。从企业方面来看，谷歌和微软仍然是行业的领导者，清华大学、斯坦福大学、北京大学、麻省理工学院和加州大学伯克利分校都位列顶级机构之列。

从2012年至2018年的整个时段来看，排名实际上没有太多变化。CMU仍然处高居第一，微软和谷歌得而排名则换了个位置。普林斯顿大学、INRIA和杜克大学似乎专注于机器学习领域，几乎没有在NLP领域发表文章。相比之下，北京大学、中科院和爱丁堡大学似乎更重视NLP方向，没有在NeurIPS /ICML上发表什么文章。

从时间分布来看，CMU在过去几年内一直保持高产，并且仍在继续增长。谷歌和微软一直在争夺企业界的榜首位置，但目前谷歌似乎取得了领先地位。清华、北大等中国大学目前的论文发表数量正在迅猛上涨。

论文研究话题的分布

最后是关于论文作者和组织机构发表论文主题的一些分类。我收集了与指定作者/组织机构相关的所有论文，全部小写处理，加上标记，然后传递给LDA，再用t-SNE进行可视化，显示出了他们的论文内容与图中其他人内容的相似关系。结果如下：

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

机器学习

机器学习

+关注

关注
66

文章
8454

浏览量
133170
自然语言处理

自然语言处理

+关注

关注
1

文章
620

浏览量
13665
nlp

nlp

+关注

关注
1

文章
489

浏览量
22130

原文标题：机器学习和NLP顶会论文大王：周明、张潼、孙茂松等上榜

文章出处：【微信号：AI_era，微信公众号：新智元】欢迎添加关注！文章转载请注明出处。

IEEE MEMS 2025 中国大陆地区论文录用情况：北京大学/中科院微系统所/上海交大排名前三

的国际顶级学术会议，主要聚焦微纳加工与集成、微纳传感器与执行器、微系统等领域的重要研究成果。该会议每年举行一次，地点轮流在美洲、欧洲和亚洲设立，至今已成功举办了37届。第38届IEEE MEMS

发表于 12-23 18:00 •862次阅读

IEEE MEMS 2025 中国大陆地区<b class='flag-5'>论文</b>录用情况：北京大学/中科院微系统所/上海交大排名前三

润和软件出席中华预防医学会环境卫生分会2024年学术会议

由中华预防医学会环境卫生分会主办，中国疾病预防控制中心环境所承办，安徽省疾病预防控制中心协办的中华预防医学会环境卫生分会2024年学术会议在合肥盛大召开。作为中华预防医学会环境卫生分会特邀参展企业中

发表于 09-23 16:00 •582次阅读

Nullmax视觉感知能力再获国际顶级学术会议认可

日前，欧洲计算机视觉国际会议 ECCV 2024公布论文录用结果，Nullmax感知团队的目标检测论文《SimPB: A Single Model for 2D and 3D Object Detection from Mult

发表于 09-02 14:07 •492次阅读

邀请函| Aigtek安泰电子携经典产品，亮相第二届波动力学前沿与应用学术会议！

9月6日~8日，第二届波动力学前沿与应用学术会议将于浙江舟山喜来登绿城酒店隆重召开，届时Aigtek安泰电子将携一众功放仪器产品及行业测试解决方案亮相本次大会，我们诚邀您莅临展位参观、洽谈与观摩

发表于 08-30 11:47 •573次阅读

邀请函| Aigtek安泰电子携经典产品，亮相第二届波动力学前沿与应用<b class='flag-5'>学术会议</b>！

中微公司受邀出席第十八届全国MOCVD学术会议

近日，第十八届全国MOCVD学术会议于湖北恩施成功落下帷幕。中微公司MOCVD技术团队受邀出席了此次盛会并在《材料生长、表征与装备》技术论坛发表主题演讲，和MOCVD领域的学界泰斗与产业先锋们共话产业发展的未来趋势。

发表于 08-16 09:22 •620次阅读

CET中电技术邀您参加第八届全国电能质量学术会议暨电能质量行业发展论坛

8月8-9日，由中国电源学会电能质量专业委员会与亚洲电能质量产业联盟联合举办第八届全国电能质量学术会议暨电能质量行业发展论坛，将在山东曲阜举行。会议以“高质量电能支撑高质量发展”为主题，探讨在“双碳

发表于 08-06 08:35 •468次阅读

CET中电技术邀您参加第八届全国电能质量<b class='flag-5'>学术会议</b>暨电能质量行业发展论坛

芯动力科技论文入选ISCA 2024，与国际巨头同台交流研究成果

布宜诺斯艾利斯举行的ISCA 2024会议上发表演讲，与Intel、AMD等国际知名企业同台交流。本届ISCA共收到来自全球423篇高质量论文

发表于 07-18 11:16 •703次阅读

深度学习与nlp的区别在哪

深度学习和自然语言处理（NLP）是计算机科学领域中两个非常重要的研究方向。它们之间既有联系，也有区别。本文将介绍深度学习与NLP的区别。深度学习

发表于 07-05 09:47 •1094次阅读

名单公布！【书籍评测活动NO.35】如何用「时间序列与机器学习」解锁未来？

。如果你也想了解系统了解时间序列与机器学习的相关知识，那就来看看这本“荔枝书”吧！申请时间 2024年6月25日——2024年7月2

发表于 06-25 15:00

OpenHarmony 成功亮相国际学术会议 ASPLOS 2024

4月27日下午，首届OpenAtom OpenHarmony（以下简称“OpenHarmony”）学术教程会（Research Tutorial，以下简称“学术教程会”）于美国加利福尼亚州圣地亚哥

发表于 05-16 09:28 •511次阅读

国科微即将出席国际顶级学术会议CPS-IoT Week2024

5月13日-16日，国际顶级学术会议第17届信息物理系统与物联网大会（CPS-IoT Week 2024）将在中国香港举行，来自全球的顶级科学家、学者、产业领袖将共同探讨和见证CPS与IoT领域的最新发展与创新。

发表于 05-08 14:10 •730次阅读

电压敏学术研讨委员会暨学习交流专题会议圆满召开

电压敏学术研讨委员会暨学习交流专题会议近日在杭州举办，为行业专家和学者提供了一个深入交流的平台，更将“新质生产力”这一概念推向了行业讨论的前沿。 2024年4月24日，电压敏

发表于 05-06 15:47 •502次阅读

OpenHarmony即将首次亮相国际顶级学术会议

OpenHarmony 即将首次亮相国际顶级学术会议 01 第29届“ACM面向程序语言和操作系统的体系结构支持国际会议”（ASPLOS: International Conference

发表于 04-13 08:42 •318次阅读

Aigtek安泰电子第一届全国等离子体生物医学学术会议圆满结束！

第1届全国等离子体生物医学会议由西安交通大学发起的“第一届全国等离子体生物医学学术会议”于2024年3月15日-18日在西安成功举办。会议吸引了来自全国80余家高校、研究所、医院和企业

发表于 03-22 08:01 •480次阅读

3月15-17日与Aigtek相约第一届全国等离子体生物医学学术会议！

Aigtek诚邀您参会2024年3月15-17日，Aigtek安泰电子将携一众明星产品及专业测试解决方案亮相第一届全国等离子体生物医学学术会议。在此，我们诚邀您莅临会议参观、洽谈与观摩！-时间

发表于 03-07 08:01 •572次阅读

搜索历史

2018年国际顶尖学术会议上发表的机器学习和NLP相关论文的数据统计

评论

IEEE MEMS 2025 中国大陆地区论文录用情况：北京大学/中科院微系统所/上海交大排名前三

润和软件出席中华预防医学会环境卫生分会2024年学术会议

Nullmax视觉感知能力再获国际顶级学术会议认可

邀请函| Aigtek安泰电子携经典产品，亮相第二届波动力学前沿与应用学术会议！

中微公司受邀出席第十八届全国MOCVD学术会议

CET中电技术邀您参加第八届全国电能质量学术会议暨电能质量行业发展论坛

芯动力科技论文入选ISCA 2024，与国际巨头同台交流研究成果

深度学习与nlp的区别在哪

名单公布！【书籍评测活动NO.35】如何用「时间序列与机器学习」解锁未来？

OpenHarmony 成功亮相国际学术会议 ASPLOS 2024

国科微即将出席国际顶级学术会议CPS-IoT Week2024

电压敏学术研讨委员会暨学习交流专题会议圆满召开

OpenHarmony即将首次亮相国际顶级学术会议

Aigtek安泰电子第一届全国等离子体生物医学学术会议圆满结束！

3月15-17日与Aigtek相约第一届全国等离子体生物医学学术会议！