0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

首届时间检验应用科学奖公布,清华大学研究团队获奖

电子设计 来源:电子设计 作者:电子设计 2020-12-24 16:05 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

ACM SIGKDD(ACM SIGKDD Conference on Knowledge Discovery and Data Mining,国际数据挖掘与知识发现大会,简称 KDD)是数据挖掘领域国际顶级学术会议,今年的 KDD 大会将于 8 月 23 日至 27 日在线上召开。

8 月 13 日, SIGKDD 2020 官方公布了 2020 年 ACM SIGKDD 创新奖、服务奖、论文奖、新星奖、时间检验研究奖、时间检验应用科学奖等六项大奖的获得者,这些奖项是针对数据科学、机器学习、大数据和计算机科学领域的杰出个人和研究团队而设立的。

值得一提的是,今年 KDD 颁发了首届时间检验应用科学奖(Test of Time Award for Applied Science)奖项,以表彰在数据科学的实际应用中具有影响力的研究。清华大学计算机科学与技术系唐杰、李涓子等人凭借他们在 2008 年发表的关于学术社交网络挖掘的研究成果获得了这一奖项。

获奖论文题目为 ArnetMiner: Extraction And Mining Of Academic Social Networks,论文作者包括清华大学计算机科学与技术系的唐杰、张静、姚利敏、李涓子,以及来自 IBM 中国研究实验室的张莉和苏中。

在这篇文章中,作者主要介绍了一个自主研发的面向研究者社会网络的挖掘搜索系统 ArnetMiner 的体系结构和关键技术。下面我们来将详细解读一下这篇文章。

研究背景

近些年,学术社交网络发展迅速,为众多研究学者提供了良好的交流平台,也产生了巨大的学术信息数据集。随着数据挖掘和人工智能技术的发展,针对学术社交网络进行数据挖掘和知识提取,进而为科学研究领域提供全方位的服务成为一大研究热点。

在作者开始这项研究之时,学术圈已有 DBLP、CiteSeer、Google Scholar 等学术搜索系统发布,但是往往存在以下两项不足之处:

1)缺乏语义信息。无论用户输入的个人资料或使用启发式方法提取的各类信息,语义存在不完整或不一致性,缺少有效获得大规模语义信息的方法;

2)缺乏异构对象的统一建模方法。以前,学术网络中不同类型的信息如学者、论文、会议期刊是单独建模的,因此无法准确捕捉它们之间的依赖关系。

为解决这两个问题,作者所在的研究团队开发了ArnetMiner系统。该系统旨在解决以下几个问题:

1)如何自动从互联网海量信息中提取研究人员的个人档案?

2)如何集成不同来源提取的学术相关信息(例如研究人员的个人档案和出版物)?

3)如何以统一的方法为不同类型的信息建模?

4)如何基于已构建的网络,提供强大的挖掘和搜索服务?

ArnetMiner系统(简称AMiner)

图1:AMiner系统框架图

图 1 给出了 AMiner 系统框架图,AMiner 系统自下而上主要包括五个部分:

1)研究者个人信息抽取(Extraction):即从网络上自动识别到研究者的个人主页,并训练一个统一的模型,从中抽取研究者的各种基本信息。同时,从不同来源的论文数据库抽取或收集作者所发表的论文信息;

2)个人信息融合(Integration):通过使用研究者姓名作为标识符,将提取的研究者的个人资料和提取的出版物信息进行整合。提出了马尔科夫随机场概率模型,以解决融合不同来源论文数据时面临的重名歧义问题;

3)存储和访问(Storage and Access):系统将集成的数据存储在研究者网络知识库(RNKB)中,利用MySQL作为存储数据库,并使用反向文件索引方法进行信息索引;

4)建模(Modeling):文章提出一个概率生成模型,通过对学术网络中的研究者、论文、会议等不同类型的信息进行综合分析,对每种信息进行主题分布估计;

5)搜索服务(Search Services):基于建模结果,提供多种搜索服务,包括专家搜索、关联关系搜索、论文推荐以及引用推荐等。

该系统重点解决三个技术难点:

1)学术网络中研究者个人信息自动抽取问题;

2)不同来源学术论文融合过程中的重名排歧问题;

3)学术网络中研究者、论文、会议等异质实体的统一建模问题。

审核编辑:符乾江
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 互联网
    +关注

    关注

    55

    文章

    11350

    浏览量

    110431
  • 计算机
    +关注

    关注

    19

    文章

    7836

    浏览量

    93446
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    清华大学体育锻炼数字化案例:基于蓝牙物联网的学生运动健康管理

    发展,如何科学、有效地落实体育锻炼要求,真实评估学生体质并保障运动安全,成为了新的挑战。清华大学体育部主任刘波曾坦言:清华体育传统很好,但学生的体质健康水平确实是在下降,有必要采取略强制的措施,促进学生锻炼习惯
    发表于 04-15 17:31

    清华大学电子工程系到访天数智芯参观交流

    近日,清华大学电子工程系、清华校友总会电子工程系分会、清华大学上海校友会电子信息专委会组织师生、校友代表到访天数智芯,开展深度校企交流活动,共话国产算力创新与产学研协同发展。
    的头像 发表于 04-07 17:40 1521次阅读

    沐曦股份联合清华大学发布磁性材料AI原子基座模型

    2月27日,沐曦股份联合清华大学等多家研究机构联合发布了磁性材料AI原子基座模型。该模型是首个覆盖宽温压域的磁性材料AI原子模型,经权威专家鉴定,整体技术水平达到国际领先。
    的头像 发表于 03-03 15:25 564次阅读
    沐曦股份联合<b class='flag-5'>清华大学</b>发布磁性材料AI原子基座模型

    清华大学研学团到访国民技术参观交流

    近日,清华大学集成电路学院、社会科学学院、土木工程系的博士及硕士研究生一行16人走进国民技术深圳总部,开展了一场别开生面的研学实践活动。本次活动聚焦技术交流与人才培养,推动校企合作迈向新阶段。
    的头像 发表于 02-11 14:54 644次阅读

    清华大学“启·创”计划走进拓维信息,校企共探AI时代产学研合作新范式

    1月13日,清华大学“启·创”计划第十三期赴湘社会实践活动暨TalkwebHouse创业私董会第二期在拓维信息圆满举办。清华大学创业团队20余名师生,与拓维信息团队深入对话,围绕“AI
    的头像 发表于 01-16 14:04 665次阅读
    <b class='flag-5'>清华大学</b>“启·创”计划走进拓维信息,校企共探AI时代产学研合作新范式

    中国科学院与清华大学:在无线传感医疗植入物研究方面取得重要进展

      2026 年 1 月 7 日,中国科学院力学所苏业旺研究团队清华大学生物力学所李爽博士和香港城市大学于欣格教授合作提出了一种柔性、可
    的头像 发表于 01-08 18:39 204次阅读
    中国<b class='flag-5'>科学</b>院与<b class='flag-5'>清华大学</b>:在无线传感医疗植入物<b class='flag-5'>研究</b>方面取得重要进展

    海康威视亮相第三届清华质量强国论坛

    近日,由清华大学质量与可靠性研究院、清华大学工业工程系主办的第三届 “清华质量强国论坛” 在京举行。作为第五届中国质量
    的头像 发表于 12-16 14:34 675次阅读

    时识科技DAVIS346传感器助力清华大学突破LIBS技术瓶颈

    近日,清华大学深圳国际研究生院王希林教授团队创新性地引入时识科技(SynSense)的类脑动态视觉传感器DAVIS346,首次将动态视觉传感器(DVS)技术应用于激光诱导等离子体光学信号的捕获,并以
    的头像 发表于 11-30 11:42 1072次阅读

    普华基础软件走进清华大学研究生课堂

    近日,普华基础软件走进清华大学车辆与运载学院,在《车辆控制工程》课堂上开展研究生专题授课和交流。本次授课聚焦智能驾驶汽车基础软件发展与关键技术,旨在搭建校企知识传递桥梁,为高校学子带来产业前沿视角,助力培养符合行业需求的复合型人才。
    的头像 发表于 11-26 15:53 486次阅读

    英创汇智荣获2025年度中国汽车工程学会科学技术二等

    近日,在第三十二届中国汽车工程学会年会暨展览会上,2025年度“中国汽车工程学会科学技术”正式公布。由奇瑞汽车、清华大学、英创汇智等单位联合申报的“高性能乘用车底盘关键技术及其产业化
    的头像 发表于 11-04 16:44 808次阅读

    清华大学TOP EE+项目参访美光上海

    此前,2025年6月4日至6日,清华大学TOP EE+ 项目于美光上海的参访活动圆满举行。为期三天的活动汇聚了来自清华大学电子工程系的优秀留学生与美光的多位管理者和工程师,展开了深入的技术交流与文化互动之旅。
    的头像 发表于 07-07 18:02 1644次阅读

    导远科技与清华大学无锡应用技术研究院达成合作

    近日,导远科技与清华大学无锡应用技术研究院(以下简称:研究院)达成合作。导远科技将提供高精度定位产品及解决方案,以支持研究院在L4级自动驾驶和人形机器人领域的技术研发及转化落地。
    的头像 发表于 06-12 16:34 1192次阅读

    清华大学到镓未来科技,张大江先生在半导体功率器件十八年的坚守!

    清华大学到镓未来科技,张大江先生在半导体功率器件十八年的坚守!近年来,珠海市镓未来科技有限公司(以下简称“镓未来”)在第三代半导体行业异军突起,凭借领先的氮化镓(GaN)技术储备和不断推出的新产品
    发表于 05-19 10:16

    清华大学携手华为打造业内首个园区网络智能体

    清华大学响应国家教育新基建战略,正在加速推进网络管理平台升级:为满足在线教育、协同创新及智慧校园的发展需求,为清华大学跻身世界一流大学创造基础条件,清华大学携手华为打造业内首个园区网络
    的头像 发表于 05-07 09:51 972次阅读

    2025年开放原子校源行清华大学站成功举办

    近日,由开放原子开源基金会、清华大学计算机科学与技术系、清华大学软件学院主办的开放原子“校源行”(清华站)在清华大学成功举办。
    的头像 发表于 04-22 16:46 1069次阅读