0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

首届时间检验应用科学奖公布,清华大学研究团队获奖

电子设计 来源:电子设计 作者:电子设计 2020-12-24 16:05 次阅读

ACM SIGKDD(ACM SIGKDD Conference on Knowledge Discovery and Data Mining,国际数据挖掘与知识发现大会,简称 KDD)是数据挖掘领域国际顶级学术会议,今年的 KDD 大会将于 8 月 23 日至 27 日在线上召开。

8 月 13 日, SIGKDD 2020 官方公布了 2020 年 ACM SIGKDD 创新奖、服务奖、论文奖、新星奖、时间检验研究奖、时间检验应用科学奖等六项大奖的获得者,这些奖项是针对数据科学、机器学习、大数据和计算机科学领域的杰出个人和研究团队而设立的。

值得一提的是,今年 KDD 颁发了首届时间检验应用科学奖(Test of Time Award for Applied Science)奖项,以表彰在数据科学的实际应用中具有影响力的研究。清华大学计算机科学与技术系唐杰、李涓子等人凭借他们在 2008 年发表的关于学术社交网络挖掘的研究成果获得了这一奖项。

获奖论文题目为 ArnetMiner: Extraction And Mining Of Academic Social Networks,论文作者包括清华大学计算机科学与技术系的唐杰、张静、姚利敏、李涓子,以及来自 IBM 中国研究实验室的张莉和苏中。

在这篇文章中,作者主要介绍了一个自主研发的面向研究者社会网络的挖掘搜索系统 ArnetMiner 的体系结构和关键技术。下面我们来将详细解读一下这篇文章。

研究背景

近些年,学术社交网络发展迅速,为众多研究学者提供了良好的交流平台,也产生了巨大的学术信息数据集。随着数据挖掘和人工智能技术的发展,针对学术社交网络进行数据挖掘和知识提取,进而为科学研究领域提供全方位的服务成为一大研究热点。

在作者开始这项研究之时,学术圈已有 DBLP、CiteSeer、Google Scholar 等学术搜索系统发布,但是往往存在以下两项不足之处:

1)缺乏语义信息。无论用户输入的个人资料或使用启发式方法提取的各类信息,语义存在不完整或不一致性,缺少有效获得大规模语义信息的方法;

2)缺乏异构对象的统一建模方法。以前,学术网络中不同类型的信息如学者、论文、会议期刊是单独建模的,因此无法准确捕捉它们之间的依赖关系。

为解决这两个问题,作者所在的研究团队开发了ArnetMiner系统。该系统旨在解决以下几个问题:

1)如何自动从互联网海量信息中提取研究人员的个人档案?

2)如何集成不同来源提取的学术相关信息(例如研究人员的个人档案和出版物)?

3)如何以统一的方法为不同类型的信息建模?

4)如何基于已构建的网络,提供强大的挖掘和搜索服务?

ArnetMiner系统(简称AMiner)

图1:AMiner系统框架图

图 1 给出了 AMiner 系统框架图,AMiner 系统自下而上主要包括五个部分:

1)研究者个人信息抽取(Extraction):即从网络上自动识别到研究者的个人主页,并训练一个统一的模型,从中抽取研究者的各种基本信息。同时,从不同来源的论文数据库抽取或收集作者所发表的论文信息;

2)个人信息融合(Integration):通过使用研究者姓名作为标识符,将提取的研究者的个人资料和提取的出版物信息进行整合。提出了马尔科夫随机场概率模型,以解决融合不同来源论文数据时面临的重名歧义问题;

3)存储和访问(Storage and Access):系统将集成的数据存储在研究者网络知识库(RNKB)中,利用MySQL作为存储数据库,并使用反向文件索引方法进行信息索引;

4)建模(Modeling):文章提出一个概率生成模型,通过对学术网络中的研究者、论文、会议等不同类型的信息进行综合分析,对每种信息进行主题分布估计;

5)搜索服务(Search Services):基于建模结果,提供多种搜索服务,包括专家搜索、关联关系搜索、论文推荐以及引用推荐等。

该系统重点解决三个技术难点:

1)学术网络中研究者个人信息自动抽取问题;

2)不同来源学术论文融合过程中的重名排歧问题;

3)学术网络中研究者、论文、会议等异质实体的统一建模问题。

审核编辑:符乾江
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 互联网
    +关注

    关注

    54

    文章

    11070

    浏览量

    102596
  • 计算机
    +关注

    关注

    19

    文章

    7352

    浏览量

    87628
收藏 人收藏

    评论

    相关推荐

    京微齐力受邀参加2024年清华大学工程博士论坛

    此前,2024年清华大学国家卓越工程师学院工程博士论坛在北京亦庄(北京经济技术开发区)举办。本届论坛以“清亦融创、新质引领”为主题,来自集成电路、生物医药、人工智能等战略性新兴领域500余位清华大学创新领军工程博士生参加。
    的头像 发表于 11-06 10:17 131次阅读

    英诺达与清华大学携手,共促国产EDA进步

    10月30日,英诺达官方微信发布消息称,英诺达与清华大学近期展开合作,共同深化产学研融合。此次合作聚焦于集成电路低功耗设计领域,英诺达团队走进清华大学集成电路学院,为师生们带来了专题授课及深入交流。
    的头像 发表于 10-31 14:15 265次阅读

    字节跳动与清华AIR成立联合研究中心

    近日,清华大学智能产业研究院(AIR)与字节跳动共同宣布成立“可扩展大模型智能技术联合研究中心”(SIA Lab),并在清华大学举行了隆重的成立仪式。
    的头像 发表于 10-12 15:24 306次阅读

    热烈欢迎清华大学电子工程系学子来武汉六博光电交流实践!

    近日,武汉六博光电技术有限责任公司接到清华大学函件,正式成为清华大学电子工程系武汉实践基地之一。2024年8月1日上午,清华大学电子工程系实践团队一行共计13名学子前往武汉六博光电有限
    的头像 发表于 08-02 08:37 451次阅读
    热烈欢迎<b class='flag-5'>清华大学</b>电子工程系学子来武汉六博光电交流实践!

    2023年度国家自然科学奖 | 热烈祝贺晟鹏创始人成会明院士

    6月24日,全国科技大会、国家科学技术奖励大会、两院院士大会在人民大会堂隆重举行。广东晟鹏材料技术有限公司(广东晟鹏科技有限公司)创始人成会明院士团队的项目“新型二维材料的创造、制备与物性研究”荣获
    的头像 发表于 06-30 08:10 590次阅读
    2023年度国家自然<b class='flag-5'>科学奖</b> | 热烈祝贺晟鹏创始人成会明院士

    国家最高科学技术揭晓,数个传感、仪器及半导体设备技术获奖

    ,特等奖3项,一等16项,二等120项。 国家最高科学技术授予2人——著名的摄影测量与遥感学家、武汉大学李德仁院士,凝聚态物理领域著名
    的头像 发表于 06-27 17:50 458次阅读
    国家最高<b class='flag-5'>科学</b>技术<b class='flag-5'>奖</b>揭晓,数个传感、仪器及半导体设备技术<b class='flag-5'>获奖</b>!

    易华录无锡数据湖与清华大学苏州汽车研究院(吴江)合作挖掘智能驾驶数据新价值

    6月15日,易华录无锡数据湖与清华大学苏州汽车研究院(吴江)数字工业中心就“聚焦汽车智能驾驶领域,共同挖掘智驾数据新价值”举行了签约仪式。清华大学苏州汽车研究院顾问、数字工业中心主任王
    的头像 发表于 06-18 15:00 852次阅读

    清华大学研发新型仿生三维电子皮肤系统

    在科技日新月异的今天,清华大学再次引领了科研的潮流。6月5日,从清华大学传来喜讯,该校航天航空学院与柔性电子技术实验室的张一慧教授团队,成功研制出了一款具有仿生三维架构的新型电子皮肤系统。这一突破性的科研成果不仅代表了电子皮肤领
    的头像 发表于 06-06 16:37 353次阅读

    清华大学创新领军工程博士团访问摩尔线程

    5月19日,“清华大学创新领军工程博士代表团走进摩尔线程”活动顺利举办。近五十位来自集成电路、能源、航天、通信等重要领域的清华大学工程博士参加了本次活动。
    的头像 发表于 05-20 15:28 354次阅读

    清华大学研发成功大规模干涉-衍射异构集成芯片——太极

    4月12日公布清华大学研发出太极芯片,实现了每瓦160TOPS的高性能通用智能计算,这是该校电子工程系与自动化系共同攻克的难题。
    的头像 发表于 04-12 15:50 393次阅读

    DEKRA Stan Zurkiewicz拜访清华大学苏州汽车研究院,探讨汽车行业安全发展

    3月12日,DEKRA德凯集团董事会主席兼首席执行官Stan Zurkiewicz先生一行拜访清华大学苏州汽车研究院,探讨汽车行业安全发展。
    的头像 发表于 03-13 16:46 986次阅读

    清华大学在电子鼻传感器仿生嗅闻方向取得新进展

    近日,清华大学机械系在电子鼻仿生嗅闻研究中取得新进展,相关研究成果以“Sniffing Like a Wine Taster: Multiple Overlapping Sniffs (MOSS
    的头像 发表于 02-20 10:57 888次阅读
    <b class='flag-5'>清华大学</b>在电子鼻传感器仿生嗅闻方向取得新进展

    清华大学成功研发无串扰量子网络节点

    量子网络依托量子力学原理,以其特有的储藏、处置及传播性质,成为了量子通信和巨型量子计算的关键支撑。清华大学科研团队通过巧妙地运用同种离子的双译码量子比特,从而在全球范围内首次成功建立了无需干扰的量子网络节点。
    的头像 发表于 01-24 14:19 559次阅读

    声扬科技荣获深圳人工智能“技术发明

    科技凭借反诈创新应用“FinVoice智能语音认证系统”,获颁深圳人工智能"技术发明",同时获“深圳人工智能”系列奖项的机构和企业包括清华大学、北京大学、哈尔滨
    的头像 发表于 12-13 17:00 960次阅读
    声扬科技荣获深圳人工智能“技术发明<b class='flag-5'>奖</b>”

    3D扫描仪|思看科技荣获浙江省科学技术进步奖和科技小巨人

    近日,浙江省创新深化大会在杭州举行,同期2022年度浙江省科学技术获奖名单公布,共有298项成果(项目)获省自然科学奖、技术发明
    的头像 发表于 11-28 16:25 491次阅读
    3D扫描仪|思看科技荣获浙江省<b class='flag-5'>科学技术进步奖</b>和科技小巨人<b class='flag-5'>奖</b>