0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

微软研究院出品《数据科学基础》,放眼未来40年

DPVg_AI_era 来源:lq 2019-05-25 10:31 次阅读

微软研究院出品《数据科学基础》,放眼未来40年,PDF下载已开放。

计算机科学作为一门科学始于20世纪60年代。计算机科学的重点是编程语言、编译器、操作系统以及为这些领域提供支撑的数学理论。理论计算机科学课程涵盖有限自动机、正则表达式、无语境式语言和可计算性等。

自上世纪70年代开始,算法研究逐渐成为理论计算机科学的重要组成部分。 算法研究的重要目的是提升计算机的有用性。到了今天,计算机科学的发展正在发生根本性的变化,研究人员注意力和研究重点更多地放在了应用上。

产生这一变化的原因有很多,其中计算和通信技术的融合在这个过程中发挥了重要作用。同时,在自然科学、商业和其他领域,收集和存储数据的能力不断上升,这对数据的理解以及如何在现代环境中进行数据处理提出了更高的要求。网络和社交网络作在日常生活中核心地位的提升,也为理论计算机科学理论的发展提供了新的机遇和挑战。

虽然计算机科学的传统领域仍然非常重要,但未来将有越来越多的研究人员将使用计算机来理解和提取应用程序中出现的大量数据中的可用信息。考虑到这一点,我们写了这本书,希望本书可以涵盖我们期望在未来40年内有用的理论,本书与过去同类数据的一个主要变化是之一对概率、统计和数值方法更加重视。

目录及各章内容简介

本书更早的版本已用于本科和研究生课程教学使用。本科课程所需的背景材料在附录部分给出。包括信息处理,搜索和机器学习等各领域中的现代数据通常以具有大量组件的向量方式表示。向量表示不仅仅是用于存储记录的许多字段的簿记设备。实际上,向量的两个显着方面:几何(长度,点积,正交等)和线性代数(相关性,秩,奇异值等)结果是相关的。

第2章和第3章分别奠定了几何和线性代数的基础。更具体地说,就是当涉及到高维度时,我们对二维或三维空间的直觉可能出乎意料地出现偏差。

第2章阐述了理解这类偏差所需的基础知识。本章以及整本书的重点是多关注知识和思想以及数学基础,而不是特定的应用。

第3章重点介绍奇异值分解(SVD),这是处理矩阵数据的核心工具。本章给出了SVD的数学和算法的原理描述。奇异值分解的应用包括主成分分析,这是目前已经广泛使用的技术,以及对概率密度、离散优化等与统计学结合后的现代应用,对这类应用的描述相对详细。使用确定性方法探索web或大型系统的配置空间之类的大规模结构的成本可能会非常高。随机游走(又称马尔可夫链)经常是效率更高的处理方式。这种游走的固定分布对网络搜索物理系统模拟等应用非常重要。

随机游走的基础数学理论以及与电气网络的连接是第4章的核心内容。计算机科学在过去二十年中的一个巨大进步是,一些过去只能用在特定领域的方法,现在已经可以成功解决来自多个不同领域的问题。机器学习就是一个突出的例子。

第5章描述了机器学习的基础,示例算法都可以用于优化给定的训练样例,并能够理解并预见到这种算法优化能够在新的未知数据上获得良好性能。这其中涉及一些重要的量度,如Vapnik-Chervonenkis维度,以及一些重要的算法,如感知器算法,随机梯度下降,强化学习和深度学习,以及重要的概念,如正则化和过拟合。算法领域传统上假设问题的输入数据会呈现在随机存取存储器中,算法可以重复访问。而对于涉及大量数据的问题,这种方式是不可行的。在这种情况下,采样起着至关重要的作用,而且必须进行动态采样。

第6章主要探讨如何有效地绘制高质量样本,以及如何使用这些样本估计统计和线性代数变量。尽管第5章内容侧重监督学习,但是从标记训练数据中学习,无监督学习或从未标记数据中学习的问题同样重要。无监督学习的中心问题之一是聚类,我们将在第7章中讨论。。

在讨论了一些基本聚类方法(如k-means算法)之后,第7章重点介绍理解这些算法的现代发展过程,以及用于分析不同类型聚类问题的新算法和通用框架。对大型架构(如网络和社交网络)的理解的核心,是构建出能够获取这些架构的基本属性的有效模型。最简单的模型是由Erd¨os和Renyi制定的随机图,我们在第8章进行详细介绍。

第9章重点介绍从数据中寻求合理性的一些线性代数问题,尤其是主题建模和非负矩阵分解。除了讨论众所周知的模型之外,本章还描述了一些关于模型和算法的当前研究动态。

第10章讨论了排名和社会选择以及压缩感知等关于稀疏表示问题。此外还简要讨论了线性规划和半定规划。

微波是用于在一系列应用中表示信号的重要方法,本书第11章讨论微波一些基本数学特性。附录中给出了一系列背景材料。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6565

    浏览量

    103947
  • 数据科学
    +关注

    关注

    0

    文章

    165

    浏览量

    10045

原文标题:微软研究院出品《数据科学基础》,放眼未来40年(PDF下载)

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    天马与武进南大未来技术创新研究院达成战略合作

    近日,天马新型显示技术研究院(厦门)有限公司、上海天马微电子有限公司与武进南大未来技术创新研究院就Micro LED业务、非显传感业务达成战略合作。
    的头像 发表于 11-14 11:53 237次阅读

    陈天桥雒芊芊脑科学研究院在人工智能领域取得重大突破

    陈天桥雒芊芊脑科学研究院(TCCI)的人工智能团队,凭借其在大脑与记忆领域的深厚造诣,于人工智能界取得了突破性进展。其自主研发的OMNE多智能体框架,在由Meta AI、Hugging Face
    的头像 发表于 11-01 11:11 413次阅读

    广东省智能科学与技术研究院选购我司一批热分析仪设备

    在科技日新月异的今天,每一次技术的革新都可能引领行业的新潮流。广东省智能科学与技术研究院,作为国内智能科技领域的领航者,始终站在科技创新的前沿。近日,研究院与和晟仪器达成合作,引进了我司
    的头像 发表于 09-13 09:54 192次阅读
    广东省智能<b class='flag-5'>科学</b>与技术<b class='flag-5'>研究院</b>选购我司一批热分析仪设备

    晶科能源产线测量系统获中国计量科学研究院认可

    2024上海SNEC展会期间,中国计量科学研究院向晶科能源颁发了光伏组件产线测量系统计量评价证书及“度量衡”授权证书,这也是首次。这意味着晶科能源成为业内首家获得光伏组件制造商产线测量系统计量评价的光伏企业。
    的头像 发表于 06-22 14:02 643次阅读

    长沙北斗研究院总部基地正式奠基

    长沙北斗研究院总部基地正式奠基 日前长沙北斗研究院总部基地正式奠基,项目由长沙北斗研究院牵头建设;项目又名“北斗足迹”。项目一期预计2025年年底前建成投用。 据悉,长沙北斗
    的头像 发表于 05-16 12:49 1151次阅读

    上海浦东软件园荣获SAP中国研究院“Bamboo Award”2023奖项

    20244月,SAP d-com China开发者大会成功举办。会上,SAP中国研究院创新生态2.0专家委员会(以下简称“专委会”)成员单位上海浦东软件园获得SAP中国研究院 “Bamboo Award” 2023奖项,
    的头像 发表于 05-10 10:20 407次阅读
    上海浦东软件园荣获SAP中国<b class='flag-5'>研究院</b>“Bamboo Award”2023奖项

    航天宏图与天仪研究院合作共同推动遥感卫星数据应用创新

    近日,航天宏图信息技术股份有限公司(以下简称“航天宏图”)与长沙天仪空间科技研究院有限公司(以下简称“天仪研究院”)正式签署战略合作框架协议。
    的头像 发表于 04-23 17:11 512次阅读
    航天宏图与天仪<b class='flag-5'>研究院</b>合作共同推动遥感卫星<b class='flag-5'>数据</b>应用创新

    本源入榜胡润研究院2024全球独角兽榜单!

    4月9日,胡润研究院于广州发布《2024全球独角兽榜》,榜单列出了全球成立于2000之后,价值10亿美元以上的非上市公司。本源量子成功入围该榜单,也是中国量子计算领域唯一入榜企业。来源:胡润研究院
    的头像 发表于 04-12 08:22 407次阅读
    本源入榜胡润<b class='flag-5'>研究院</b>2024全球独角兽榜单!

    浙江图灵算力研究院向知存科技颁发“年度最具影响力企业奖”

    近日,浙江图灵算力研究院生态伙伴联谊会在杭州举行,知存科技作为研究院生态企业之一,与赛迪研究院、中科计算所、自动化所和中国RISC-V联盟、国科大杭高院、西湖大学、中关村智用人工智能
    的头像 发表于 03-06 14:02 717次阅读

    广东腐蚀科学与技术创新研究院选购HS-DR-5导热系数测试仪

    广东腐蚀科学与技术创新研究院,作为国内腐蚀科学领域的研究机构,一直致力于为科研工作提供设备与技术支持。近期,该研究院在导热系数测试方面做出了
    的头像 发表于 01-12 14:04 256次阅读
    广东腐蚀<b class='flag-5'>科学</b>与技术创新<b class='flag-5'>研究院</b>选购HS-DR-5导热系数测试仪

    微软内部对亚洲研究院未来持有不同看法

    四位消息人士披露,微软内部曾考虑过关闭或搬迁MSRA,但高层领导普遍倾向于维持实验室在中国的运作。目前,微软已在加拿大温哥华设立MSR分中心,部分研究员已被调配至此。此举旨在作为备用安置点,以应对可能面临的
    的头像 发表于 01-11 13:58 533次阅读

    思看智能三维数字化扫描检测企业研究院被认定为省级企业研究院

    ,并于2022被浙江省科学技术厅认定为“省级企业研究院”。 思看科技一直以来在产学研合作上有着广泛且纵深的战略布局,通过搭建企业与高校、科研机构合作的桥梁,为企业孵化新的思想、技术和专业的人才培育平台。思看智能三维
    的头像 发表于 01-11 11:31 396次阅读
    思看智能三维数字化扫描检测企业<b class='flag-5'>研究院</b>被认定为省级企业<b class='flag-5'>研究院</b>!

    院士专家齐聚!京彩未来联合重点研究院创建数字空间联合实验室

    1月6日,京彩未来与北京大学数字中国研究院华南分院暨广东省数字广东研究院共同创建的“数字空间共同体联合室验室”正式挂牌运营。著名经济学家管清友博士、北京大学数字中国研究院华南分院暨广东
    的头像 发表于 01-08 18:15 334次阅读
    院士专家齐聚!京彩<b class='flag-5'>未来</b>联合重点<b class='flag-5'>研究院</b>创建数字空间联合实验室

    周礼栋对话比尔·盖茨:深入的科学研究比以往任何时候都更加重要

    特别策划了“智汇对话”系列内容,邀请全球各领域顶尖专家学者,与微软亚洲研究院院长周礼栋博士共同畅谈研究文化,探讨跨学科创新,展望技术未来。 2023
    的头像 发表于 12-12 15:55 339次阅读
    周礼栋对话比尔·盖茨:深入的<b class='flag-5'>科学研究</b>比以往任何时候都更加重要

    新华社研究院:商汤“商量”获评中国大模型市场未来领袖

    SenseChat ” 在定量实测的情商维度上,位居全部10款大模型第一 , 并在定性评估中入选大模型市场未来领袖象限 。此外,商汤赋能电力AI平台智能化升级的实践,也入围新华社研究院报告的“厂商最佳实践案例”。 新华社研究院
    的头像 发表于 11-29 18:30 478次阅读
    新华社<b class='flag-5'>研究院</b>:商汤“商量”获评中国大模型市场<b class='flag-5'>未来</b>领袖