0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

微软研究院出品《数据科学基础》,放眼未来40年

DPVg_AI_era 来源:lq 2019-05-25 10:31 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

微软研究院出品《数据科学基础》,放眼未来40年,PDF下载已开放。

计算机科学作为一门科学始于20世纪60年代。计算机科学的重点是编程语言、编译器、操作系统以及为这些领域提供支撑的数学理论。理论计算机科学课程涵盖有限自动机、正则表达式、无语境式语言和可计算性等。

自上世纪70年代开始,算法研究逐渐成为理论计算机科学的重要组成部分。 算法研究的重要目的是提升计算机的有用性。到了今天,计算机科学的发展正在发生根本性的变化,研究人员注意力和研究重点更多地放在了应用上。

产生这一变化的原因有很多,其中计算和通信技术的融合在这个过程中发挥了重要作用。同时,在自然科学、商业和其他领域,收集和存储数据的能力不断上升,这对数据的理解以及如何在现代环境中进行数据处理提出了更高的要求。网络和社交网络作在日常生活中核心地位的提升,也为理论计算机科学理论的发展提供了新的机遇和挑战。

虽然计算机科学的传统领域仍然非常重要,但未来将有越来越多的研究人员将使用计算机来理解和提取应用程序中出现的大量数据中的可用信息。考虑到这一点,我们写了这本书,希望本书可以涵盖我们期望在未来40年内有用的理论,本书与过去同类数据的一个主要变化是之一对概率、统计和数值方法更加重视。

目录及各章内容简介

本书更早的版本已用于本科和研究生课程教学使用。本科课程所需的背景材料在附录部分给出。包括信息处理,搜索和机器学习等各领域中的现代数据通常以具有大量组件的向量方式表示。向量表示不仅仅是用于存储记录的许多字段的簿记设备。实际上,向量的两个显着方面:几何(长度,点积,正交等)和线性代数(相关性,秩,奇异值等)结果是相关的。

第2章和第3章分别奠定了几何和线性代数的基础。更具体地说,就是当涉及到高维度时,我们对二维或三维空间的直觉可能出乎意料地出现偏差。

第2章阐述了理解这类偏差所需的基础知识。本章以及整本书的重点是多关注知识和思想以及数学基础,而不是特定的应用。

第3章重点介绍奇异值分解(SVD),这是处理矩阵数据的核心工具。本章给出了SVD的数学和算法的原理描述。奇异值分解的应用包括主成分分析,这是目前已经广泛使用的技术,以及对概率密度、离散优化等与统计学结合后的现代应用,对这类应用的描述相对详细。使用确定性方法探索web或大型系统的配置空间之类的大规模结构的成本可能会非常高。随机游走(又称马尔可夫链)经常是效率更高的处理方式。这种游走的固定分布对网络搜索物理系统模拟等应用非常重要。

随机游走的基础数学理论以及与电气网络的连接是第4章的核心内容。计算机科学在过去二十年中的一个巨大进步是,一些过去只能用在特定领域的方法,现在已经可以成功解决来自多个不同领域的问题。机器学习就是一个突出的例子。

第5章描述了机器学习的基础,示例算法都可以用于优化给定的训练样例,并能够理解并预见到这种算法优化能够在新的未知数据上获得良好性能。这其中涉及一些重要的量度,如Vapnik-Chervonenkis维度,以及一些重要的算法,如感知器算法,随机梯度下降,强化学习和深度学习,以及重要的概念,如正则化和过拟合。算法领域传统上假设问题的输入数据会呈现在随机存取存储器中,算法可以重复访问。而对于涉及大量数据的问题,这种方式是不可行的。在这种情况下,采样起着至关重要的作用,而且必须进行动态采样。

第6章主要探讨如何有效地绘制高质量样本,以及如何使用这些样本估计统计和线性代数变量。尽管第5章内容侧重监督学习,但是从标记训练数据中学习,无监督学习或从未标记数据中学习的问题同样重要。无监督学习的中心问题之一是聚类,我们将在第7章中讨论。。

在讨论了一些基本聚类方法(如k-means算法)之后,第7章重点介绍理解这些算法的现代发展过程,以及用于分析不同类型聚类问题的新算法和通用框架。对大型架构(如网络和社交网络)的理解的核心,是构建出能够获取这些架构的基本属性的有效模型。最简单的模型是由Erd¨os和Renyi制定的随机图,我们在第8章进行详细介绍。

第9章重点介绍从数据中寻求合理性的一些线性代数问题,尤其是主题建模和非负矩阵分解。除了讨论众所周知的模型之外,本章还描述了一些关于模型和算法的当前研究动态。

第10章讨论了排名和社会选择以及压缩感知等关于稀疏表示问题。此外还简要讨论了线性规划和半定规划。

微波是用于在一系列应用中表示信号的重要方法,本书第11章讨论微波一些基本数学特性。附录中给出了一系列背景材料。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6750

    浏览量

    108069
  • 数据科学
    +关注

    关注

    0

    文章

    168

    浏览量

    10826

原文标题:微软研究院出品《数据科学基础》,放眼未来40年(PDF下载)

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    上海高等研究院在阿秒X射线研究方面取得重要进展

    时间分辨率。近年来,自由电子激光技术持续发展,将X射线脉冲长度从飞秒量级推进至阿秒量级,拓展了超快X射线科学研究能力。 近日,中国科学院上海高等研究院联合德国电子同步加速器研究所,在阿
    的头像 发表于 03-27 08:06 87次阅读
    上海高等<b class='flag-5'>研究院</b>在阿秒X射线<b class='flag-5'>研究</b>方面取得重要进展

    MediaTek携手微软研究院联合开发有源光缆技术

    MediaTek、微软研究院以及其他供应商所组成的研发团队,成功设计出新一代由微型化 MicroLED 光源驱动的有源光缆(AOC)。这一革命性的有源 MicroLED 光缆设计,相较于现有技术能够
    的头像 发表于 03-19 14:20 267次阅读

    施耐德电气中国研究院首届研发大会成功举办

    日前,施耐德电气中国研究院首届研发大会(1st China Future Ready R&D Days)在位于上海张江科学城的中国研发中心成功举办。
    的头像 发表于 01-30 17:44 2528次阅读

    诚迈科技携手应急管理大学、中铁十九局共建智慧应急科技创新研究院

    科技董事长、智慧应急科技创新研究院名誉院长、首席科学家王继平等出席活动。赵峰华在致辞中对中铁十九局、诚迈科技给予学校的支持和信任表示感谢。他指出,研究院是大学成立
    的头像 发表于 01-27 11:51 679次阅读
    诚迈科技携手应急管理大学、中铁十九局共建智慧应急科技创新<b class='flag-5'>研究院</b>

    纤纳光电获得2025度浙江省企业研究院认定

    近日,浙江省经济和信息化厅发布2025度拟认定省企业研究院名单。经企业申报、县级审查、市级推荐、专家评审等程序,纤纳光电建设的“浙江省纤纳新能源钙钛矿技术企业研究院”成功入选。
    的头像 发表于 12-16 17:31 1416次阅读

    朗迅芯海半导体荣获2025度浙江省企业研究院认定

    近日,浙江省经济和信息化厅正式公布2025度省企业研究院认定名单,朗迅芯海半导体凭借在集成电路先进测试领域深厚的创新实力与技术积累,成功获批“浙江省企业研究院”认定。
    的头像 发表于 12-11 15:59 788次阅读

    广电计量与长沙三大研究院达成战略合作

    11月26-27日,广电计量与长沙北斗产业安全技术研究院集团股份有限公司(简称“长沙北斗研究院”)、长沙量子测量产业技术研究院有限公司(简称“长沙量子研究院”)、湖南大学长沙半导体技术
    的头像 发表于 12-04 14:36 627次阅读

    润和软件与中国科学院广州生物医药与健康研究院达成战略合作

    近日,江苏润和软件股份有限公司(以下简称“润和软件”)与中国科学院广州生物医药与健康研究院正式签署战略合作协议。双方强强联合,将聚焦人类细胞谱系大科学研究设施场景,在国产操作系统、智能物联、大
    的头像 发表于 11-18 17:06 1063次阅读
    润和软件与中国<b class='flag-5'>科学</b>院广州生物医药与健康<b class='flag-5'>研究院</b>达成战略合作

    广电计量携手南山研究院打造大健康产业新生态

    10月19日, “南山研究院南海四周系列活动”在广东省南山医药创新研究院(简称“南山研究院”)成功举办。期间,南山研究院与广电计量等多家单
    的头像 发表于 10-23 17:42 1257次阅读

    京东方首个材料研究院项目开工

    20258月20日,BOE(京东方)材料研究院项目开工仪式在山东省烟台市黄渤海新区八角片区成功举办。
    的头像 发表于 08-22 09:12 1432次阅读

    今日看点丨亚马逊上海AI研究院解散;索尼拟出售以色列芯片部门

          1、 亚马逊上海AI研究院解散! 据报道,AWS亚马逊云科技上海AI研究院的首席应用科学家王敏捷发朋友圈称,他们收到通知,AWS亚马逊云科技上海AI研究院(也是AWS最后一
    发表于 07-24 09:42 1449次阅读
    今日看点丨亚马逊上海AI<b class='flag-5'>研究院</b>解散;索尼拟出售以色列芯片部门

    合肥综合性国家科学中心能源研究院与宏微科技达成合作

    为深化产学研协同创新,推动科技创新和产业升级,近日,合肥综合性国家科学中心能源研究院与江苏宏微科技股份有限公司在智慧电力中心隆重举行“功率器件可靠性评测方法和寿命预测联合实验室”签约揭牌仪式。江苏宏
    的头像 发表于 06-14 14:22 1096次阅读

    导远科技与清华大学无锡应用技术研究院达成合作

    近日,导远科技与清华大学无锡应用技术研究院(以下简称:研究院)达成合作。导远科技将提供高精度定位产品及解决方案,以支持研究院在L4级自动驾驶和人形机器人领域的技术研发及转化落地。
    的头像 发表于 06-12 16:34 1190次阅读

    时钟系统推荐,时钟系统哪家好?赛思时钟系统助力中国气象科学研究院构建智慧气象网络

    时钟系统推荐,时钟系统哪家好?赛思时钟系统助力中国气象科学研究院构建智慧气象网络
    的头像 发表于 05-20 09:32 993次阅读
    时钟系统推荐,时钟系统哪家好?赛思时钟系统助力中国气象<b class='flag-5'>科学研究院</b>构建智慧气象网络

    国民技术与中国科学院深圳先进技术研究院达成战略合作

    近日,国民技术股份有限公司(简称“国民技术”)与中国科学院深圳先进技术研究院(简称“深圳先进”)电驱系统专家团队在深圳签署合作意向协议,双方将在国家重点研发项目支持下,就智能机器人及关节伺服驱
    的头像 发表于 04-25 15:45 1377次阅读