0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA深度学习加速数据科学教材套满足教学需求

星星科技指导员 来源:NVIDIAn 作者:Joe Bungo 2022-04-20 14:49 次阅读

NVIDIA 深度学习培训中心( DLI )发布了加速数据科学教材套,该研究所与佐治亚理工学院的 Polo Chau 教授和 Prairie View A & M 大学的董锡双教授共同开发。

综合教材涵盖数据收集和预处理、加速数据科学 RAPIDS、可扩展和分布式计算 GPU – 加速机器学习、数据可视化和图形分析等基础和高级主题,并满足了高等教育和研究机构对学生教授数据科学技能的日益增长的需求。

加速数据科学教学包包括以下重点模块:

数据科学与技术导论 RAPIDS

数据收集和预处理( ETL )

数据集中的数据伦理和偏见

数据集成和分析

数据可视化

使用 Hadoop 、 Hive 、 Spark 、 HBase 和 RAPIDS 的可扩展计算

基于 Dask 和 UCX 的可扩展计算

机器学习:分类

机器学习:聚类和降维

神经网络

图形分析

流数据

基因组学

文本分析

CPU vs GPU – 加速数据科学

数据科学团队、代码备份和版本控制

团队项目(假新闻检测

该工具包还涵盖了公平性和数据偏见等文化敏感话题,以及来自代表性不足群体的挑战和重要人物。

讲座幻灯片和讲稿、动手实验室、 Jupyter 笔记本、解决方案(以私人回购形式持有)、样本数据集、测验/考试问题/答案、 GPU 通过免费 AWS 云学分提供的计算资源,以及免费 DLI 在线课程/证书都包括在内。讲座视频计划在下一版本中发布。

RAPIDS 数据科学框架是 GPU 加速的库集合,用于在 GPU 上完全执行端到端数据科学管道。使用 RAPIDS 的主要目标是加速典型数据科学工作流的各个部分,从而加速数据准备和机器学习中完整的端到端工作流。

第一个基于 Jupyter 笔记本电脑的实验室之一让学生使用 pandas 和 cuDF 直接进入 RAPIDS 。 pandas 是一个建立在 Python 编程语言之上的数据分析和操作工具,用于执行各种任务(例如:加载、加入、聚合、, cuDF 是一个基于 RAPIDS 的 GPU 数据帧库,有助于通过 GPU 加速执行类似功能。

学生们首先要理解如何在 cuDF 中创建数据帧对象,为这些对象分配值,然后调用方法并对值应用用户定义的函数。一旦学生掌握了如何使用 cuDF 数据帧,他们的任务就是从 Kaggle 的Netflix 电影数据集中创建一个数据帧。

poYBAGJfrPGAKvyEAAE-Gy9Cf2I069.png

图 1 。教学包模块 1 的快照: RAPIDS 实验室简介。

从那里,学生们学习如何操作和查询数据,从删除缺失的列和值、查询和查找唯一值,到对数据进行排序、计数和分组。学生将感受到使用 RAPIDS 和 GPU 与教学包中也包含的传统方法相比是多么快速和简单。作为实验室的一项额外任务,最后要求学生使用 cuDF 一个热编码将数据集的电影和电视节目标题转换为 0 和 1 的向量,以提高分析数据的准确性。

周教授说:“数据科学揭示了数据在解决社会挑战和大规模复杂问题方面的巨大潜力,几乎涵盖了商业、技术、科学、工程、医疗保健、政府等各个领域。”随着数据在数量、速度和复杂性方面的不断增长,对数据科学人才和技能的需求不断增加,以帮助设计最佳解决方案。”

关于作者

Joe Bungo 是 NVIDIA 的深度学习培训中心( DLI )项目经理,在那里他能够在大学中使用深度学习和 GPU 加速计算技术,包括课程和教材开发、 DLI 大学大使/讲师认证、促进学术生态系统和实践研讨会。此前,他在 ARM 公司管理大学项目,并担任应用工程师。乔获得了得克萨斯大学奥斯汀分校计算机科学学位。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4952

    浏览量

    102861
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4709

    浏览量

    128781
  • 深度学习
    +关注

    关注

    73

    文章

    5495

    浏览量

    121042
收藏 人收藏

    评论

    相关推荐

    NPU在深度学习中的应用

    设计的硬件加速器,它在深度学习中的应用日益广泛。 1. NPU的基本概念 NPU是一种专门针对深度学习算法优化的处理器,它与传统的CPU和G
    的头像 发表于 11-14 15:17 368次阅读

    pcie在深度学习中的应用

    深度学习模型通常需要大量的数据和强大的计算能力来训练。传统的CPU计算资源有限,难以满足深度学习
    的头像 发表于 11-13 10:39 326次阅读

    Pytorch深度学习训练的方法

    掌握这 17 种方法,用最省力的方式,加速你的 Pytorch 深度学习训练。
    的头像 发表于 10-28 14:05 160次阅读
    Pytorch<b class='flag-5'>深度</b><b class='flag-5'>学习</b>训练的方法

    GPU深度学习应用案例

    GPU在深度学习中的应用广泛且重要,以下是一些GPU深度学习应用案例: 一、图像识别 图像识别是深度学习
    的头像 发表于 10-27 11:13 346次阅读

    FPGA加速深度学习模型的案例

    FPGA(现场可编程门阵列)加速深度学习模型是当前硬件加速领域的一个热门研究方向。以下是一些FPGA加速
    的头像 发表于 10-25 09:22 168次阅读

    深度学习GPU加速效果如何

    图形处理器(GPU)凭借其强大的并行计算能力,成为加速深度学习任务的理想选择。
    的头像 发表于 10-17 10:07 168次阅读

    《AI for Science:人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

    人工智能:科学研究的加速器 第一章清晰地阐述了人工智能作为科学研究工具的强大功能。通过机器学习深度
    发表于 10-14 09:12

    FPGA做深度学习能走多远?

    并行计算的能力,可以在硬件层面并行处理大量数据。这种并行处理能力使得 FPGA 在执行深度学习算法时速度远超传统处理器,能够提供更低的延迟和更高的吞吐量,从而加速模型训练和推理过程,
    发表于 09-27 20:53

    NVIDIA推出全新深度学习框架fVDB

    在 SIGGRAPH 上推出的全新深度学习框架可用于打造自动驾驶汽车、气候科学和智慧城市的 AI 就绪型虚拟表示。
    的头像 发表于 08-01 14:31 545次阅读

    NVIDIA提供一服务、模型以及计算平台 加速人形机器人发展

    开发者可以访问新的 NVIDIA NIM 微服务,用于 Isaac Lab 和 Isaac Sim 中的机器人仿真、OSMO 机器人云计算编排服务和远程操作数据捕获工作流等。 为加速全球人形机器人
    的头像 发表于 07-31 10:41 628次阅读

    深度学习与nlp的区别在哪

    深度学习和自然语言处理(NLP)是计算机科学领域中两个非常重要的研究方向。它们之间既有联系,也有区别。本文将介绍深度学习与NLP的区别。
    的头像 发表于 07-05 09:47 835次阅读

    助力科学发展,NVIDIA AI加速HPC研究

    科学家和研究人员正在利用 NVIDIA 技术将生成式 AI 应用于代码生成、天气预报、遗传学和材料科学领域的 HPC 工作。
    的头像 发表于 05-14 09:17 392次阅读
    助力<b class='flag-5'>科学</b>发展,<b class='flag-5'>NVIDIA</b> AI<b class='flag-5'>加速</b>HPC研究

    NVIDIA加速识因智能AI大模型落地应用方面的重要作用介绍

    本案例介绍了 NVIDIA加速识因智能 AI 大模型落地应用方面的重要作用。生成式大模型已广泛应用于各领域,通过学习人类思维方式,能快速挖掘海量内容,满足不同
    的头像 发表于 03-29 15:28 598次阅读

    使用NVIDIA Triton推理服务器来加速AI预测

    这家云计算巨头的计算机视觉和数据科学服务使用 NVIDIA Triton 推理服务器来加速 AI 预测。
    的头像 发表于 02-29 14:04 548次阅读

    NVIDIA首席科学家Bill Dally:深度学习硬件趋势

    Bill Dally于2009年1月加入NVIDIA担任首席科学家,此前在斯坦福大学任职12年,担任计算机科学系主任。Dally及其斯坦福团队开发了系统架构、网络架构、信号传输、路由和同步技术,在今天的大多数大型并行计算机中都可
    的头像 发表于 02-25 16:16 1082次阅读
    <b class='flag-5'>NVIDIA</b>首席<b class='flag-5'>科学</b>家Bill Dally:<b class='flag-5'>深度</b><b class='flag-5'>学习</b>硬件趋势