NVIDIA深度学习加速数据科学教材套满足教学需求-电子发烧友网

NVIDIA 深度学习培训中心（ DLI ）发布了加速数据科学教材套，该研究所与佐治亚理工学院的 Polo Chau 教授和 Prairie View A & M 大学的董锡双教授共同开发。

综合教材涵盖数据收集和预处理、加速数据科学 RAPIDS、可扩展和分布式计算 GPU – 加速机器学习、数据可视化和图形分析等基础和高级主题，并满足了高等教育和研究机构对学生教授数据科学技能的日益增长的需求。

加速数据科学教学包包括以下重点模块：

数据科学与技术导论 RAPIDS

数据收集和预处理（ ETL ）

数据集中的数据伦理和偏见

数据集成和分析

数据可视化

使用 Hadoop 、 Hive 、 Spark 、 HBase 和 RAPIDS 的可扩展计算

基于 Dask 和 UCX 的可扩展计算

机器学习：分类

机器学习：聚类和降维

神经网络

图形分析

流数据

基因组学

文本分析

CPU vs GPU – 加速数据科学

数据科学团队、代码备份和版本控制

团队项目（假新闻检测）

该工具包还涵盖了公平性和数据偏见等文化敏感话题，以及来自代表性不足群体的挑战和重要人物。

讲座幻灯片和讲稿、动手实验室、 Jupyter 笔记本、解决方案（以私人回购形式持有）、样本数据集、测验/考试问题/答案、 GPU 通过免费 AWS 云学分提供的计算资源，以及免费 DLI 在线课程/证书都包括在内。讲座视频计划在下一版本中发布。

RAPIDS 数据科学框架是 GPU 加速的库集合，用于在 GPU 上完全执行端到端数据科学管道。使用 RAPIDS 的主要目标是加速典型数据科学工作流的各个部分，从而加速数据准备和机器学习中完整的端到端工作流。

第一个基于 Jupyter 笔记本电脑的实验室之一让学生使用 pandas 和 cuDF 直接进入 RAPIDS 。 pandas 是一个建立在 Python 编程语言之上的数据分析和操作工具，用于执行各种任务（例如：加载、加入、聚合、， cuDF 是一个基于 RAPIDS 的 GPU 数据帧库，有助于通过 GPU 加速执行类似功能。

学生们首先要理解如何在 cuDF 中创建数据帧对象，为这些对象分配值，然后调用方法并对值应用用户定义的函数。一旦学生掌握了如何使用 cuDF 数据帧，他们的任务就是从 Kaggle 的Netflix 电影数据集中创建一个数据帧。

图 1 。教学包模块 1 的快照： RAPIDS 实验室简介。

从那里，学生们学习如何操作和查询数据，从删除缺失的列和值、查询和查找唯一值，到对数据进行排序、计数和分组。学生将感受到使用 RAPIDS 和 GPU 与教学包中也包含的传统方法相比是多么快速和简单。作为实验室的一项额外任务，最后要求学生使用 cuDF 一个热编码将数据集的电影和电视节目标题转换为 0 和 1 的向量，以提高分析数据的准确性。

周教授说：“数据科学揭示了数据在解决社会挑战和大规模复杂问题方面的巨大潜力，几乎涵盖了商业、技术、科学、工程、医疗保健、政府等各个领域。”随着数据在数量、速度和复杂性方面的不断增长，对数据科学人才和技能的需求不断增加，以帮助设计最佳解决方案。”

关于作者

Joe Bungo 是 NVIDIA 的深度学习培训中心（ DLI ）项目经理，在那里他能够在大学中使用深度学习和 GPU 加速计算技术，包括课程和教材开发、 DLI 大学大使/讲师认证、促进学术生态系统和实践研讨会。此前，他在 ARM 公司管理大学项目，并担任应用工程师。乔获得了得克萨斯大学奥斯汀分校计算机科学学位。

审核编辑：郭婷

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

NVIDIA

NVIDIA

+关注

关注
14

文章
4952

浏览量
102861
gpu

gpu

+关注

关注
28

文章
4709

浏览量
128781
深度学习

深度学习

+关注

关注
73

文章
5495

浏览量
121042

NPU在深度学习中的应用

设计的硬件加速器，它在深度学习中的应用日益广泛。 1. NPU的基本概念 NPU是一种专门针对深度学习算法优化的处理器，它与传统的CPU和G

发表于 11-14 15:17 •368次阅读

pcie在深度学习中的应用

深度学习模型通常需要大量的数据和强大的计算能力来训练。传统的CPU计算资源有限，难以满足深度学习

发表于 11-13 10:39 •326次阅读

Pytorch深度学习训练的方法

掌握这 17 种方法，用最省力的方式，加速你的 Pytorch 深度学习训练。

发表于 10-28 14:05 •160次阅读

Pytorch<b class='flag-5'>深度</b><b class='flag-5'>学习</b>训练的方法

GPU深度学习应用案例

GPU在深度学习中的应用广泛且重要，以下是一些GPU深度学习应用案例：一、图像识别图像识别是深度学习

发表于 10-27 11:13 •346次阅读

FPGA加速深度学习模型的案例

FPGA（现场可编程门阵列）加速深度学习模型是当前硬件加速领域的一个热门研究方向。以下是一些FPGA加速

发表于 10-25 09:22 •168次阅读

深度学习GPU加速效果如何

图形处理器（GPU）凭借其强大的并行计算能力，成为加速深度学习任务的理想选择。

发表于 10-17 10:07 •168次阅读

《AI for Science：人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

人工智能：科学研究的加速器第一章清晰地阐述了人工智能作为科学研究工具的强大功能。通过机器学习、深度学

发表于 10-14 09:12

FPGA做深度学习能走多远？

并行计算的能力，可以在硬件层面并行处理大量数据。这种并行处理能力使得 FPGA 在执行深度学习算法时速度远超传统处理器，能够提供更低的延迟和更高的吞吐量，从而加速模型训练和推理过程，

发表于 09-27 20:53

NVIDIA推出全新深度学习框架fVDB

在 SIGGRAPH 上推出的全新深度学习框架可用于打造自动驾驶汽车、气候科学和智慧城市的 AI 就绪型虚拟表示。

发表于 08-01 14:31 •545次阅读

NVIDIA提供一套服务、模型以及计算平台加速人形机器人发展

开发者可以访问新的 NVIDIA NIM 微服务，用于 Isaac Lab 和 Isaac Sim 中的机器人仿真、OSMO 机器人云计算编排服务和远程操作数据捕获工作流等。为加速全球人形机器人

发表于 07-31 10:41 •628次阅读

深度学习与nlp的区别在哪

深度学习和自然语言处理（NLP）是计算机科学领域中两个非常重要的研究方向。它们之间既有联系，也有区别。本文将介绍深度学习与NLP的区别。

发表于 07-05 09:47 •835次阅读

助力科学发展，NVIDIA AI加速HPC研究

科学家和研究人员正在利用 NVIDIA 技术将生成式 AI 应用于代码生成、天气预报、遗传学和材料科学领域的 HPC 工作。

发表于 05-14 09:17 •392次阅读

NVIDIA在加速识因智能AI大模型落地应用方面的重要作用介绍

本案例介绍了 NVIDIA 在加速识因智能 AI 大模型落地应用方面的重要作用。生成式大模型已广泛应用于各领域，通过学习人类思维方式，能快速挖掘海量内容，满足不同

发表于 03-29 15:28 •598次阅读

使用NVIDIA Triton推理服务器来加速AI预测

这家云计算巨头的计算机视觉和数据科学服务使用 NVIDIA Triton 推理服务器来加速 AI 预测。

发表于 02-29 14:04 •548次阅读

NVIDIA首席科学家Bill Dally：深度学习硬件趋势

Bill Dally于2009年1月加入NVIDIA担任首席科学家，此前在斯坦福大学任职12年，担任计算机科学系主任。Dally及其斯坦福团队开发了系统架构、网络架构、信号传输、路由和同步技术，在今天的大多数大型并行计算机中都可

发表于 02-25 16:16 •1082次阅读

搜索历史

NVIDIA深度学习加速数据科学教材套满足教学需求

评论

NPU在深度学习中的应用

pcie在深度学习中的应用

Pytorch深度学习训练的方法

GPU深度学习应用案例

FPGA加速深度学习模型的案例

深度学习GPU加速效果如何

《AI for Science：人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

FPGA做深度学习能走多远？

NVIDIA推出全新深度学习框架fVDB

NVIDIA提供一套服务、模型以及计算平台加速人形机器人发展

深度学习与nlp的区别在哪

助力科学发展，NVIDIA AI加速HPC研究

NVIDIA在加速识因智能AI大模型落地应用方面的重要作用介绍

使用NVIDIA Triton推理服务器来加速AI预测

NVIDIA首席科学家Bill Dally：深度学习硬件趋势