今(18)日,英伟达 GTC (GPU 技术大会) 2019在苏州隆重召开,英伟达创始人兼首席执行官黄仁勋依旧是穿着熟悉的皮衣跟大家见面。
会上,黄仁勋谈到,英伟达在加速计算领域深耕25年。随着摩尔定律的终结,GPU加速计算将成为未来的发展方向,这一点现在已得到公认。加速计算可将恰当的工具用于恰当的作业,这主要包括两种处理器,一个擅长顺序单线程处理,另一个擅长并行多线程处理。
“而英伟达可以实现这些加速,但前提是整个软件堆栈均已得到优化。优化之后,多GPU和多节点系统可以实现令人难以置信的性能。”黄仁勋说到。
据介绍,英伟达已经售出15亿块GPU,如今在使用的每块GPU都兼容CUDA。而英伟达CUDA平台具有丰富的库、工具和应用程序。仅在去年,英伟达就发布了500多个SDK和库,其中既有全新内容,也有更新版本。
黄仁勋说到,“我们精益求精,不断改进软件栈,由此提高了用户已有PU的性能深度学习训练在3年内提高4倍,深度学习推理在1年内提高2倍。”
此外,英伟达还专注于加速计算领域,致力于解决普通计算机无法解决的问题。
英伟达在图形、HPC和AI的交汇领域锐意创新。英伟达实时模拟各种环境、物理特性和智能。英伟达在垂直市场中将、深度专业知识、计算堆栈、算法和生态系统专业知识集于一体。
黄仁勋说到,“我们立足一个架构。借此,我们可以涉足多样化的市场,从游戏到汽车再到医疗健康。”
值得一提的是,英伟达今年为CUDA增加了两个新的主流应用——5G vRAN和基因组处理。
得益于它们,英伟达得到了各自行业全球领导者的支持,其中就包括电信行业的爱立信和基因组行业的华大基因。
此外,英伟达在AI方面同样有所布局。黄仁勋谈到,如今,从运输、医疗、金融到零售,各行各业都在争相利用AI的自动化能力。NVIDIA正在为以下每种应用场景分别打造一个平台:用于训练的DGX,用于超大规模云的Hx,用于边缘的EGX和用于自治系统的AGX。
最后,英伟达还发布了TENSORRT7。据介绍,TensorRT7支持各种类型的RNN,Transformer和CNN。此外,TRT7能够融合水平和垂直方向的运算,可以为开发者设计的大量RNN配置自动生成代码,逐点融合LSTM单元,甚至可跨多个时间步长进行融合。并且尽可能做自动低精度推理。
相比于TRT5只支持30种变换,TRT7能够支持1000多种不同的计算变换和优化。
可以这么说,TRT7是英伟达实现的最大飞跃。
-
AI
+关注
关注
87文章
30072浏览量
268338 -
英伟达
+关注
关注
22文章
3739浏览量
90790
发布评论请先 登录
相关推荐
评论