0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

“高举高打”挑战云端AI训练芯片

新思科技 来源:新思科技 2020-08-28 15:35 次阅读

-燧原科技-

“数据”这一人类自身创造的资源,在算力的开启下,已正式拉开人类对数字经济新模式的探索序章。以数据中心智能计算中心为代表的算力基础设施以及人工智能AI)产业,在“新基建”的助推下将迎来爆发式增长,而这两者的基础层硬件核心就是AI芯片

“高举高打”

挑战云端AI训练芯片

云端AI的实现包括两个环节:训练、推理。用于构建神经网络模型的训练芯片,首先需要使用大量数据进行训练操作,对模型进行训练(Training),整个过程可能耗时数天,通常需要通过大量的数据输入让芯片做海量繁复运算;利用训练好的模型响应实际请求,使用新的数据去“推断”(Inference)出各种结论。

▲ 图1:AI训练和推断的区别和联系。来源:腾讯云社区 云端训练芯片难度大、壁垒高、开发周期长,必须用到最新半导体工艺和高级封装技术,而且在配套软件上也需要很强的支持。同时芯片越大,整个设计难度也会呈指数级上升。单从芯片晶圆制造所用的掩膜(mask)层级来看,AI训练芯片与AI推理芯片的难度差异好比建一座70-80层大厦与建一栋20-30层楼房的区别。在过去5年中,国内新增的AI研发类初创公司数量多达上千家,其中云端推理百家争鸣,而针对云端训练做加速的初创芯片公司寥若晨星。 2019年12月11日燧原科技发布首款云端AI训练芯片——“邃思”,这款芯片不仅代表了国内同类最高性能,即使放眼全球最顶尖的产品,其算力依然旗鼓相当。“我们的两位创始人非常靠谱,都是真正能够做成事的人。”谈到自己与燧原科技的结缘,项目组合管理负责人(Portfolio Management Office,PMO)Tina表示,“两年前,AI训练芯片领域是一片蓝海,虽然挑战更大,但我很了解这个团队的技术实力和过往的工程实战经历,我相信我们有能力把握住这个市场机会,收到邀请后我就在公司创立的第三个月加入了燧原,和靠谱的人一起迎接挑战。” 作为一家新创公司,只用18个月打造云端AI训练芯片,除了燧原创业团队的多年技术积淀,首战告捷的另一个关键要素正是它对建立科学的工程化方法学的重视,而这一点是目前中国IC设计产业普遍缺乏,却是真正打造强“芯”的必由之路。

PMO:

让公司的每一个项目都成功

行军打仗,瞬息万变。想要在一场战役中取得胜利,方向正确,团队协同,步步为营是关键。一步一个脚印地打下一个个山头,最终带领整个团队取得胜利,助力公司在一个个关键项目取得成功是PMO的终极使命。

战略决策支持

使公司战略与项目执行形成信息双向反馈,帮助公司做出正确的决策,并确保公司的战略落实到项目,做到战略和执行的闭环。

端到端项目管理

PM对每个项目进行完整生命周期的管理,以纵观全局的角度,高效协同多个项目;以客户需求为导向,对项目做好风险把控,最终保证项目高效地执行并成功地交付。

最佳实践中心建立最佳实践与集训中心机制,保证燧原各项目之间的成功可复制、经验有传承。

▲图2:燧原科技的PMO闭环模型 PM是运筹帷幄的军师,在分析事实、问题折叠与拆解、资源配置的每一步路上,必须拥有全局观、对产品有完整的理解及敏锐的洞察力,一如Tina领导的PMO“军师联盟”始终在正确的道路上航行,与各环节团队并肩作战,完成一个个项目的攻坚。

在探索和创新的过程中

方法学就是工具

相比成熟的大芯片公司,全新的架构、团队及有限的资源,燧原的创芯之路也并不平静。回望一路经历的挑战,在项目执行的过程中保持团队的高度协调、保持效率,保证最终按时按质的完成交付,燧原已经熔炼出一套独门心法。 “大概在2018年11、12月前后,整个芯片的开发临近设计冻结的里程碑,理论上来讲这个时间点所有的设计、所有的IP应该都已经完成了开发,只需要进行最终一轮集成,就可以进入流片前的最后一轮物理实现阶段。这时出现了突发状况,一个非常关键模块的验证出现延迟,同时又产生了功能变更的新需求,一旦解决不好,不仅项目计划会延期,甚至流片后的产品质量也将难以保证。”当时的挑战还历历在目,Tina条理清晰的复盘了当时的举措:

Reset

重新梳理需求的优先级,快速锁定,把需求的串扰先解决掉;

Prioritize

把已经出现的所有问题再次梳理,在资源和时间有限的情况下抓大放小,先解决主要矛盾;

Reorganize

对资源进行了重新配置,把非关键路径上的资源调度到关键路径上来,优先解决重要的事情;

Plan

对整个项目下游的所有环节做详细的统筹规划,确保可以最大程度上把这个模块对于系统可能会出现的影响消解掉。

完善的方法学离不开EDA工具和平台的配套支持,“新思科技完整的工具链和成熟稳定的IP,帮助我们在架构设计前期就能验证架构思路,并且加快SoC的收敛;从软硬件迭代的角度,借助新思的VDK平台、ZeBu平台和技术支持,我们使软件开发测试工作提前了三个月以上,极大缩短后续硬件加速器或者FPGA平台上的软硬协同验证的时间。“在Tina看来,评估并聚合资源以保障项目进度与质量,对复杂的AI训练芯片能加速面世尤为关键。 燧原用18个月的时间,向行业展示了其过硬的研发实力,但作为一家云端AI芯片的初创公司来说,真正硬核的是燧原科技“靠谱” 的团队DNA,完整的工程化方法学加持高效专业的团队,每一个细节都在为成功加码。

迎接芯片PM大时代

今年3月,国家提出了加快新型基础设施建设(“新基建”)的战略目标,作为云端训练芯片的主战场,人工智能和数据中心均被列为重点发展方向。AI市场需求不断扩大,其需求的多样性也在增加,全新业务场景、业务模型、技术框架随之而来,推动芯片公司必须推出更加创新的架构和设计,以及始终不变的——更快、再快的市场需求响应速度。 面对这些挑战,需要整个上下游产业链共同发力——成熟创新的优秀人才、与时俱进的EDA工具、稳定可靠开放的IP核、先进的制造和封装技术、更好地协作方式和技术支持等,共同赋能芯片开发,达到缩短设计周期,实现更可控的、风险更低的开发过程。 从职业发展角度出发,Tina也谈到身为一位PM的自我修养:“PM需要一定的技术背景,因为在带领项目的过程中,需要和研发团队无缝交流;此外,对PM这个角色以及对集成电路这个行业来说,终身学习是我们所有人都需要拥抱的一个行业特质,终身学习的能力和个人愿望非常重要。当然还有一些像沟通能力、组织能力、逻辑思维能力等基本素质必须过关。” 在复杂度呈指数升级的后摩尔时代,正有这样一群默默奉献的人也开始成为创“芯“的中流砥柱,为IC开发项目的成功保驾护航。伴随国家和社会对人工智能和集成电路产业的重视加深,两大领域的前景一片欣欣向荣,然而关注度的爆发改变不了芯片开发周期长、投入大、风险高、复杂度高的事实。Tina展望道:“若想做好芯片,除了技术扎实之外,对于科学、完善的项目管理体系的重要性,我想业内越来越多有识之士也认识到了这一点。这背后也会对PM这个职业有一个正向的促进作用,我相信未来会有越来越多优秀的人才加入到PM这个岗位中来,一同推动集成电路行业的繁荣发展。”

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    452

    文章

    50179

    浏览量

    420683
  • 神经网络
    +关注

    关注

    42

    文章

    4733

    浏览量

    100410
  • AI
    AI
    +关注

    关注

    87

    文章

    29744

    浏览量

    268043

原文标题:燧人取火非常业,AI世界日日新

文章出处:【微信号:Synopsys_CN,微信公众号:新思科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    云端ai开发环境怎么样

    随着云计算技术的成熟与普及,云端AI开发环境应运而生,为AI开发者提供了一个高效、灵活、可扩展的开发与部署平台。下面,一起探讨云端ai开发环
    的头像 发表于 10-24 09:37 126次阅读

    AI大模型的训练数据来源分析

    AI大模型的训练数据来源广泛且多元化,这些数据源对于构建和优化AI模型至关重要。以下是对AI大模型训练数据来源的分析: 一、公开数据集 公开
    的头像 发表于 10-23 15:32 306次阅读

    如何训练自己的AI大模型

    训练自己的AI大模型是一个复杂且耗时的过程,涉及多个关键步骤。以下是一个详细的训练流程: 一、明确需求和目标 首先,需要明确自己的需求和目标。不同的任务和应用领域需要不同类型的AI模型
    的头像 发表于 10-23 15:07 328次阅读

    AI for Science:人工智能驱动科学创新》第二章AI for Science的技术支撑学习心得

    训练和推理提供了强大的算力支持,使得AI在科学研究中的应用更加广泛和深入。 3. 数据驱动的研究范式 第二章还强调了数据在AI for Science中的核心地位。数据是AI模型的输
    发表于 10-14 09:16

    特斯拉2025年末批量装备Dojo 2 AI训练芯片

    在近期举行的All-In Summit 2024活动上,特斯拉CEO埃隆·马斯克透露了公司AI技术发展的最新蓝图。他宣布,特斯拉下一代AI训练芯片——Dojo 2,预计将于2025年末
    的头像 发表于 09-12 17:39 528次阅读

    苹果承认使用谷歌芯片训练AI

    苹果公司最近在一篇技术论文中披露,其先进的人工智能系统Apple Intelligence背后的两个关键AI模型,是在谷歌设计的云端芯片上完成预训练的。这一消息标志着在尖端
    的头像 发表于 07-30 17:03 665次阅读

    苹果揭示AI新动向:Apple Intelligence模型在谷歌云端芯片上预训练

    苹果公司在最新的技术论文中披露了一项重要信息,其全新的人工智能系统Apple Intelligence所依赖的模型并非传统上大型科技公司首选的NVIDIA GPU,而是选择了在谷歌设计的云端芯片上进行预训练。这一决定不仅打破了行
    的头像 发表于 07-30 15:00 467次阅读

    AI训练的基本步骤

    AI(人工智能)训练是一个复杂且系统的过程,它涵盖了从数据收集到模型部署的多个关键步骤。以下是对AI训练过程的详细阐述,包括每个步骤的具体内容,并附有相关代码示例(以Python和sc
    的头像 发表于 07-17 16:57 1526次阅读

    AI大模型训练成本飙升,未来三年或达千亿美元

    Anthropic的首席执行官Dario Amodei在知名Podcast节目《In Good Company》中,就这一话题发表了深刻见解,揭示了AI大模型训练成本即将面临的巨大挑战
    的头像 发表于 07-11 15:06 464次阅读

    后摩智能引领AI芯片革命,推出边端大模型AI芯片M30

    在人工智能(AI)技术飞速发展的今天,AI大模型的部署需求正迅速从云端向端侧和边缘侧设备迁移。这一转变对AI芯片的性能、功耗和响应速度提出了
    的头像 发表于 06-28 15:13 608次阅读

    AI初出企业Cerebras已申请IPO!称发布的AI芯片比GPU更适合大模型训练

    美国加州,专注于研发比GPU更适用于训练AI模型的晶圆级芯片,为复杂的AI应用构建计算机系统,并与阿布扎比科技集团G42等机构合作构建超级计算机。基于其最新旗舰
    的头像 发表于 06-26 00:09 2855次阅读
    <b class='flag-5'>AI</b>初出企业Cerebras已申请IPO!称发布的<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>比GPU更适合大模型<b class='flag-5'>训练</b>

    AI芯片哪里买?

    AI芯片
    芯广场
    发布于 :2024年05月31日 16:58:19

    苹果将通过自研芯片云端推出AI功能

    近日,科技界传来一则令人振奋的消息。据可靠报道,苹果公司即将在云端推出强大的人工智能(AI)功能,而这一切将依托于自研的高端芯片
    的头像 发表于 05-11 10:59 513次阅读

    边缘侧AI芯片提供商超星未来完成数亿元 Pre-B轮融资

    AI产业生态中,计算芯片被视为行业的“卖水人”。依据云端/边缘端、训练/推理两大分类标准,AI芯片
    的头像 发表于 05-09 09:38 498次阅读

    谷歌发布Axion新款数据中心AI芯片,性能超越x86及云端

    谷歌预计将通过Google Cloud提供Axion AI芯片给客户。谷歌强调这款基于ARM的CPU产品具有优越的性能表现,甚至超越了传统的x86芯片云端通用ARM
    的头像 发表于 04-10 16:32 818次阅读