0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

菲数科技以“FPGA+云”助力高性能计算

DIri_ALIFPGA 来源:未知 作者:胡薇 2018-07-10 16:56 次阅读

CPU到CPU+,从+GPU到+FPGA

随着通用处理器(CPU)的摩尔定律已入暮年,从美国的微软、亚马逊到中国的BAT、华为,几乎所有的互联网巨头们都在补充他们的标准服务器芯片——CPU,使用可替代的硅来追赶在人工智能领域的急速变化。2012年,微软开始将支撑了通讯行业二十年高速发展的可编程芯片,即FPGA用在其搜索业务——Bings上,且公布FPGA相比于CPU在处理Bing的自定义算法时快出40倍,整个系统比Bing现有的系统快出两倍,因此其可以将当前已经投入使用的服务器数量减少一半。甚至在接下来的几年里,几乎任何一个新的微软服务都会包含一个FPGA。

那么这个所谓的可编程芯片到底是什么?据菲数科技创始人兼CEO王文华介绍,2017年是全球超大规模数据中心的“爆发年”,全年新增超大规模数据中心90余个,总数量超过390个。且2018年也没有丝毫放缓的迹象。如此海量数据需要计算机高速计算各种矩阵运算、图像处理、机器学习、压缩、非对称加密、搜索排序等。即数据中心优先于人工智能发展,这一点也得到了目前在FPGA领域一枝独秀的赛灵思的支持。今年3月,其新上任的CEO Victor Peng在采访中表示,赛灵思已经把数据中心优先放在其三大战略重点的首位。

而传统计算机中无论是CPU,还是作为协处理器的GPU,都属于冯•诺依曼结构,即指令译码执行、共享内存。但由于指令流的控制逻辑复杂,不可能有太多条独立的指令流。为每一个新问题开发专用的芯片又成本过高,因此,这对硬件算力的性能存在着极大的挑战。

在以通用处理器计算和特定目的的协处理器计算混合异构工作中,作为有着更加高效的数据处理能力和基础架构的FPGA,则延续了以“CPU+GPU”的第一代异构计算,形成了“CPU+FPGA”的第二代异构计算。其逻辑是在每一个服务器与基础网络连接的地方部署可编程芯片,在数据到达服务器之前提前一步处理它们。

FPGA+云VS FPGA+端,C端市场VS数据中心

自成立起便定位于异构计算领域的菲数科技,也是国内最早一批专注于云端异构加速、高性能计算的创业公司,其CEO王文华表示,看好FPGA在异构领域的发展主要是基于以下几个原因。

首先,FPGA之所以比 CPU甚至 GPU能效高,本质上是无指令、无需共享内存的体系结构带来的福利。其每个逻辑单元的功能在重编程时就已经确定,不需要指令;其次,对比GPU几乎只有的数据并行,FPGA则同时拥有流水线并行和数据并行,可以根据处理数据包的步骤搭建出不同流水线,在GPU的计算单元都按照统一步调做相同事情时,FPGA早就已经分散的处理完了;而即使是吞吐量、延迟和功耗三方面都可一战的ASIC专用芯片,FPGA也因其可以快速更新逻辑、可编程的万能部署、保持不同服务器不同加速卡的同构性等优势,解决了前者研发成本高、周期长等问题,在瞬息万变的人工智能领域减少了投资风险。

比起目前业内为数不多叫得上名字的创企,如深鉴、地平线等将FPGA的业务应用在端,即偏向C端的市场化,菲数科技的业务重心则在是FPGA+云,专注于数据中心的异构加速解决方案,产品形态包括硬件加速板卡和FPGA加速IP。除了以单个产品切入数据中心的大型B端企业外,菲数已经形成了从硬件板卡,FPGA IP方案到用户API的完整产品方案

对此,王文华解释到,C端市场与数据中心是完全不同的市场,虽然都采用FPGA进行加速,数据中心更多的是关注性能,而C端更多的是关注功耗和成本。因此,FPGA在广阔的C端市场面临着众多ASIC解决方案的激烈竞争,而在数据中心则具有独特的优势。

首先,FPGA丰富的互联接口既适应于数据中心多样性的业务,也适应于新硬件的引入,如ssd硬盘或是HBM内存等等,具有良好的拓展性;同时它的可重构性,也使得它可以在相同的硬件上实现不同的加速功能。这让其很好的避免了因业务方向发生变化而被淘汰的情况,减少硬件投资试错成本;其次,FPGA不需要指令,稳定而又极低的延迟,也适用于流式的计算密集型任务和通信密集型任务;再次,CPU+FPGA的异构模式,既可以保持数据中心的硬件同构性,同时又具有实现软件定义的能力。

当然,随着人工智能在端上的下沉应用,对端的计算性能要求也会逐渐向云端的性能靠齐,因而FPGA在复杂的端设备的应用上(譬如辅助驾驶、机器人、智能摄像头等等)也会逐步推广。

芯片国产化进程步履维艰?新兴创企征战蓝海市场

事实上,在与通讯基础网络的连接上,由于FPGA天然的通讯基因,更是明显优于其它竞争对手。这种架构上的优势使其定位并不是某种硬件的替代品,甚至将带来整个行业的革命。

而此前Grand View Research的分析,2015年全球FPGA总市场规模达 63.6亿美元,预计到2024年将达到142亿美元。目前全球玩家都屈指可数的赛道无疑是个新蓝海。且由于技术驱动发展,根据此前巨头的布局时间和周期,以及菲数即将推出的新产品,目前处于培育期的FPGA异构加速市场极有可能在2019年年初迎来爆发性增长。

除了对市场方向的坚定,还有自身的专业。菲数科技的核心创始团队全部来自FPGA领域巨头企业资深人员。创始人兼董事长徐卫根,浙江大学MBA,原UTStarcom研发副总裁,20年+管理及运营经验;创始人兼CEO王文华,浙江大学硕士,15年+研发管理经验;技术团队接近二十人,分别来自美国中国名校、多有UT、华为、诺西等公司多年相关研发经验。

作为国内最早一批专注于云端异构加速,高性能计算的创业公司之一,菲数科技在成立之初即与IBM展开合作,2016年成为OpenPOWER成员;2017年10月成为阿里云异构计算生态共建的合作伙伴之一;其加速板卡的规格,功能以及完善的技术支持已经获得市场的认可,成为目前的主流产品。

未来在推出人工智能加速平台1.0后,将会进一步的实现FPGA异构加速的虚拟化和云化,进一步深耕数据中心异构加速蓝海市场。

中国本土综合实力最强大的大型IT企业之一,同时也是菲数科技的合作伙伴的浪潮集团,其高效能服务器和存储技术国家重点实验室陈继承博士表示,此前GPU赶上了计算数据结构大量调整的好时代,而用硬件适配软件、且每种软件都是最优适配方式的FPGA也显然是下一个爆发点。在目前还未系统建立生态、相对空白的市场中,如何将成千上万FPGA资源池化实现统一部署、动态重构和如何将单个FPGA虚拟化,实现细粒度资源优化利用进而实现FPGA异构计算的真正落地,是创业公司的重大机遇和挑战。

另外,浪潮科技作为该领域老牌巨头,陈继承也见证了FPGA在云计算领域的发展,关于对菲数团队的看好,其解释到,在芯片国产化进程的今天,创业公司不仅限制较少、也更为热情,且对比美国科技产业化,方向对、热情够的新兴创企,成果能更快的被市场认可。

2017年3月,菲数科技曾获得由中科创星领投的千万级天使轮融资,目前正在进行1500万—2500万的A轮融资,主要用于人员扩充、产品量产、技术研发、业务开拓等。值得一提的是,此前菲数科技已申请4项中国发明专利,一项美国发明专利。尽管赛道因为市场红利期未到使这个高壁垒的行业玩家多专注在技术上,但从各家创企在知识产权的结果来看似乎并没有太垂直的成就。这也让菲数科技深耕在技术领域的专利更具价值。

万物互联的时代,数据中心的云化是未来的趋势。独立的、单机模式的异构加速必然要被以FPGA为主体的池化模式所替代。随着FPGA在数据中心方向的逐步发力,以及相关生态的逐步改善,FPGA成为数据中心的主流硬件平台,则是一个正在逐步变成现实的趋势。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1629

    文章

    21754

    浏览量

    604232
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10878

    浏览量

    212166

原文标题:菲数科技布局半导体新贵FPGA,加速分布式计算

文章出处:【微信号:ALIFPGA,微信公众号:FPGA极客空间】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    鸿蒙原生页面高性能解决方案上线OpenHarmony社区 助力打造高性能原生应用

    随着HarmonyOS NEXT的正式推出,鸿蒙原生应用开发热度高涨,数量激增。但在三方应用鸿蒙化进程中,性能问题频出。为此,HarmonyOS NEXT推出了一整套原生页面高性能解决方案,包括
    发表于 01-02 18:00

    AI高性能计算平台是什么

    AI高性能计算平台不仅是AI技术发展的基石,更是推动AI应用落地、加速产业升级的重要工具。以下,是对AI高性能计算平台的介绍,由AI部落小编为您整理分享。
    的头像 发表于 11-11 09:56 218次阅读

    FPGA计算方法

    我们在比较FPGA的芯片参数时经常说某一款FPGA是多少万门的,也有的说其有多少个LE,那么二者之间有何关系呢? FPGA等效门计算
    的头像 发表于 11-11 09:45 316次阅读
    <b class='flag-5'>FPGA</b>门<b class='flag-5'>数</b>的<b class='flag-5'>计算</b>方法

    高性能服务器有什么用处?

    高性能服务器是一种基于计算技术的虚拟化服务器,具有高性能、灵活性、可靠性和安全性等特点。它广泛应用于网络托管服务、数据备份与恢复、大数据
    的头像 发表于 11-04 10:22 220次阅读

    计算hpc的主要功能是什么

    计算HPC(High-Performance Computing)是指利用计算技术来实现高性能计算
    的头像 发表于 10-22 10:20 224次阅读

    计算厂家使用WDS分布式存储构建其高性能超融合一体机

    计算厂家使用WDS分布式存储构建其高性能超融合一体机
    的头像 发表于 09-23 09:57 266次阅读
    <b class='flag-5'>云</b><b class='flag-5'>计算</b>厂家使用WDS分布式存储构建其<b class='flag-5'>高性能</b>超融合一体机

    基于科技FA728Q加速卡实现低时延LLT应用

    科技使用Stratix 10 FPGA和开源的开放式FPGA堆栈(OFS)基础设施开发高性能FPGA
    的头像 发表于 08-30 17:13 538次阅读
    基于<b class='flag-5'>菲</b><b class='flag-5'>数</b>科技FA728Q加速卡实现低时延LLT应用

    如何理解计算

    和维护这些数据。 **在线视频和流媒体:**计算提供高性能的存储和计算资源,用于存储和传输大量的音视频数据,并支持高质量的流媒体服务。用户可以通过
    发表于 08-16 17:02

    中科驭“驭”解决方案入选2024中国生态典型应用案例

    2024年7月4日,在全球数字经济大会“中国生态”为主题的融技术创新引领论坛上,中科驭凭借其卓越的创新能力和深厚的技术积累,其“驭
    的头像 发表于 08-02 11:30 745次阅读
    中科驭<b class='flag-5'>数</b>“驭<b class='flag-5'>云</b>”解决方案入选2024中国<b class='flag-5'>云</b>生态典型应用案例

    线上研讨会:FPGA+金融丨硬件行情加速系统 打造极速交易场景

    线上研讨会:FPGA+金融丨硬件行情加速系统 打造极速交易场景
    的头像 发表于 06-12 18:16 386次阅读
    线上研讨会:<b class='flag-5'>FPGA+</b>金融丨硬件行情加速系统 打造极速交易场景

    英特尔助力京东用CPU加速AI推理,大模型构建智化供应链

    英特尔助力京东用CPU加速AI推理,大模型构建智化供应链
    的头像 发表于 05-27 11:50 556次阅读
    英特尔<b class='flag-5'>助力</b>京东<b class='flag-5'>云</b>用CPU加速AI推理,<b class='flag-5'>以</b>大模型构建<b class='flag-5'>数</b>智化供应链

    高性能计算集群的能耗优化

    高性能计算(HighPerformanceComputing,HPC)是指利用大规模并行计算机集群来解决复杂的科学和工程问题的技术。高性能计算
    的头像 发表于 05-25 08:27 453次阅读
    <b class='flag-5'>高性能</b><b class='flag-5'>计算</b>集群的能耗优化

    深度践行“IaaS on DPU”理念,中科驭正式发布“驭高性能异构算力解决方案!

    ®高性能异构算力解决方案,为企业提供更快部署、更强性能和更高吞吐的算力解决方案。 在发布环节,张宇表示:“驭®
    的头像 发表于 05-14 17:04 522次阅读
    深度践行“IaaS on DPU”理念,中科驭<b class='flag-5'>数</b>正式发布“驭<b class='flag-5'>云</b>”<b class='flag-5'>高性能</b><b class='flag-5'>云</b>异构算力解决方案!

    构建高性能计算芯片

    计算的异构多核架构,对整个芯片行业的高性能 CPU 开发产生了影响。 这些芯片都不太可能进行商业销售。它们针对特定的数据类型和工作负载进行了优化,设计预算庞大,但可以通过提高性能和降低功耗来实现合理化。目标是在更小的面积上容纳更
    的头像 发表于 04-25 10:23 1335次阅读
    构建<b class='flag-5'>高性能</b><b class='flag-5'>计算</b>芯片

    Hitek Systems开发基于PCIe的高性能加速器满足行业需求

    Hitek Systems 使用开放式 FPGA 堆栈 (OFS) 和 Agilex 7 FPGA开发基于最新 PCIe 的高性能加速器 (HiPrAcc),旨在满足网络、
    的头像 发表于 03-22 14:02 668次阅读
    Hitek Systems开发基于PCIe的<b class='flag-5'>高性能</b>加速器<b class='flag-5'>以</b>满足行业需求