6 月 20 日,AI产品和服务提供商第四范式宣布发布最新 AI 系列产品SageOne Appliance软硬一体化AI集成系统,性能较市面开源工具或GPU解决方案至少提高6倍。这是继 2018 年9 月 18 日第四范式发布自动机器学习平台AI 先知 AutoML 与计算机视觉平台AI 先知 AutoCV 两款产品之后的又一系列AI新产品。同时,该公司还发布了“启航”合作伙伴计划,对合作伙伴开放“先知”生态体系建设。
SageOne Appliance软硬一体化AI集成系统
在帮助企业转型及应用AI的过程中,第四范式总结出企业AI转型的“1+N”战略方法。“1”是指利用AI达到极致效果,在自己的核心业务上建立绝对优势;“N”是借力科技创新带来的基础设施成本的降低,规模化的落地于更多业务场景,提升整体经营效率。
第四范式创始人&CEO戴文渊表示,企业的核心业务通常有1或数个,在实际经营中,核心业务创造的营收占比可达80%甚至更多,因而1%的提升就足以改变企业竞争格局。如果企业能高效地完成一千个场景的全面覆盖,即使每个场景只提升1倍,那也是百分之百的提升。面对场景众多的企业,AI的“规模化落地”能力是企业全面智能化转型的关键。
第四范式联合创始人、首席架构师胡时伟表示:传统算力和AI应用负载之间存在天然的鸿沟,传统算力只是解决在计算、访存、I/O带宽的局部密集问题,而AI应用负载则需要解决全部密集的问题。发展企业级AI专用算力已经成为行业的普遍共识和大势所趋。
为解决这些问题,第四范式发布了最新AI产品SageOne Appliance软硬一体化AI集成系统,共发布 SageOne Advanced、SageOne Standard 和 SageOne WorkStation 三大系列共7款产品,覆盖大中小企业中开发、投产和验证等全部场景应用。
据介绍,SageOne Appliance 的整体架构如下图所示,由AI应用、AI平台、AI核心引擎和硬件基础设施四部分组成。
▌三大核心引擎
第四范式 SageOne 借助自研AI训练引擎、AI推理引擎和AI特征存储引擎三大引擎的领先技术,针对硬件中的芯片、存储、网络等组件进行了重新定义,根据企业AI应用的实际情况进行了专用计算架构、资源管理和调度等进行深度优化和加速,为企业 “1+N”AI应用提供充沛算力。
AI训练引擎——全面加速高维机器学习过程
SageOne AI 训练引擎以自研高维机器学习分布式框架GDBT和高维算法为基础,并使用第四范自主研发的硬件加速卡4Paradigm ATX800,该卡采用20nm制程,算力达到1.5TFLOPS,内置FlashGBM加速系统,充分用内存和高速缓存带宽,支持自动优化训练超参数、高位特征计算过程I/O加速和高维 GBDT 训练加速等功能,在企业应用场景中表现出多达 10 倍的训练性能。
此外,第四范式和英特尔联合实验室针对最新Cascade Lake-AP处理器的全新AVX512指令集、多核心及主频利用率和CLX AP微架构IO总线的利用率进行了全面优化。
SageOne内置第四范式自主研发的高维、分布式网络通讯协议Swift,集成P-PRC自研网络通信框架、零拷贝数据交换协议等通讯技术,结合基于CLX-AP架构的参数服务器集群。SageOne在高维特征计算过程I/O最大10X加速,高维稀疏场景模型训练比GPU提速5X以上,自研pRPC通信框架比百度bRPC和谷歌gRPC提速3-10X。
AI推理引擎,实时AI推理能力
SageOne内置自研实时特征计算引擎和模型预估引擎,为企业AI应用提供特征处理过程免开发上线、线下线上一致性保证、一键生成预估服务、异构模型统一服务等AI核心应用服务,结合非易失性存储的无限缓存和超低延迟内存存储等硬件技术,确保企业AI应用时具备海量量时序特征计算和万亿维模型实时推理能力的同时,提供百万级并发实时请求支持和99.9%请求毫秒级响应的高并发业务极速响应服务。
AI特征存储引擎,超低延时在线AI数据治理
面向AI的数据治理是企业AI规模化落地的基础,针对企业中多源异构数据对接、离线在线数据一致性管理、回流数据自动标准及权限、审计等众多治理需求,SageOne借由自研内存时序数据库引擎的优势,具备毫秒级海量时序特征供给性能,并通过融合InfiniCache无限缓存等技术,实现自动切换存储介质优化TCO和 RAFT一致性灾备与恢复等高性能企业级标准。SageOne利用超低延迟数据访问接口、超高数据吞吐传输通道和水平扩展动态扩容服务等突出能力,为企业AI应用构建了超低延迟在线数据治理能力。
值得一提的是,SageOne 存储引擎中使用的 RTIDB 是业界首个AI特征数据库。胡时伟分析道,市面上有很多数据库,如关系型数据库、分析型数据库等主要是人对数据进行处理并得到结果,但是,AI数据库要解决的问题不是给人看的,而是给机来“看”,所以对于吞吐量、一致性的要求较高。因为第四范式要解决1+N的问题,原来面向传统应用的数据库应用起来非常不顺利,会产生很多折损,但按照AI数据库的架构,用全量、实时、一致性的数据标注,可以更好地支持核心场景和应用。软件层面要求实时性和全量兼顾,这就会产生内存不足、网络传输吞吐量的问题,因
此,软硬一体化和无限闪存技术可以弥补传统的系统架构中内存成本太高、磁盘延迟太大的问题,以相同的代价实现性能提高十倍以上,同时保持延迟基本相同。
软件目标的体系架构和算法的设计,再加上硬件的支持,是这套数据库的特点。
特点:高维计算、实时决策
相比于同类产品,SageOne 的优势在于高维计算和实时决策。
第四范式自主研发的高维机器学习算法,面对企业海量多源异构的数据场景,特征维度可以达到6500万,在同等维度下,大部分的开源工具或GPU解决方案会以失败告终。同时,模型的预测效果提升,比如金融风控的性能提升9倍,金融反洗钱的效率提高6倍。
另外,SageOne通过毫秒级数据响应和百万级吞吐量实时提升核心业务成效,让原本只能出现于“事后”的统计分析,转变成为 “事中”实时业务决策AI应用。在企业核心场景的实时业务决策中,15个SageOne推理引擎节点都够支撑20亿维特征模型实时2万次并发请求,其中99.9%请求在100ms内响应,大幅提升实时决策在核心业务场景中的关键价值。
最后,胡时伟表示,对于中小企业或者处于拥抱AI的初级阶段的公司,可以采用SageOne Standard产品,SageOne WorkStation和SageOne Advanced产品也可以使用。
此外,第四范式还展示了全面国产化的AI软硬一体机——领航,产品内置国产化的CPU、BIOS、网卡和操作系统等软硬组件,融合了第四范式的企业级先知Sage平台中自研高维机器学习框架、AutoML和实时自学习等。
SageOne机器学习框架和算法特点
相比于之前的先知平台产品,SageOne在机器学习框架和算法上进行了一些改进和创新。
胡时伟表示,从方法论来讲,从高维实时这个角度,SageOne继承了之前先知平台的优势,但是由于软硬一体的设计,SageOne可以做到纯软做不到的事情,比如硬件和软件一起加速的设计使得企业可以在同等投入的基础上性能可以再提升十倍或更高,维度可以进一步扩大,这个是原先纯软件方案做不到的。
第二,SageOne引入了存储引擎,此前软件是在传统数据平台上,但SageOne体系提出了全新的数据治理和架构,规模化的应用和数据闭环就要靠这个新的架构,因为传统大数据平台底层的硬件架构支持不了最新实时和一致性需求,所以SageOne引入数据库产品,这是整个新的体系架构中的创新。
独立团队自研AI芯片,2019年更注重AI创造价值
软硬件一体化已成为最近一些公司发布新产品的趋势,将软件解决方案直接嵌入到硬件设施中。第四范式也不例外。目前,第四范式在新加坡已经有一支十多人规模的AI芯片研发团队,正在进行软硬件一体化的研究。戴文渊表示,现在产业已经从软件符合算力的阶段向软件定义算力的阶段转变,第四范式也将从整体到局部,依次做出改变。
2018 年 12 月 19日,第四范式宣布完成 C 轮融资,融资金额超过 10 亿元人民币,估值约 12 亿美金,成为一支独角兽,同时引入包括国新、启迪、保利、三峡、中信、农银、交银等战略股东,红杉中国继续追加投资。2019年2月,第四范式入选CB Insights全球AI百强榜及领军独角兽榜单。
戴文渊透露,第四范式其实已经有了上市规划,但短期内暂无具体计划,上市板块也需灵活选择。戴文渊强调,上市不是目的,上市的方式需要适合第四范式的发展。
目前,第四范式已进入金融、医疗、政府、能源、零售、媒体等领域,加速AI通用平台在各行业的拓展和规模化落地应用。
最后,如果说2017年是AI技术井喷的一年,2018年是AI 落地的一年,那么 2019 年将会出现什么现象和改变呢?
对此,戴文渊给出了自己的想法:“2019年将会关注AI在各个行业里创造的价值,过去我们关注的是AI公司本身,比如又一个大牛出来了,好像写了很多论文,好像拿了好多钱。但这个都不是根本,长期存在价值一定不是说简历好看,而是能不能持续给企业产生价值。”
-
AI
+关注
关注
87文章
31050浏览量
269393
原文标题:继AutoML后,第四范式发布软硬一体化AI集成系统SageOne
文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
评论