0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

当机器学习遇上SSD,会擦出怎样的火花呢?

VIBT_dputech 来源:大普微 2020-09-07 16:12 次阅读

近年来人工智能和大数据的迅速发展正在深刻改变着这个世界和我们的生活方式。人工智能的核心是机器学习(Machine Learning) 算法,自 2006 年以来,在机器学习领域,以深度学习(Deep Lerning) 为代表的机器学习算法取得了突破性的进展,在2017年AlphaGo大战围棋冠军李世石后这一技术加速走向市场、落地应用。而SSD作为大数据的一种存储介质,正在取代HDD成为主流的存储设备。那么当机器学习遇上SSD,会擦出怎样的火花呢?

一、什么是机器学习?

·机器学习是让计算机具有学习的能力,无需进行明确编程。—— 亚瑟·萨缪尔,1959

·计算机程序利用经验 E 学习任务 T,性能是 P,如果针对任务 T 的性能 P 随着经验 E 不断增长,则称为机器学习。—— 汤姆·米切尔,1997

机器学习是一类算法的总称,这些算法从大量历史数据中挖掘出其中隐含的规律,并用于预测或者分类,更具体的说,机器学习可以看作是寻找一个函数,输入是样本数据,输出是期望的结果,只是这个函数过于复杂,以至于不太方便形式化表达。需要注意的是,机器学习的目标是使学到的函数很好地适用于“新样本”,而不仅仅是在训练样本上表现很好。学到的函数适用于新样本的能力,称为泛化(Generalization)能力。

二、机器学习步骤

通常学习一个好的函数,分为以下三步:

1、选择一个合适的模型,这通常需要依据实际问题而定,针对不同的问题和任务需要选取恰当的模型,模型就是一组函数的集合。

2、判断一个函数的好坏,这需要确定一个衡量标准,也就是我们通常说的损失函数(Loss Function),损失函数的确定也需要依据具体问题而定,如回归问题一般采用欧式距离,分类问题一般采用交叉熵代价函数。

3、找出“最好”的函数,如何从众多函数中最快的找出“最好”的那一个,这一步是最大的难点,做到又快又准往往不是一件容易的事情。常用的方法有梯度下降算法,最小二乘法等和其他一些技巧(tricks)。

学习得到“最好”的函数后,需要在新样本上进行测试,只有在新样本上表现很好,才算是一个“好”的函数。

三、机器学习的类型

机器学习主要有三种基本类型:监督学习、非监督学习和强化学习。

1监督学习

监督学习是使用已知正确答案的示例来训练模型。已知数据和其一一对应的标签,训练一个智能算法,将输入数据映射到标签的过程,它的常见应用场景如分类问题和回归问题。常见的算法有K近邻算法、线性回归、逻辑回归、支持向量机(SVM)、决策树和随机森林、神经网络

分类

在分类中,机器被训练成将一个组划分为特定的类。分类的一个简单例子是电子邮件帐户上的垃圾邮件过滤器。过滤器分析你以前标记为垃圾邮件的电子邮件,并将它们与新邮件进行比较。如果它们匹配一定的百分比,这些新邮件将被标记为垃圾邮件并发送到适当的文件夹。那些比较不相似的电子邮件被归类为正常邮件并发送到你的邮箱。

也许你会问这个分类算法对于SSD有什么用呢?SSD中的一个典型的分类问题是IO模式识别,判断IO是纯读、纯写或者混合读写的,这是一个三分类的问题;判断IO是顺序的还是随机的,这是一个二分类的问题。可以根据实际情况选择相应的相应的机器学习分类算法识别出不同的IO模式,然后针对不同的模式FTL就可采取不同策略,进而提升SSD的性能。

回归

回归问题通常是用来预测一个值,它的预测结果是连续的,如预测房价、未来的天气情况等,例如一个产品的实际价格为500元,通过回归分析预测值为499元,我们认为这是一个比较好的回归分析。

回归算法在SSD中能用在什么地方呢?回归算法在SSD的一个应用是IO强度预测,在一定模式下IO强度在时序上是有一定规律的,可以根据前一段时间的IO强度预测下一段时间的IO强度,Smart-IO技术采用长短期记忆人工神经网络LSTM对IO强度进行预测。提前预测出IO强度后就可优化FTL策略、合理分配GC占用资源、合理调度、提高数据命中率等,进而提升SSD性能。

2非监督学习

在无监督学习中,数据是无标签的。学习模型是为了推断出数据的一些内在结构。无监督学习主要分为聚类和降维。

聚类用于根据属性和行为对象进行分组。这与分类不同,因为这些组不是你提供的。聚类的一个例子是将一个组划分成不同的子组(例如,基于年龄和婚姻状况),然后应用到有针对性的营销方案中。大多数大数据可视化使用降维来识别趋势和规则。主要算法: K-means、层次聚类分析(HCA)、DBSCAN

高维数据中很容易出现样本稀疏、距离计算困难等问题,即“维度灾难”,为了缓解维度灾难,常用的就是降维。降维的主要方法有主成分分析(PCA)、线性判别分析(LDA)、局部线性嵌入(LLE)。如图所示,通过PCA的方法可以把一个三位的数据降维成一个二维数据。

无监督学习由于没有标签,相比监督学习来说相当于少了一些输入信息,实际应用中相对监督学习学习会困难一些,那么在SSD是否就无用武之地了呢?非也非也。Smart-IO数据分组技术用K-means算法对IO进行冷热数据分组,然后把不同组的数据写到不同的block或者die上,那么就可以减小,可减小WA,延长SSD使用寿命。

3强化学习

强化学习算法的思路非常简单,以游戏为例,如果在游戏中采取某种策略可以取得较高的得分,那么就进一步「强化」这种策略,以期继续取得较好的结果。这种策略与日常生活中的各种「绩效奖励」非常类似。我们平时也常常用这样的策略来提高自己的游戏水平。AlphaGo下围棋也是这个原理,只告诉机器围棋的基本规则,但是不告诉它人类摸索了上千年才总结出来的定式等围棋战术,让机器完全依靠自学,打败人类。

强化学习感觉和SSD很难沾上边,不过熟悉SSD(固态硬盘)的人都知道,垃圾回收(GC,Garbage Collection)是SSD固件设计中的重要一环,也是影响SSD主控性能的重要因素。一般的GC机制都是只根据当前硬盘空闲空间状态来做GC的:当有空闲空间的时,不启动GC;反之,当没有空闲空间的情况下,执行GC任务。这种策略的缺点是如果在用户操作的时候进行GC会造成SSD性能明显下降,可以在主控空闲时提前进行GC,但是GC过于频繁会造成WA写放大过大,所以需要一个平衡,需要一种算法来自动确定何时GC,强化学习正好可以排上用场,给定一定的衡量标准,然后让机器通过强化学习的方法训练来自动学习GC的时机,得到更优的GC的策略。

四、DapuStor机器学习技术

DapuStor已基于SSD开发出Smart-IO Data Grouping和Smart-IO Intensities Prediction等先进技术,把机器学习的先进算法用到了SSD中,提升了SSD的产品性能。同时自研的带有计算和智能的数据存储处理器芯片(简称DPU),可以在芯片层面实现更多的智能功能和硬件加速,实现存算一体,满足高端存储和边缘计算市场的需求。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • SSD
    SSD
    +关注

    关注

    20

    文章

    2851

    浏览量

    117221
  • 人工智能
    +关注

    关注

    1791

    文章

    46845

    浏览量

    237526
  • 机器学习
    +关注

    关注

    66

    文章

    8377

    浏览量

    132402

原文标题:当机器学习遇上SSD

文章出处:【微信号:dputech,微信公众号:DapuStor】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    什么是机器学习?通过机器学习方法能解决哪些问题?

    来源:Master编程树“机器学习”最初的研究动机是让计算机系统具有人的学习能力以便实现人工智能。因为没有学习能力的系统很难被认为是具有智能的。目前被广泛采用的
    的头像 发表于 11-16 01:07 214次阅读
    什么是<b class='flag-5'>机器</b><b class='flag-5'>学习</b>?通过<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法能解决哪些问题?

    NPU与机器学习算法的关系

    在人工智能领域,机器学习算法是实现智能系统的核心。随着数据量的激增和算法复杂度的提升,对计算资源的需求也在不断增长。NPU作为一种专门为深度学习机器
    的头像 发表于 11-15 09:19 296次阅读

    当AI遇上质检擦出什么样的火花

    质检是工厂中的主要场景,传统的人工质检需要工人时刻盯着机器屏幕,从图中发现产品的缺陷,速度大约保持在2秒一张。但如果一张产品的瑕疵难以判断,可能还要多花上几秒思考。而在具体的操作过程中,因为考验视力和专注度,质检员们往往感到较为疲倦。
    的头像 发表于 11-07 11:44 185次阅读

    IP地址与智能家居能够碰撞出什么样的火花呢

    感应灯、远程遥控空调,自动感应窗帘——智能家居已经在正逐步走入我们的生活,为我们带来前所未有的便捷与舒适体验。而在这一进程中,IP地址又能够与智能家居碰撞出什么样的火花呢? 一、IP地址:智能家居
    的头像 发表于 09-24 11:21 210次阅读

    电机碳刷打火花的原因及处理方法

    电机碳刷打火花的原因及处理方法如下: 一、电机碳刷打火花的原因 碳刷磨损过度 :当碳刷磨损到一定程度时,其与换向器之间的接触面积减小,导致电阻增大,进而产生高温和火花。 碳刷硬度不够
    的头像 发表于 09-03 14:32 3305次阅读

    当5G融合体育时,碰撞出怎样火花

    观赛的乐趣,你更爱哪一种?是和亲朋好友围坐电视机前共同经历难忘的时刻,还是独自徜徉于直播、弹幕和热搜的世界?随着科技与体育的关系日益紧密,我们的观赛体验正在被重新定义。正值全球瞩目的体育盛事即将在巴黎启幕,让我们共同期待当5G融合体育时,碰撞出怎样
    的头像 发表于 08-16 11:14 7583次阅读

    机器学习算法原理详解

    机器学习作为人工智能的一个重要分支,其目标是通过让计算机自动从数据中学习并改进其性能,而无需进行明确的编程。本文将深入解读几种常见的机器学习
    的头像 发表于 07-02 11:25 754次阅读

    深度学习与传统机器学习的对比

    在人工智能的浪潮中,机器学习和深度学习无疑是两大核心驱动力。它们各自以其独特的方式推动着技术的进步,为众多领域带来了革命性的变化。然而,尽管它们都属于机器
    的头像 发表于 07-01 11:40 1183次阅读

    SOLIDWORKS教育版:开启数字化设计新时代的钥匙

    在数字化设计的世界里,SolidWorks无疑是一个重量级的角色。那么,你是否想过,当solidworks遇上教育版,碰撞出怎样火花呢
    的头像 发表于 06-17 16:18 231次阅读

    当USB Type-C 遇上汽车应用新需求,擦出什么火花

    尽管 USB Type-C 主要作为笔记本电脑、平板电脑和智能手机的新一代、更快充电标准而为人所熟知,但在电力输送和连接应用领域也变得日益普及。USB Type-C 的速度和效率非常高:随着 USB 电力输送 (USB PD) R3.1 规范的发展, 一个 USB Type-C 连接器便可支持高达 240W(48V 和 5A)的功率,相较于 USB Std-A 连接器的 7.5W(5V 和 1.5A) ,这是一个显著的提升。 USB Type-C 的广泛采用并非偶然,欧盟、印度、巴西和韩国纷纷制定并实施了相关规定,要求便携式个人电子产品
    发表于 05-16 09:49 753次阅读
    当USB Type-C <b class='flag-5'>遇上</b>汽车应用新需求,<b class='flag-5'>会</b><b class='flag-5'>擦出</b>什么<b class='flag-5'>火花</b>?

    晶体晶振在SSD上的应用

    SSD在消费技术解决方案中的使用正在迅速上升。随着物联网、VR/AR、5G、在线技术和机器学习等技术的发展变得越来越普遍,预计这种需求将继续下去。根据市场研究数据,S
    的头像 发表于 04-30 16:03 488次阅读
    晶体晶振在<b class='flag-5'>SSD</b>上的应用

    TC234LP使用iLLD Flash Demo每次运行到擦出Dflash就会跑飞的原因?

    TC234LP 使用iLLD Flash Demo 每次运行到擦出Dflash就会跑飞
    发表于 02-02 07:07

    智慧校园的&quot;边缘智能&quot;: 打造未来教育的桥梁

          在科技飞速发展的时代,智能已经渗透到我们生活的各个角落。而当智能遇上教育,激发出怎样火花呢?今天,我们就来聊聊这个热门话题——智慧校园和边缘智能网关的结合,它们是如何共
    的头像 发表于 01-05 16:41 302次阅读
    智慧校园的&quot;边缘智能&quot;: 打造未来教育的桥梁

    传统能源大佬“撞上”新能源“新贵”:擦出怎样火花

    近年来,中国新能源汽车市场蓬勃发展,新能源充电行业迎来了前所未有的机遇。在这个背景下,壳牌、中石油等石化巨头们纷纷加码充电桩领域,试图在这个迅速发展的市场中抢占一席之地。 党的二十大报告指出,要加快发展方式绿色转型,推动形成绿色低碳的生产方式和生活方式。这为传统能源企业加快向“油气氢电服”综合能源服务商转型发展指明了道路。 中石油方面表示,到“十四五”末期,公司将建设充换电站1000座以上,升级打造“可换电
    的头像 发表于 12-06 09:21 393次阅读

    SSD和HDD的具体对比

    SSD厂商早就预测NAND闪存的价格随着时间的推移而下降,让SSD能够在单价上与HDD竞争。事实上,NAND闪存的价格一直在下降。
    发表于 12-01 15:06 1418次阅读
    <b class='flag-5'>SSD</b>和HDD的具体对比