机器学习是一种数据分析技术,让计算机执行人和动物与生俱来的活动:从经验中学习。
技能挑战
MATLAB 微信公众号回复【M测试】,10 道选择题考验你的机器学习技能!敢来试试吗?
机器学习算法使用计算方法直接从数据中“学习”信息,而不依赖于预定方程模型。当可用于学习的样本数量增加时,这些算法可自适应提高性能。随着大数据应用增加,机器学习已成为解决以下领域问题的一项关键技术:
计算金融学,用于信用评估和算法交易
计算生物学,用于肿瘤检测、药物发现和 DNA 序列分析
能源生产,用于预测价格和负载
汽车、航空航天和制造业,用于预见性维护
自然语言处理,用于语音识别应用
视频:什么是机器学习?
机器学习算法能够在产生洞察力的数据中发现自然模式,帮助您更好地制定决策和做出预测。医疗诊断、股票交易、能量负荷预测及更多行业每天都在使用这些算法制定关键决策。例如,媒体网站依靠机器学习算法从数百万种选项中筛选出为您推荐的歌曲或影片。零售商利用这些算法深入了解客户的购买行为。
何时应该使用机器学习?
当您遇到涉及大量数据和许多变量的复杂任务或问题,但没有现成的处理公式或方程式时,可以考虑使用机器学习。例如,如果您需要处理以下情况,使用机器学习是一个很好的选择:
机器学习的工作原理
机器学习采用两种技术:监督式学习和无监督学习。监督式学习根据已知的输入和输出训练模型,让模型能够预测未来输出;无监督学习从输入数据中找出隐藏模式或内在结构。
监督式机器学习能够根据已有的包含不确定性的数据建立一个预测模型。监督式学习算法接受已知的输入数据集(包含预测变量)和对该数据集的已知响应(输出,响应变量),然后训练模型,使模型能够对新输入数据的响应做出合理的预测。
监督式学习采用分类和回归技术开发预测模型。
分类技术可预测离散的响应—如果您的数据能进行标记、分类或分为特定的组或类,则使用分类。
用于实现分类的常用算法包括:支持向量机 (SVM)、提升 (boosted) 决策树和袋装 (bagged)决策树、k-最近邻、朴素贝叶斯 (Naïve Bayes)、判别分析、逻辑回归和神经网络。
回归技术可预测连续的响应—如果您在处理一个数据范围,或您的响应性质是一个实数(比如温度,或一件设备发生故障前的运行时间),则使用回归方法。
常用回归算法包括:线性模型、非线性模型、规则化、逐步回归、提升 (boosted)和袋装 (bagged)决策树、神经网络和自适应神经模糊学习。
无监督学习可发现数据中隐藏的模式或内在结构。这种技术可根据未做标记的输入数据集得到推论。
聚类是一种最常用的无监督学习技术。这种技术可通过探索性数据分析发现数据中隐藏的模式或分组。
用于执行聚类的常用算法包括:k-均值和 k-中心点(k-medoids)、层次聚类、高斯混合模型、隐马尔可夫模型、自组织映射、模糊 c-均值聚类法和减法聚类。
入门视频
在 MATLAB 微信公众号回复【机器学习入门教程】,获取《机器学习快速入门》系列视频,全面介绍实用的 MATLAB 机器学习方法,包括:
线性回归
判别分析
决策树
支持向量机(SVM)
k近邻算法(K-NN)
k均值聚类算法(k-means)
选择合适的机器学习算法
没有最佳方法或万全之策。找到正确的算法只是试错过程的一部分——即使是经验丰富的数据科学家,也无法说出某种算法是否无需试错即可使用。但算法的选择还取决于您要处理的数据的大小和类型、您要从数据中获得的洞察力以及如何运用这些洞察力。
下面是选择监督式或者无监督机器学习的一些准则:
在以下情况下选择监督式学习:您需要训练模型进行预测(例如温度和股价等连续变量的值)或者分类(例如根据网络摄像头的录像片段确定汽车的技术细节)。
在以下情况下选择无监督学习:您需要深入了解数据并希望训练模型找到好的内部表示形式,例如将数据拆分到集群中。
MATLAB 机器学习
如何借助机器学习的力量,使用数据做出更好的决策?MATLAB 让机器学习简单易行。借助用于处理大数据的工具和函数,以及让机器学习发挥作用的应用程序,MATLAB 是将机器学习应用于您的数据分析的理想环境。
使用 MATLAB,工程师和数据科学家可以立即访问预置的函数、大量的工具箱以及用于分类、回归和聚类的专门应用程序。MATLAB 可以做到:
比较各种方法,例如逻辑回归、分类树、支持向量机、集成方法和深度学习。
使用模型精化和缩减技术创建能够最好地捕捉预测能力的精确模型。
将机器学习模型集成到企业系统、集群和云中,并且将模型定位于实时嵌入式硬件。
为嵌入式传感器分析工具执行自动代码生成。
支持从数据分析到部署的集成工作流程。
有趣的应用
机器学习算法实现艺术鉴赏
小即是好—昆虫大脑完胜机器学习
把 AI 基因植入您的工作流程
MATLAB 填补数据科学家的空白
-
集成方法
+关注
关注
0文章
3浏览量
6038 -
机器学习
+关注
关注
66文章
8375浏览量
132402 -
数据分析
+关注
关注
2文章
1427浏览量
34010
发布评论请先 登录
相关推荐
评论