0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

机器学习实用工具

倩倩 来源:AI课工场 2020-04-15 16:53 次阅读

最近小编学习了很久的机器学习算法,也正在积极的准备找一些机器学习项目来练练手,对于编程工程能力不突出的小编来说,选择困难症犯了。

每次想要真正开始撸项目的时候,到底使用怎样的工具去实现呢?是遵循网上强人的说法”不自己实现的算法都没有灵魂”,还是说秉持选择现有工具开发模型的一贯作风呢?

在目前阶段比较好的方式还是去选用已有的工具或者框架来协助开发。成熟的框架在算法优化和全面上普遍都比个人开发要好,并且使用现有框架和工具能够大大提高开发的效率,如果童鞋们还是想要了解算法开发和实现步骤,可以通过查看源码及官方文档进行了解。

小编今天就给有机器学习开发需求,并对开发的工具有选择困难症的童鞋来推荐一些开源的框架。(小声说,很多网上的工具推荐都是好几个工具并列,这根本没办法治愈选择困难症好嘛!并且推荐的一些工具需要掌握的程度也没有做一些介绍,都去详细了解也会浪费一些时间好嘛!)

数据处理、分析工具

SQL语言(重要指数)

SQL语言作为一种通用的数据库查询语言,它的作用和强大自不用小编过多吹捧,不夸张的说,熟练掌握SQL语言在变化比闪电还快的互联网行业5年内不愁找不到工作。SQL语言不仅在关系型数据库中应用成熟,并且在许多大数据场景中应用也非常广泛,如:Hive、SparkSQL、Kafka、Flink等。

Pandas(重要指数)

Pandas作为Python数据处理、分析三架马车(与Numpy和Scipy)之首,地位摆在那,自然功能也相应的非常突出。它提供了各种高级的工具用于进行数据分析。Pandas有许多内置的方法用于分组统计、合并数据、数据筛选、以及时间序列操作。所有的这些操作都有出色的性能表现。因此,使用Pandas通常用于数据挖掘任务。

Numpy(重要指数)

Numpy是公认的最受欢迎的Python数据分析、机器学习库之一,数组接口是Numpy最佳及最重要的功能。这个接口可以用于把图像、音频、以及其他二进制流数据表示为多维实数数组。Numpy同时也是许多高级类库的底层库。

Scipy(重要指数)

Scipy也是一个常用的Python数据分析库,SciPy库包含了优化器、线性代数、积分、插值、快速傅立叶变换、信号和图像处理、统计等子模块。

总结一下,如果童鞋熟练使用python并手上有一个机器学习的活

学习优先度:pandas》numpy》scipy》SQL

建议掌握程度:

pandas熟练掌握(因为它真的是你以后用得最多的东西)

numpy掌握少数内容(numpy数组和一些创建矩阵、随机数的一些方法),numpy通常适合被大神用来手写算法,童鞋们初级阶段暂可不必了解太深

scipy不太需要特殊掌握(用得着的时候临时去找api即可,比如一些微积分、傅里叶变换、图像处理的问题不太好处理,去找找scipy里的方法吧)

SQL熟练掌握(不解释了,但是在仅熟练Python并需要立即上手完成机器学习和数据挖掘任务时,掌握SQL可以延后,但需要熟练掌握!)

机器学习、深度学习

Sklearn(重要指数)

Sklearn被认为是最优秀的机器学习库甚至没有之一,是一个基于Numpy与SciPy的Python库。它包含了大量用于实现传统机器学习和数据挖掘任务的算法,比如数据降维、分类、回归、聚类、以及模型选择等。

TensorFlow(重要指数)

如果你正在使用Python来从事机器学习项目,那么你一定听说过它,最新版本2.0集合了pytorch的优点,支持动态运算图。也集成了keras,能够以最简便的方式搭建模型,可以说现在的Tensorflow在机器学习、深度学习领域简直无所不能。

Pytorch(重要指数)

优秀的深度学习框架。

Keras(重要指数-)

优秀的深度学习脚手架,可以让深度学习像搭积木那样搭建起来。

Theano(重要指数-)

优秀的深度学习框架。

总结一下,从小编对框架的描述篇幅可以看得出来:

学习优先度:Tensorflow 》》 sklearn 》 pytorch(未包含的建议先不学)

建议掌握程度:

Tensorflow熟练掌握(这是日后用得非常多的框架,学习起来有一定难度,但真的常用)

Sklearn掌握少数内容(sklearn需要熟练掌握其建模流程和规则,因为sklearn实在太规范了,它的学习较简单,但是真的经常会使用到,所以把sklearn当成权威字典随时去查,是小编比较建议的使用方式)

Pytorch可不掌握(框架精通一种即可,尤其tf2.0在支持动态图以后,pytorch的优势也没那么大了)

Keras 可不掌握(tf2.0已经集成了keras,掌握tf2.0直接可以使用)

Theano 可不掌握

整体而言总结一下,需要花时间多学习的工具有:pandas、tensorflow、SQL语言,SQL语言可以等有时间之后再集中学习,不需要花太多时间去学习。把工具当字典的有:sklearn、numpy、scipy,sklearn,需要掌握一些传统机器学习建模流程和规则可以去github上找一些示例看,总体而言使用较简单。其他的工具可以先放一放。小编说的够清楚啦,关上你的手机,赶紧开始学习起来吧。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据处理
    +关注

    关注

    0

    文章

    576

    浏览量

    28511
  • 机器学习
    +关注

    关注

    66

    文章

    8357

    浏览量

    132334
收藏 人收藏

    评论

    相关推荐

    Kali Linux常用工具介绍

    Kali Linux 虚拟机中自带了大量渗透测试工具,涵盖了信息收集、漏洞利用、口令破解、漏洞扫描等多个方面。 以下是按分类简要介绍一部分常用工具的使用方法: 使用方法只能当做参考,**详细
    的头像 发表于 11-11 09:29 150次阅读

    【「时间序列与机器学习」阅读体验】+ 简单建议

    这本书以其系统性的框架和深入浅出的讲解,为读者绘制了一幅时间序列分析与机器学习融合应用的宏伟蓝图。作者不仅扎实地构建了时间序列分析的基础知识,更巧妙地展示了机器学习如何在这一领域发挥巨
    发表于 08-12 11:21

    abb机器人工具坐标系问题

    各位大佬请教一下,abb机器人工具坐标系用四点法,六点法,手动输入等方式标定出的工具坐标系的Z方向与实际工具的长度不符,实际工具长度越长坐标系z方向的差距越大。比如实际
    发表于 08-07 11:11

    机器学习算法原理详解

    机器学习作为人工智能的一个重要分支,其目标是通过让计算机自动从数据中学习并改进其性能,而无需进行明确的编程。本文将深入解读几种常见的机器学习
    的头像 发表于 07-02 11:25 703次阅读

    机器学习在数据分析中的应用

    随着大数据时代的到来,数据量的爆炸性增长对数据分析提出了更高的要求。机器学习作为一种强大的工具,通过训练模型从数据中学习规律,为企业和组织提供了更高效、更准确的数据分析能力。本文将深入
    的头像 发表于 07-02 11:22 526次阅读

    深度学习与传统机器学习的对比

    在人工智能的浪潮中,机器学习和深度学习无疑是两大核心驱动力。它们各自以其独特的方式推动着技术的进步,为众多领域带来了革命性的变化。然而,尽管它们都属于机器
    的头像 发表于 07-01 11:40 1127次阅读

    机器学习的经典算法与应用

    关于数据机器学习就是喂入算法和数据,让算法从数据中寻找一种相应的关系。Iris鸢尾花数据集是一个经典数据集,在统计学习机器学习领域都经常被
    的头像 发表于 06-27 08:27 1549次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>的经典算法与应用

    微软PowerToys修复&quot;高级粘贴&quot;功能BUG,优化设置页面体验

    据悉,微软已于近日向 Windows 10/11用户推出全新版本的高级实用工具集PowerToys,版本号升级至0.81.1,以解决“高级粘贴”功能上线以来收到的部分用户反馈BUG。
    的头像 发表于 05-29 14:52 591次阅读

    请问CX3和FX3在SPI启动方面有什么区别?

    。 使用控制中心实用工具可成功将固件映像文件写入 MT25QL128ABA1EW7-0SIT。但无法启动。 它仍被枚举为引导加载器设备,这意味着 SPI 启动失败。请问 CX3 和 FX3 在 SPI 启动方面有什么区别? 谢谢。
    发表于 05-24 07:16

    HarmonyOS开发案例:【生活健康app之编写通用工具类】(5)

    本节将介绍日志打印、时间换算等通用工具类的编写和使用,工具类可以简化应用代码编写和业务流程处理。
    的头像 发表于 05-11 09:58 497次阅读
    HarmonyOS开发案例:【生活健康app之编写通<b class='flag-5'>用工具</b>类】(5)

    机器学习8大调参技巧

    今天给大家一篇关于机器学习调参技巧的文章。超参数调优是机器学习例程中的基本步骤之一。该方法也称为超参数优化,需要搜索超参数的最佳配置以实现最佳性能。
    的头像 发表于 03-23 08:26 553次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>8大调参技巧

    CY7C65215如何在快速模式和慢速模式之间切换吗?

    我有一个关于 CY7C65215 的问题。 你能告诉我如何在快速模式和慢速模式之间切换吗? 从英飞凌的惠普那里获取软件(配置实用工具), 我对有必要重写 CY7C65215 的内部闪存设置的理解是否正确? 我在数据表中找不到做到这一点的方法,所以请告诉我详细步骤。
    发表于 02-22 07:04

    如何使用TensorFlow构建机器学习模型

    在这篇文章中,我将逐步讲解如何使用 TensorFlow 创建一个简单的机器学习模型。
    的头像 发表于 01-08 09:25 896次阅读
    如何使用TensorFlow构建<b class='flag-5'>机器</b><b class='flag-5'>学习</b>模型

    配网故障定位:关键步骤与实用工具

    在现代电力系统中,配网故障定位是一个至关重要的环节。这不仅涉及到电力系统的稳定运行,也关系到电网安全和用户供电的可靠性。本文将深入探讨配网故障定位的主要步骤和实用工具,帮助大家更好地理解这个复杂而
    的头像 发表于 01-03 09:38 481次阅读

    labview实用工具详解 配套程序

    https://github.com/kevinli5060/labviewToolExplain_DVD 链接重视这本书的程序,这本书很不错。有很多不错的实例
    发表于 11-16 13:05