0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

100天让你学会机器学习的项目!

算法与数据结构 来源:未知 作者:李倩 2018-09-17 16:42 次阅读

机器学习是我们这个时代最具变革性的技术,它具有从太空探索到财务,医学和科学的巨大应用。据估计,未来对机器学习专家的需求将会不断增加,今年估计增长约60%。

最重要的是,该行业在过去几年中经历了巨大的变革。以前,要成为一名机器学习专家,你需要有一个博士学位(或一些高学历),但现在已经不是这样了。由于大型科技公司如Alphabet(谷歌母公司),IBM,微软等公司的参与,现在任何人都可以更轻松地开始机器学习。

这不,YouTube上的大咖Siraj Raval就发起了一个挑战赛:#100DaysOfMLCode。

什么是#100DaysOfMLCode?

这是向机器学习开发人员(专家或新手)发出的挑战,要求在接下来的100天内每天至少花一小时学习和构建机器学习模型。内容有易到难,由此也可以看得出博主Avik-Jain的用心良苦。

其中一名叫Avik Jain的机器学习爱好者,创建了一个100-Days-Of-ML-Code的项目,很快引起了大家的注意,截至今日,该项目已经获得了11570个「star」以及1993个「fork」(GitHub地址:https://github.com/Avik-Jain/100-Days-Of-ML-Code)。

更不可思议的是,他还创建了该项目的中文版

从他的GitHub主页可以看到他共创建了6个项目:

目前作者的100天计划,已经进行到第54天,已有的内容包括:

有监督学习

● 数据预处理

● 简单线性回归

● 多元线性回归

● 逻辑回归

● k近邻法(k-NN)

● 支持向量机(SVM)

● 决策树

● 随机森林

无监督学习

● K-均值聚类

● 层次聚类

这里我们通过介绍第一天的数据预处理来深入了解下这个项目

数据预处理

第一步导入库

importnumpyasnpimportpandasaspd

第2步:导入数据集

dataset=pd.read_csv('Data.csv')X=dataset.iloc[:,:-1].valuesY=dataset.iloc[:,3].values

第3步:处理丢失数据

fromsklearn.preprocessingimportImputerimputer=Imputer(missing_values="NaN",strategy="mean",axis=0)imputer=imputer.fit(X[:,1:3])X[:,1:3]=imputer.transform(X[:,1:3])

第4步:解析分类数据

fromsklearn.preprocessingimportLabelEncoder,OneHotEncoderlabelencoder_X=LabelEncoder()X[:,0]=labelencoder_X.fit_transform(X[:,0])

创建虚拟变量

onehotencoder=OneHotEncoder(categorical_features=[0])X=onehotencoder.fit_transform(X).toarray()labelencoder_Y=LabelEncoder()Y=labelencoder_Y.fit_transform(Y)

第5步:拆分数据集为训练集合和测试集合

fromsklearn.cross_validationimporttrain_test_splitX_train,X_test,Y_train,Y_test=train_test_split(X,Y,test_size=0.2,random_state=0)

第6步:特征量化

fromsklearn.preprocessingimportStandardScalersc_X=StandardScaler()X_train=sc_X.fit_transform(X_train)X_test=sc_X.fit_transform(X_test)

通过6步完成数据预处理。此例子中用到的数据地址:https://github.com/Avik-Jain/100-Days-Of-ML-Code/blob/master/datasets/Data.csv

可以看出他每天的计划都包含一张学习图片,操作补流程、相应的代码,以及用到的数据

简单线性回归 | 第2天

多元线性回归 | 第3天

逻辑回归 | 第4天

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6552

    浏览量

    103879
  • 机器学习
    +关注

    关注

    66

    文章

    8340

    浏览量

    132281

原文标题:爆红GitHub!有人打算用这个项目100天拿下机器学习

文章出处:【微信号:TheAlgorithm,微信公众号:算法与数据结构】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    人工智能、机器学习和深度学习存在什么区别

    人工智能指的是在某种程度上显示出类似人类智能的设备。AI有很多技术,但其中一个很大的子集是机器学习——算法从数据中学习
    发表于 10-24 17:22 2401次阅读
    人工智能、<b class='flag-5'>机器</b><b class='flag-5'>学习</b>和深度<b class='flag-5'>学习</b>存在什么区别

    合储能与欧洲Aquila在德国启动电池储能项目

    近日,合储能携手欧洲可再生能源开发商Aquila,在德国荷尔斯泰因州斯特吕贝尔(Strübbel)启动了一个标杆性的电池储能项目。作为该州最大、最先进的电池储能项目之一,项目容量达
    的头像 发表于 10-17 09:40 278次阅读

    【免费领取】AI人工智能学习资料(学习路线图+100余讲课程+虚拟仿真平台体验+项目源码+AI论文)

    想要深入学习AI人工智能吗?现在机会来了!我们为初学者们准备了一份全面的资料包,包括学习路线、100余讲视频课程、AI在线实验平合体验、项目源码、AI论文等,所有资料全部免费领取。01
    的头像 发表于 09-27 15:50 288次阅读
    【免费领取】AI人工智能<b class='flag-5'>学习</b>资料(<b class='flag-5'>学习</b>路线图+<b class='flag-5'>100</b>余讲课程+虚拟仿真平台体验+<b class='flag-5'>项目</b>源码+AI论文)

    学会单片机可能吗?单片机入门需要多久?

    学习单片机的过程,就像学习任何其他技能一样,不仅在于书本上的知识,更在于实践和应用的能力。许多人可能会问:十学会单片机吗?答案是:可以,但这取决于
    的头像 发表于 09-05 08:00 680次阅读
    十<b class='flag-5'>天</b><b class='flag-5'>学会</b>单片机可能吗?单片机入门需要多久?

    【「时间序列与机器学习」阅读体验】+ 鸟瞰这本书

    的交织中不断成长。 读者对这本书的评价普遍很高。他们称赞作者用通俗易懂的语言将复杂的概念解释得透彻清晰,即使是初学者也能轻松入门。同时,书中丰富的案例和详细的步骤指导也读者快速积累经验,提高实战技能。甚至有读者表示,这本书已经成为时间序列分析、机器
    发表于 08-12 11:28

    【「时间序列与机器学习」阅读体验】+ 简单建议

    这本书以其系统性的框架和深入浅出的讲解,为读者绘制了一幅时间序列分析与机器学习融合应用的宏伟蓝图。作者不仅扎实地构建了时间序列分析的基础知识,更巧妙地展示了机器学习如何在这一领域发挥巨
    发表于 08-12 11:21

    机器学习算法原理详解

    机器学习作为人工智能的一个重要分支,其目标是通过计算机自动从数据中学习并改进其性能,而无需进行明确的编程。本文将深入解读几种常见的机器
    的头像 发表于 07-02 11:25 659次阅读

    深度学习与传统机器学习的对比

    在人工智能的浪潮中,机器学习和深度学习无疑是两大核心驱动力。它们各自以其独特的方式推动着技术的进步,为众多领域带来了革命性的变化。然而,尽管它们都属于机器
    的头像 发表于 07-01 11:40 1079次阅读

    机器学习的经典算法与应用

    关于数据机器学习就是喂入算法和数据,算法从数据中寻找一种相应的关系。Iris鸢尾花数据集是一个经典数据集,在统计学习机器
    的头像 发表于 06-27 08:27 1535次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>的经典算法与应用

    名单公布!【书籍评测活动NO.35】如何用「时间序列与机器学习」解锁未来?

    。 如果也想了解系统了解时间序列与机器学习的相关知识,那就来看看这本“荔枝书”吧! 申请时间 2024年6月25日——2024年7月25日 活动参与方式 1、在本帖下方留言回帖说说你想要这本
    发表于 06-25 15:00

    请问PSoC™ Creator IDE可以支持IMAGIMOB机器学习吗?

    我的项目使用 POSC62 MCU 进行开发,由于 UDB 模块是需求的重要组成部分,所以我选择了PSoC™ Creator IDE 来进行项目开发。 但现在,由于需要扩展,我不得不使用机器
    发表于 05-20 08:06

    500字告诉学会焊PCB板有什么用?

    学会焊接PCB板可以提供以下几个重要的用途和好处: 1.修复和维护电子设备:掌握焊接技能可以修复和维护各种电子设备,包括电脑、手机、电视等。当电子设备出现故障时,可以检查并重新连
    的头像 发表于 03-04 14:10 547次阅读

    如何从零开始构建深度学习项目?(如何启动一个深度学习项目

    性能重大提升的背后往往是模型设计的改变。不过有些时候对模型进行微调也可以提升机器学习的性能。最终的判断可能会取决于对相应任务的基准测试结果。
    发表于 01-11 10:49 268次阅读
    如何从零开始构建深度<b class='flag-5'>学习</b><b class='flag-5'>项目</b>?(如何启动一个深度<b class='flag-5'>学习</b><b class='flag-5'>项目</b>)

    诺力智能科技与机器人在智能叉车项目上达成战略合作

    据悉,2024年1月9日,诺力智能科技与机器人在智能叉车项目上达成战略合作。
    的头像 发表于 01-10 14:07 487次阅读

    开源项目!教你如何复刻自平衡赛车机器人、智能家居中控、竞技机器人先进模糊控制器等

    开源项目作品 为了方便大家更好提升自己,电子发烧友小编为大家整理了一些工程师大佬设计的开源项目作品,供大家可以参考学习,希望对广大工程师有所帮助。 1.用全志R128复刻自平衡赛车机器
    发表于 12-26 09:17