100天让你学会机器学习的项目！-电子发烧友网

机器学习是我们这个时代最具变革性的技术，它具有从太空探索到财务，医学和科学的巨大应用。据估计，未来对机器学习专家的需求将会不断增加，今年估计增长约60％。

最重要的是，该行业在过去几年中经历了巨大的变革。以前，要成为一名机器学习专家，你需要有一个博士学位（或一些高学历），但现在已经不是这样了。由于大型科技公司如Alphabet（谷歌母公司），IBM，微软等公司的参与，现在任何人都可以更轻松地开始机器学习。

这不，YouTube上的大咖Siraj Raval就发起了一个挑战赛：#100DaysOfMLCode。

什么是＃100DaysOfMLCode？

这是向机器学习开发人员（专家或新手）发出的挑战，要求在接下来的100天内每天至少花一小时学习和构建机器学习模型。内容有易到难，由此也可以看得出博主Avik-Jain的用心良苦。

其中一名叫Avik Jain的机器学习爱好者，创建了一个100-Days-Of-ML-Code的项目，很快引起了大家的注意，截至今日，该项目已经获得了11570个「star」以及1993个「fork」（GitHub地址：https://github.com/Avik-Jain/100-Days-Of-ML-Code）。

更不可思议的是，他还创建了该项目的中文版

从他的GitHub主页可以看到他共创建了6个项目:

目前作者的100天计划，已经进行到第54天，已有的内容包括：

有监督学习

● 数据预处理

● 简单线性回归

● 多元线性回归

● 逻辑回归

● k近邻法(k-NN)

● 支持向量机(SVM)

● 决策树

● 随机森林

无监督学习

● K-均值聚类

● 层次聚类

这里我们通过介绍第一天的数据预处理来深入了解下这个项目

数据预处理

第一步导入库

importnumpyasnpimportpandasaspd

第2步：导入数据集

dataset=pd.read_csv('Data.csv')X=dataset.iloc[:,:-1].valuesY=dataset.iloc[:,3].values

第3步：处理丢失数据

fromsklearn.preprocessingimportImputerimputer=Imputer(missing_values="NaN",strategy="mean",axis=0)imputer=imputer.fit(X[:,1:3])X[:,1:3]=imputer.transform(X[:,1:3])

第4步：解析分类数据

fromsklearn.preprocessingimportLabelEncoder,OneHotEncoderlabelencoder_X=LabelEncoder()X[:,0]=labelencoder_X.fit_transform(X[:,0])

创建虚拟变量

onehotencoder=OneHotEncoder(categorical_features=[0])X=onehotencoder.fit_transform(X).toarray()labelencoder_Y=LabelEncoder()Y=labelencoder_Y.fit_transform(Y)

第5步：拆分数据集为训练集合和测试集合

fromsklearn.cross_validationimporttrain_test_splitX_train,X_test,Y_train,Y_test=train_test_split(X,Y,test_size=0.2,random_state=0)

第6步：特征量化

fromsklearn.preprocessingimportStandardScalersc_X=StandardScaler()X_train=sc_X.fit_transform(X_train)X_test=sc_X.fit_transform(X_test)

通过6步完成数据预处理。此例子中用到的数据地址：https://github.com/Avik-Jain/100-Days-Of-ML-Code/blob/master/datasets/Data.csv

可以看出他每天的计划都包含一张学习图片，操作补流程、相应的代码，以及用到的数据

简单线性回归 | 第2天

多元线性回归 | 第3天

逻辑回归 | 第4天

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

微软

微软

+关注

关注
4

文章
6552

浏览量
103879
机器学习

机器学习

+关注

关注
66

文章
8340

浏览量
132281

原文标题：爆红GitHub！有人打算用这个项目100天拿下机器学习

文章出处：【微信号：TheAlgorithm，微信公众号：算法与数据结构】欢迎添加关注！文章转载请注明出处。

人工智能、机器学习和深度学习存在什么区别

人工智能指的是在某种程度上显示出类似人类智能的设备。AI有很多技术，但其中一个很大的子集是机器学习——让算法从数据中学习。

发表于 10-24 17:22 •2401次阅读

人工智能、<b class='flag-5'>机器</b><b class='flag-5'>学习</b>和深度<b class='flag-5'>学习</b>存在什么区别

天合储能与欧洲Aquila在德国启动电池储能项目

近日，天合储能携手欧洲可再生能源开发商Aquila，在德国荷尔斯泰因州斯特吕贝尔（Strübbel）启动了一个标杆性的电池储能项目。作为该州最大、最先进的电池储能项目之一，项目容量达

发表于 10-17 09:40 •278次阅读

【免费领取】AI人工智能学习资料（学习路线图+100余讲课程+虚拟仿真平台体验+项目源码+AI论文）

想要深入学习AI人工智能吗？现在机会来了！我们为初学者们准备了一份全面的资料包，包括学习路线、100余讲视频课程、AI在线实验平合体验、项目源码、AI论文等，所有资料全部免费领取。01

发表于 09-27 15:50 •288次阅读

【免费领取】AI人工智能<b class='flag-5'>学习</b>资料（<b class='flag-5'>学习</b>路线图+<b class='flag-5'>100</b>余讲课程+虚拟仿真平台体验+<b class='flag-5'>项目</b>源码+AI论文）

十天学会单片机可能吗？单片机入门需要多久？

学习单片机的过程，就像学习任何其他技能一样，不仅在于书本上的知识，更在于实践和应用的能力。许多人可能会问：十天能学会单片机吗？答案是：可以，但这取决于

发表于 09-05 08:00 •680次阅读

十<b class='flag-5'>天</b><b class='flag-5'>学会</b>单片机可能吗？单片机入门需要多久？

【「时间序列与机器学习」阅读体验】+ 鸟瞰这本书

的交织中不断成长。读者对这本书的评价普遍很高。他们称赞作者用通俗易懂的语言将复杂的概念解释得透彻清晰，即使是初学者也能轻松入门。同时，书中丰富的案例和详细的步骤指导也让读者快速积累经验，提高实战技能。甚至有读者表示，这本书已经成为时间序列分析、机器

发表于 08-12 11:28

【「时间序列与机器学习」阅读体验】+ 简单建议

这本书以其系统性的框架和深入浅出的讲解，为读者绘制了一幅时间序列分析与机器学习融合应用的宏伟蓝图。作者不仅扎实地构建了时间序列分析的基础知识，更巧妙地展示了机器学习如何在这一领域发挥巨

发表于 08-12 11:21

机器学习算法原理详解

机器学习作为人工智能的一个重要分支，其目标是通过让计算机自动从数据中学习并改进其性能，而无需进行明确的编程。本文将深入解读几种常见的机器

发表于 07-02 11:25 •659次阅读

深度学习与传统机器学习的对比

在人工智能的浪潮中，机器学习和深度学习无疑是两大核心驱动力。它们各自以其独特的方式推动着技术的进步，为众多领域带来了革命性的变化。然而，尽管它们都属于机器

发表于 07-01 11:40 •1079次阅读

机器学习的经典算法与应用

关于数据机器学习就是喂入算法和数据，让算法从数据中寻找一种相应的关系。Iris鸢尾花数据集是一个经典数据集，在统计学习和机器

发表于 06-27 08:27 •1535次阅读

<b class='flag-5'>机器</b><b class='flag-5'>学习</b>的经典算法与应用

名单公布！【书籍评测活动NO.35】如何用「时间序列与机器学习」解锁未来？

。如果你也想了解系统了解时间序列与机器学习的相关知识，那就来看看这本“荔枝书”吧！申请时间 2024年6月25日——2024年7月25日活动参与方式 1、在本帖下方留言回帖说说你想要这本

发表于 06-25 15:00

请问PSoC™ Creator IDE可以支持IMAGIMOB机器学习吗？

我的项目使用 POSC62 MCU 进行开发，由于 UDB 模块是需求的重要组成部分，所以我选择了PSoC™ Creator IDE 来进行项目开发。但现在，由于需要扩展，我不得不使用机器学

发表于 05-20 08:06

500字告诉你学会焊PCB板有什么用？

学会焊接PCB板可以提供以下几个重要的用途和好处： 1.修复和维护电子设备：掌握焊接技能可以让你修复和维护各种电子设备，包括电脑、手机、电视等。当电子设备出现故障时，你可以检查并重新连

发表于 03-04 14:10 •547次阅读

如何从零开始构建深度学习项目？（如何启动一个深度学习项目）

性能重大提升的背后往往是模型设计的改变。不过有些时候对模型进行微调也可以提升机器学习的性能。最终的判断可能会取决于你对相应任务的基准测试结果。

发表于 01-11 10:49 •268次阅读

诺力智能科技与天太机器人在智能叉车项目上达成战略合作

据悉，2024年1月9日，诺力智能科技与天太机器人在智能叉车项目上达成战略合作。

发表于 01-10 14:07 •487次阅读

开源项目！教你如何复刻自平衡赛车机器人、智能家居中控、竞技机器人先进模糊控制器等

开源项目作品为了方便大家更好提升自己，电子发烧友小编为大家整理了一些工程师大佬设计的开源项目作品，供大家可以参考学习，希望对广大工程师有所帮助。 1.用全志R128复刻自平衡赛车机器

发表于 12-26 09:17

搜索历史

100天让你学会机器学习的项目！

评论