现在,不了解一些机器学习技能,可能都会觉得自己有些out了。但过去苦于没有数据、没有GPU,没有算法,很多感兴趣的朋友就望而却步了。今天就不同了,开放的数据比比皆是,算力也逐渐强大,还有数不清的线上课程资料。如果你想开启机器学习的大门,就和我们一起来看看这份丰富的资源清单吧!我们将从数据、算力、算法和在线教育等四个方面,为你进入机器学习的大门扫清障碍,大步向前!
数据
数据是算法的养料,可以说这一波深度学习的革命就来源于丰富的数据给予的充足养分,才滋养了人工智能再一次的蓬勃发展!
数据集嘛,图像、文本、语音,你想要的应该都能找到。包括图像领域著名的ImageNet,kitti等数据集
也包括推荐系统方面的IMDb和Million Song
还包括自然语言处理方面的MS MARCO datasets等等著名的数据。
Github上的小伙伴已经为我们准备好了一份数据大餐,如果你想要数据可以到这里尽情下载,除了深度学习数据外,还包括经济、医学、农业等等各个行业的丰富数据,总有一款适合你的兴趣。
https://github.com/awesomedata/awesome-public-datasets
如果这还嫌不够,Kaggle还有一些令人惊喜的优质数据集。
https://www.kaggle.com/datasets
这里有著名的鸢尾花数据集
也有精彩大片的数据集
还有可爱的小蘑菇,让机器学习看看能不能吃:
甚至还有美国大选的数据集:
无论是使用公开的数据集,还是通过Python从web上抓取数据,现在每个人都可以有机会访问高质量的数据集。当然,大型科技公司会把数据私有化以便从中挖掘出最大的价值,但却还有很多人不断的努力为世界创造出更多开放的优质数据,让初学者、工程师和数据科学家们都能利用这些数据训练模型、开启机器学习的大门。
计算
有了数据后要找地方进行计算也是个头疼的问题。虽然对于普通的机器学习问题来说,你的笔记本就能够搞定,但是对于深度学习任务或者大数据量的数据集,小本本的算力就捉襟见肘了。这时候,似乎只有眼馋别人实验室的GPU了。神经网络需要使用大规模并行计算,GPU非常适合这个工作。不幸的是,GPU还是比较贵的。
如果你的笔记本有可以使用的显卡,那就十分愉快啦。如果没有的话,可以考虑入手一块1050之类的入门版GPU来开启你的加速之旅,或者也可以通过亚马逊、谷歌、微软以及国内各家云服务厂商提供的GPU实例来进行计算,一顿饭钱就可以跑好长时间了。
当然,还有免费的午餐,谷歌的Colab和kaggle的kernel中,你可以申请开启GPU来运行自己的算法处理数据。更为方便的是,它们都是基于notebook的格式,使得程序的编写变得更加直观方便。
另外各大高校内一般都设有计算中心,校内价格也十分便宜,对于学生来说是一个不错的选择。
算法
有人说,算法是一种充满价值的商品,一个优秀的算法可能价值连城。幸运的是,机器学习领域已经建立了开源共享的良好文化。无论是在NIPS还是ICLR会议上,研究人员非常乐意分享他们成果。像Github和reddit一样的社区在源源不断地交流、碰撞出各种新思想和新方法,这里的代码可以作为你学习和研究的起点。
对于学术型的小伙伴来说,如果想跟上最新的研究,可以到Arxiv阅读最新的论文,几乎覆盖了全球范围内各个研究团队的最新研究结果。
教育
有了代码,也有了数据,有了计算能力,现在只需要学习如何使用它们。你可以从coursera上开始你的机器学习入门之旅,有包括吴恩达在内的名师指路,学习一定会有个好的开始。同时也可以在网站上找到各种优秀的机器学习入门书籍,深入学习后你会发现无穷的魅力!
同时网上丰富的视频教程也能让你学习到无数的实践、思想和机器学习的无数技巧~
是不是有点小激动呢?这是一个不可思议的时代。在这个飞速变化的时代里,机器学习可以帮助我们以另一种我们不擅长的方式理解这个世界。它可以帮助我们比以往更有效地创造和发现无数的新事物。现在我们获得了这种神力了,聪明的你一定会善加利用的!
-
机器学习
+关注
关注
66文章
8438浏览量
132900 -
数据集
+关注
关注
4文章
1209浏览量
24781 -
深度学习
+关注
关注
73文章
5511浏览量
121395
原文标题:扫盲贴 | 再也没有借口不学机器学习了!全方位资源消灭你不学习的接口
文章出处:【微信号:thejiangmen,微信公众号:将门创投】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
评论