在当下的机器学习热潮,人才匮乏十分显著。截至目前,国内开设人工智能(AI)专业的高校不多,相当多的开发者是跨界入门,需要自学大量知识并摸索。因而优质的学习资源至关重要。因此,雷锋网搜集了全世界范围内最受欢迎的机器学习课程,整理成这份“机器学习十大入门公开课”盘点,集中呈现给各位。这份推荐榜颇费心血,综合考虑了难易、侧重点、时效性等诸多因素,希望能帮助大家找到最适合自己的学习资源。
这些课程全部免费开放,但有些需翻墙,有的缺少中文字幕。
1. 吴恩达“机器学习”公开课
课程名称:机器学习 Machine Learning
主讲人:吴恩达 Andrew Ng
授课机构:斯坦福大学
发布平台:Coursera
语言:英语,汉语字幕
网址:https://www.coursera.org/learn/machine-learning
无论国内国外,这是最火的机器学习入门课程,没有之一。无数新手都是通过这门课对机器学习初窥门径。吴恩达老师用极其清楚直白的语言,对机器学习的几种主要算法做了初步介绍。
这门课最大的特点,是它侧重于概念理解而不是数学。数学推导过程基本被略过,重点放在让初学者理解这背后的思路。另外,它还十分重视联系实际和经验总结:1. 课程中吴恩达老师列举了许多算法实际应用的例子 2. 他提到当年他们入门 AI 时面临的许多问题,以及处理这些难题的经验。
课程中代码教程使用的是Octave/MATLAB,因此不需要会 Python、C 语言,适合没有编程基础的新手。
总结起来,这门课对数学、统计、IT 基础薄弱的童鞋十分友好。其实很多机器学习入门课,都是假定学生已修完这一门,于是重点对其进行补充——讲解这门课程中吴恩达老师未涉及、或是涉及不深的话题。因此,对于机器学习 “一张白纸”的童鞋,雷锋网强烈推荐从这门课起步,然后选择其他入门课程进阶,以在脑海中建立起更全面的知识体系。另外,Coursera 上这门课的论坛十分活跃,不管抛出什么问题都会有人解答,算是一个额外的好处。
彩蛋:网易公开课上有吴恩达老师在斯坦福授课的实录视频。内容比较深入,但时间比较久了,可作为进阶姊妹篇。地址:http://open.163.com/special/opencourse/machinelearning.html
2. 加州理工 “从数据中学习”
课程名称:Learning from Data,网易公开课译名为“加州理工学院公开课:机器学习与数据挖掘”
主讲人:Yaser Abu-Mostafa
授课机构:加州理工学院
发布平台:edX(原版),网易公开课
语言:英语,网易有汉语字幕
网址: https://www.edx.org/course/caltechx/caltechx-cs1156x-learning-data-2516,edX;
http://open.163.com/special/opencourse/learningfromdata.html,网易。
这同样是一门机器学习的入门课,但并不简单。该课程强调数据,是因为机器学习与各领域的大数据处理应用(比如金融、医疗)联系十分紧密。这门课内容涵盖基础理论、算法和应用,平衡了理论与实践,既覆盖数学统计,也包含启发式的概念理解。
课程结构是这样的:
什么是学习?
机器能学习吗?
怎么做到?
怎么做好?
经验教训。
不少人评论该课程结构就像讲故事,它有助于学习者形成对机器学习概念和模型深度、直觉性的理解。学习者公认它内容非常充实,但对作业模块的争议很大:有人认为难度偏高并且缺乏反馈,有人认为它是网上能找到的、最好的机器学习练习。
彩蛋:Yaser Abu-Mostafa 出版了同名著作 《Learning From Data》,可作为该课程的教材和补充。
3. Tom Mitchell 机器学习课程
课程名称:机器学习 Machine Learning
主讲人:Tom Mitchell
授课机构:卡内基梅隆大学(CMU)
发布平台:CMU 官网
语言:英语
网址:http://www.cs.cmu.edu/~tom/10701_sp11/
这门课是学界人士的最爱,是入门课程之中较全面、高阶的一门。课时为 15 周,远超大多数机器学习慕课。其覆盖的话题非常广,按先后次序包括:代数和概率论,机器学习的基础工具,概率图模型,AI,神经网络,主动学习,增强学习。课程内容和练习十分简洁明白,概念解释清楚到位。
Tom Mitchell 是 AI 领域德高望重的老牌宗师,他的《Machine Learning》 (中文版为《计算机科学丛书:机器学习》),是最经典的机器学习教科书之一。但因为时间久远,涉及的一些概念与今天的开发者并没有太大关联,更适合需要了解人工智能来龙去脉的大学师生。这门课程与之类似,能帮助学习者理清机器学习的发展脉络。它适合计划进行系统性学习、投入大量时间的人。
对于初学者,建议至少听完吴恩达的机器学习课程之后,再修这一门。
4. 台大林轩田老师的機器學習基石
课程名称:機器學習基石
主讲人:林轩田
授课机构:台湾大学
发布平台:Coursera
语言:汉语
这是为汉语学子量身定做的入门课,相当于台湾大学机器学习课程前半学期的课,教给大家的是机器学习最核心的知识。林老师是教科书《Learning From Data》 的作者之一,是华人机器学习领域年轻有为的青年学者。这门课程十分用心细致,内容比吴恩达老师的入门课程稍稍充实一些。
林老师表示,针对顶级机器学习公开课全是英语授课的现状,不少学生反映英语教学有不易吸收之处。因此,借推出这门课程,希望帮助汉语为母语的学生减少入门难度。
针对如何让学生接受枯燥的算法,林老师说道:
“我们的课程设计中,大家会看到我们把对算法与数学式的推导,以‘解决问题’的过程方式呈现。也就是说,我们对算法的介绍是环绕着‘为什么’出发的,当同学们脑中有‘为什么’的时候,就有目标去理解这些算法与数学式的内容了。”
《Learning From Data》 也可作为这门课的教科书。学习 Yaser Abu-Mostafa 的课程有不解之处,可与这门课互相印证。