What is Machine Learning?
什么是机器学习?
举个简单的例子,你的email账户经常会受到来自不同对象的各种email:熟人邮件、广告邮件、垃圾邮件、病毒邮件…,如何自动地区分这些邮件?
你可以写一个机器学习程序,先手工的标记少量的邮件类别,该程序会根据你提供的这些标记样本(Samples),对新邮件进行自动地识别,以区分不同的邮件。再如,你如果在某购物网站选取了某件物品,该网站的机器学习程序会自动根据其对以往很多用户的购物习惯的数据记录,结合你目前选购的物品,自动给你推荐你可能感兴趣的其他物品。在比如,如果你有某地区各种房屋的数据信息(房屋结构及大小、价格、质量、周边环境等),并对其中部分的购房选择是否是明智的选择进行了标记:明智、不明智。那么当你想选购一个新房屋时,就可以交给机器学习程序帮你来选择。当我们获得大量关于夫妻双方性格、教育、家庭及婚姻是否幸福的数据时,男女在选择结婚对象时就可以让机器学习帮助我们进行结婚对象的选择。 还有手机上的手写输入、邮政号码识别、汽车自动驾驶、机器人导航、疾病诊断、股票买卖等,这些技术应用的核心技术就是机器学习。机器学习已经无处不在,时刻影响这我们的生活。
广义上讲,机器学习是人工智能的一个分支,但也有人将机器学习作为一个独立与人工智能的研究领域看待。形成了人工智能的两个不同的研究社区community,一边是传统的基于规则推理的传统人工智能社区,一个典型的例子就是深蓝大战国际象棋大师,一边则是以统计学和优化技术为核心的机器学习社区,一个典型的例子就是对一幅可能是上千种类别的对象进行识别该图像上有一些什么物体而不是简单识别一个人脸。
简单地讲,传统的人工智能是一种基于规则的推理技术,如定理的机器证明,而机器学习则是一种统计学习技术,根据大量经验数据,进行学习判断。只要积累了足够多的数据,就能得出判断,因此机器学习也必然是目前炒得很火的所谓“大数据”的核心技术了,有一句话: “sometimes it’s not who has the best algorithm that wins; it’s who has the most data.” (赢的不是有好算法的,而是数据最多的那个).