训练Fappy Bird、教会“识花君”都是机器学习分情况讨论的示例,也就是学习分类,上一篇我们了解了如何训练一只会飞地小鸟。
生活中也有许多需要分类的场景,比如水泥厂工人筛沙子、区分混在一起地黄豆和花豆…
人们又是如何筛地呢?
你一定想到了…筛网!
稍加改装一下,可以做出黄豆和花豆的分类器
如图所见,黄豆并没有完全被筛选出来?为什么呢?我们如何来改善?
调整筛孔的大小!
之所以这样做,是因为人们明显能看出花豆大、黄豆小,通过调整筛孔的大小,找到区分两种豆子大小的临界值,就可以区分剩下混合的豆子了。
而机器在筛选的过程中,我们还要给豆子都打上标签,这样机器才知道哪些是花豆,哪些是黄豆。例如花豆用1表示,黄豆可以用-1表示。
总结一下,机器分类的过程吧!
训练机器学会分类,简单可以分为四步:
1. 找到区分两个种类的特征,例如两种豆子大小不同,扎与不扎感觉不同,不同x值对应的y值不同。
2. 找到两个种类特征的临界值,例如豆子大小的临界,感觉的临界,x与y的函数规律。
3. 检验临界值是否可靠,例如有没有完全区分豆子,到底扎到了没有,x值能不能算出对应的y值。
4. 应用训练得到的模型,实现预测分类结果。、
下一篇开始,我们可以训练属于自己的分类器了。