现在同学们能解密“识花君”是如何识别花的吗?
想一想,“识花君”是如何知道是什么花的?
视频:解密“识花君”
通过拍照,然后得到花的名字。
“最强大脑-猜花名”游戏中,还记得这个花叫什么吗?

如果不记得了,再使用“识花君”扫描一下
没错,是鸢尾花。
其实图中的两朵花并不是同一种,而是鸢尾属的两个品种,左为变色鸢尾,右为山鸢尾。
那 “识花君”为什么不能精确分类呢?机器不认识它们吗?
同学们一定知道,机器不会思考。
那如何才能精确识别这两种花呢?
机器分类四步走
我们先来看看,这两种花有什么区别?
同学们看出来了吗?花瓣大小不同
变色鸢尾的花瓣大,而山鸢尾的花瓣小
#1
我们要将大小的相对概念,变成机器容易理解的数值,这就是提取特征。
将每组数据都打上对应的标签。
取出一部分数据作为训练数据,而剩下的作为校验训练效果的测试数据。
#2
将特征数据输入分类器后,就可以得到分类标签了
如果输入了一组未知标签的数据,分类器能够判别吗?
不能!
难不成要把全世界鸢尾花的数据都收集起来,打上标签吗?
显然不是!
黑匣子的神奇之处,就是要找到“特征”与“分类”的规律,也就是数据的临界,才能够实现预测。
同学们找找看,两种花特征数据的规律会是什么?
数据再多一些呢,找起来很费劲。
想想,怎样让数据说话….可视化?
(长,宽) 同学们想到了什么呢?
没错,就是点,特征数据的点叫做“特征点”,形成的空间叫做“特征空间”。
特征点都在空间中表示出来了,接下来借助数学知识可以区分了吗?
找一条分界线
哪一条才能正确分类呢?机器又是如何确认的?
下篇见!