标题摘要内容
思维:提取特征
来源:宇课堂 | 作者:天宇老师 | 发布时间: 2020-01-17 | 2938 次浏览 | 分享到:

现在同学们能解密“识花君”是如何识别花的吗?

想一想,“识花君”是如何知道是什么花的?

视频:解密“识花君

通过拍照,然后得到花的名字。

 

“最强大脑-猜花名”游戏中,还记得这个花叫什么吗?

如果不记得了,再使用“识花君”扫描一下

 

没错,是鸢尾花。

其实图中的两朵花并不是同一种,而是鸢尾属的两个品种,左为变色鸢尾,右为山鸢尾。

那 “识花君”为什么不能精确分类呢?机器不认识它们吗?

 

同学们一定知道,机器不会思考。

那如何才能精确识别这两种花呢?

机器分类四步走

我们先来看看,这两种花有什么区别?


同学们看出来了吗?花瓣大小不同

变色鸢尾的花瓣大,而山鸢尾的花瓣小

#1

我们要将大小的相对概念,变成机器容易理解的数值,这就是提取特征。

将每组数据都打上对应的标签。

取出一部分数据作为训练数据,而剩下的作为校验训练效果的测试数据。


#2

将特征数据输入分类器后,就可以得到分类标签了

如果输入了一组未知标签的数据,分类器能够判别吗?

不能!


难不成要把全世界鸢尾花的数据都收集起来,打上标签吗?

显然不是!

 

 

黑匣子的神奇之处,就是要找到“特征”与“分类”的规律,也就是数据的临界,才能够实现预测。

 

同学们找找看,两种花特征数据的规律会是什么?

数据再多一些呢,找起来很费劲。

想想,怎样让数据说话….可视化?

 

(长,宽) 同学们想到了什么呢?

没错,就是点,特征数据的点叫做“特征点”,形成的空间叫做“特征空间”。



特征点都在空间中表示出来了,接下来借助数学知识可以区分了吗?

找一条分界线



哪一条才能正确分类呢?机器又是如何确认的?

下篇见!