本文共 862 字,大约阅读时间需要 2 分钟。
这节课讲到python 和 机器学习了。
机器学习一般和人工智能联系在一起,想想都难学。
这节课80分钟。只了解了机器学习这个概念。
机器学习主要用来:
- 搜索引擎
- 图像处理
- 声音识别
- 自然语言处理。
视频中讲了图像识别和自然语言处理。
然后核心都是分类、聚类。
听着听着,感觉这个分类和最小值原理好熟悉。
大四时有门专业课 遥感原理与方法,第8章讲到了遥感图像的自动分类。
视频中的监督分类、非监督分类、K均值聚类法、最小距离分类方法在书中都有提到。
以下内容摘抄自 遥感原理应用与方法 ,可以帮助理解机器学习:
- 遥感图像的计算机分类,就是利用各种图像特征按一定的算法和规则,将遥感图像上的每个像元或区域进行属性识别和划分的过程。
- 目前,遥感图像的自动分类主要采用统计、决策树、模糊理论及神经网络等方法。
- 统计方法自然简单也容易实现(python的第三方库),统计分类方法又分为监督分类和非监督分类。
- 如果已知样本区类别的信息,对非样本区数据进行分类的方法称为监督分类。监督分类首先要根据训练样区来得到判别准则,比如某一类的中心的位置。
- 定义时提到的算法和规则,即判别函数和判别规则。常用的算法和规则是最小距离法。
- 根据RGB原理,每个像元都由三个字节表示颜色(三个0~255之间的数),每个像元对应着三维空间中的点。然后可以计算像素到哪个类距离最小了。
- 然后,非监督聚类。没有训练样区来得到聚类的中心。只是“盲目聚类”,典型的非监督聚类方法有K-均值聚类法。
- K-均值聚类法的思想是通过迭代,依次移动各类的中心,直到得到满意的结果。大致流程如下: 任意选择m个中心(分成m类); 将所有像元按照最小距离法分到这m个类中; 根据各类中像元值计算新的m个中心; 再根据这m个中心将所有像元分类到这m个类中; 再计算新的m个中心; … 直到两次聚类中心几乎没有变化,认为分类结束。
统计学都需要学好就才能顺利学习机器学习。
只靠统计学远远不能满足机器学习的需要,还有决策树、模糊理论、神经网络这些。
术业有专攻,先大概了解一下。
转载地址:http://nheii.baihongyu.com/