机器学习算法

2024/4/16 10:47:33

K最近邻算法学习(2)

KNN算法处理多元分类任务 下面来测试KNN算法在类型有多个的时候的性能,下面的测试是用有5个类别的数据集来测试的。 from sklearn.datasets import make_blobs import numpy as np from sklearn.neighbors import KNeighborsClassifier import matplotlib.pyplot …

线性模型学习

最基本的线性模型-线性回归 线性回归,也称之为最小二乘法(OLS),是在回归分析中最简单也是最经典的线性模型。它的基本原理是:找到当训练数据集中y的预测值和其真实值的平方差最小的时候,所对应的w值和b值。 下面是用线性回归来测…

k近邻算法_10大基础算法汇总丨如何从算法入坑机器学习?

在机器学习领域,有种说法叫做“世上没有免费的午餐”,简而言之,它是指没有任何一种算法能在每个问题上都能有最好的效果,这个理论在监督学习方面体现得尤为重要。举个例子来说,你不能说神经网络永远比决策树好&#xf…

解密人工智能:线性回归 | 逻辑回归 | SVM

文章目录 1、机器学习算法简介1.1 机器学习算法包含的两个步骤1.2 机器学习算法的分类 2、线性回归算法2.1 线性回归的假设是什么?2.2 如何确定线性回归模型的拟合优度?2.3 如何处理线性回归中的异常值? 3、逻辑回归算法3.1 什么是逻辑函数?…

SVM算法学习

SVM算法原理 SVM算法是专门用来处理线性不可分的分类问题的,当然它也可以用来处理回归问题。它用来处理这类问题的方式一般是将数据投射到更高维的空间中,其中用得最普遍的两种升维方法分别是多项式内核(Polynomial kernel)和径向基内核(RBF)。 SVM的核…

机器学习(一)线性回归 Linear Regression

线性回归是有监督学习,即给定样本属性和对应的标签,训练出线性函数的参数。 解决问题类型: 预测两类事物对相关性 e.g. 预测房价跟面积的关系 (单变量) 预测房价跟面积、楼层的关系 (多变量&#xff09…

随机森林算法工作原理

随机森林是一种灵活且易于使用的机器学习算法,即便没有超参数调优,也可以在大多数情况下得到很好的结果。它也是最常用的算法之一,因为它很简易,既可用于分类也能用于回归任务。 在这篇文章中,你将了解到随机森林算法的…

机器学习算法_优化算法领军人物带你概览机器学习算法,蓝光辉教授新书面世...

机器之心报道机器之心编辑部蓝光辉教授的最新专著系统地介绍了机器学习算法基础概念和近期进展,尤其是基于优化方法的算法。机器学习算法领域近期出现了大量研发进展,但目前社区尚缺乏对机器学习算法基础概念和近期进展的系统性介绍,尤其是基…

K最近邻算法学习(3)

KNN实战之酒的分类 使用scikit-learn中内置的酒数据集来进行实验,划分训练集和测试集,对KNN模型进行评分。 from sklearn.datasets import load_wine from sklearn.model_selection import train_test_split from sklearn.neighbors import KNeighbors…

决策树与随机森林学习

决策树(DecisionTree) 决策树是一种在分类与回归中都有非常广泛应用的算法,它的原理是通过对一系列问题进行if/else的推导,最终实现决策。 下面用一个酒的分类的例子来进行简单的说明。 import numpy as np from sklearn.datasets import load_wine fr…

PCA(principal component analysis主成分分析)概括(原因、步骤、主成分得分、特征值表重要性的原因、图像的特征分解)

PCA降维的原因 主成分的个数(数据量)远小于原数据量 主成分可以反映原有变量的绝大部分信息 主成分之间互不相关(正交),并且可以得到有效解释 (在主成分有意义的情况下) 总之主成分分析就是…

机器学习算法_MATLAB机器学习:机器学习算法的分类

机器学习算法的能力来源于算法的质量,这正是过去这些年科学家着力更新、改进的内容。这些算法根据使用的输入数据、训练方式以及学习到的模型的输出结果,可分为如下3类。(1)监督学习:这类算法根据一系列样本(每个样本的输入有对应的输出)的观测结果建立从输入到输出的映射关系,…