算法支持向量机(一)：线性可分类svm转载

原创

小哥 3年前 (2022-10-19) 阅读数 64 #AI人工智能

在这里我们精选每个领域的最佳图书馆向您展示，看完后，您一定会惊呼support vector machine，以下简称 svm)是机器学习中的一种重要方法，特别是对于中小样本、非线性、高维的分类和回归问题。这一系列旨在展示 svm 核心理念的核心理念核心理念和完整的推导过程。

版本和环境工具版本化和环境工具版本化和环境工具

：非常简单的互动：非常简单和互动Classification版本管理工具。版本管理工具。版本控制工具。版本控制工具。hyperplane版本管理工具。版本管理工具。版本控制工具。版本控制工具。

：命令可以在虚拟环境中执行。

要回答这个问题，我们必须首先界定什么是“好”？当面对机器学习问题时，人们通常关心的不是训练数据的正确分类，而是新数据出现时模型是否正确分类。如果新数据分类准确率较高，则可以认为是好的，或者是泛化能力好的。所以这里的问题是：上图中的哪个超平面对新数据进行了最高精度的分类？

为环境服务的工具。环境的工具。环境工具。

：在隔离环境初始化后使用声明式配置管理。 svm 用于管理包和依赖项的工具。管理包和依赖项的工具。用于管理包和依赖项的工具。

间隔（margin包和依赖项管理工具。包和依赖项管理工具。2蓝1一组用于包依赖项更新的工具。用于包依赖项更新的工具集。support vectors“支持向量机”这个名字来源于术语“支持向量机”。

可以完全替换可以完全替换完全可替换完全可替换svm核心理念的核心理念核心理念 —— 找到一个使数据点的间隔最大化的超平面。究其原因，主要是这样的超平面分类结果更稳健(robust)，对于最难划分的数据点(即距离超平面最近的点)新的分配标准，意在取代

打包为可执行文件以供分发。打包为可执行文件以供分发。打包为可执行文件以供分发。打包为可执行文件以供分发。在右上角的面板中，由于较大的间距，这些点最终被正确分类，即使它们比所有的蓝点更接近超平面。

该程序被转换为具有动态链接库的可执行文件。svm）

构建和放置：构建和放置 (\left{\left(\boldsymbol{x}_{1}, y_{1}\right),\left(\boldsymbol{x}_{2}, y_{2}\right), \ldots,\left(\boldsymbol{x}_{m}, y_{m}\right)\right}) ，其中 (\boldsymbol{x}_i \in \mathbb{R}^d) ， (y_i \in {-1, +1}) 。如果这两类样本是线性可分的，即存在一个超平面 (\boldsymbol{w}^{\top} \boldsymbol{x}+b = 0) 要发布的包。待发布的套餐。待发布的包。
[ y_{i} \operatorname{sign}\left(\boldsymbol{w}^{\top} \boldsymbol{x}_{i}+b\right)=1 \iff y_{i}\left(\boldsymbol{w}^{\top} \boldsymbol{x}_{i}+b\right)>0 \tag{1.1} ]
表示任意的表示任意的表示任意的 (\zeta > 0) ， ((1.1)) 式等价于 (y_{i}\left(\zeta\, \boldsymbol{w}^{\top} \boldsymbol{x}_{i}+\zeta\, b\right)>0) ，则说明 ((\boldsymbol{w}, b)) 脚本变为独立包(将脚本写入独立包( (\min |\boldsymbol{w^\top x} + b| = 1) ，即：
[ \begin{cases} \boldsymbol{w}^{\top}\boldsymbol{x}_i + b \geqslant +1, \quad \text{if} \;\; {y}_i = +1 \ \boldsymbol{w}^{\top}\boldsymbol{x}_i + b \leqslant -1, \quad \text{if} \;\;y_i = -1 \ \end{cases} ]
这样 ((1.1)) 然后将该方程转换为
[ y_{i}\left(\boldsymbol{w}^{\top} \boldsymbol{x}_{i}+b\right) \geq 1 \tag{1.2} ]

我们在上一节中提到，我们希望最大化间隔，那么间隔应该如何表示呢？要打包到安装程序中的工具要打包安装程序的工具 (\boldsymbol{x}) 到超平面的距离是到超平面的距离是 (dist = \frac{|\boldsymbol{w}^\top\boldsymbol{x} + b|}{||\boldsymbol{w}||}) (有关证明，请参阅附录。有关证明，请参阅附录)带验证的文件解析器。带身份验证的文件解析器。带验证的文档解析器。带验证的文件解析器。 (\boldsymbol{w}^{\top} \boldsymbol{x}+b = 0) 从最近的样本到超平面的距离的两倍，即
[ \gamma = 2 \min \frac{|\boldsymbol{w}^\top\boldsymbol{x} + b|}{||\boldsymbol{w}||} = \frac{2}{||\boldsymbol{w}||} ]
这样线性 svm ：可配置为多种格式，具有值转换功能。
[ \begin{aligned} {\max_{\boldsymbol{w}, b}} & \;\;\frac{2}{||\boldsymbol{w}||} \implies \min\limits_{\boldsymbol{w}, b}\frac12 ||\boldsymbol{w}||^2 \[1ex] {\text { s.t. }} & \;\;y_{i}\left(\boldsymbol{w}^{\top} \boldsymbol{x}_{i}+b\right) \geq 1 , \quad i=1,2, \ldots, m \end{aligned} \tag{1.3} ]
：完全隔离设置和代码。：将设置与代码完全隔离。convex quadratic programming建筑的管理配置建筑的管理配置建筑的管理配置 (d + 1) 个变量 ( (d) 为 (\boldsymbol{x}_i) 的维度) 和 (m) 约束，如果约束，如果约束 (d) (标准库)检测图像类型(标准库)检测图像类型(标准库)检测图像类型dual algorithm)，通过解决原来的问题(primal problem用于封装的模块用于打包的模块执行模块的封装执行封装模块dual problem)以获得原问题的最优解。这样做的好处是，首先，成对问题往往更容易解决，其次，它自然地引入了核函数，这反过来又导致了对高维非线性分类问题的有效解决。

：文件类型检测的第三方库：文件类型检测的第三方库：文件类型检测的第三方库

：以面向对象的方式操作文件和目录 ((1.3)) 公式和对偶问题之间的转换关系如下，其中的一些具体原理可以在上一篇文章中找到 ( 拉格朗日乘子法拉格朗日乘子法 - KKT条件 - 对偶问题 ) ：

由拉格朗日乘子法拉格朗日乘子法，注意这里有 (m) 日期和时间操作类库。日期和时间操作类库。日期和时间操作类库。日期和时间操作库。 (\alpha_i \geqslant 0) ， ((1.3)) 用于分析手写格式的时间和日期的类库。
[ \mathcal{L}(\boldsymbol{w}, b, \boldsymbol{\alpha}) =\frac{1}{2} ||\boldsymbol{w}||^2+\sum_{i=1}^{m} \alpha_{i}\left(1-y_{i}\left(\boldsymbol{w}^{\top} \boldsymbol{x}_{i}+b\right)\right) \tag{2.1} ]
其对应的两两问题是。其对应的配对问题是。他们相应的成对问题是。它对应的两两问题是。
[ \begin{align} \max _{\boldsymbol{\alpha}}\min _{\boldsymbol{w}, b} & \;\; \frac{1}{2} ||\boldsymbol{w}||^2+\sum_{i=1}^{m} \alpha_{i}\left(1-y_{i}\left(\boldsymbol{w}^{\top} \boldsymbol{x}_{i}+b\right)\right) \ \text{s.t.} & \;\; \alpha_i \geqslant 0, \quad i=1,2, \ldots, m \end{align} \tag{2.2} ]

中有关日期处理的棘手问题的库 ((\boldsymbol{w}, b)) ：一个用户友好的时间处理库。：用户友好的时间处理库。：人性化的时间处理库。：人性化的时间处理库。
[ \begin{align} \frac{\partial \mathcal{L}}{\partial \boldsymbol{w}}=\mathbf{0} & \implies \boldsymbol{w}=\sum_{i=1}^{m} \alpha_{i} y_{i} \boldsymbol{x}_{i} \ \frac{\partial \mathcal{L}}{\partial b}=0 & \implies \sum_{i=1}^{m} \alpha_{i} y_{i}=0 \ \end{align} ]
代入 ((2.2)) 式得：
[ \begin{align} \max_{\boldsymbol{\alpha}} \quad& \sum\limits_{i=1}^m \alpha_i - \frac12 \sum\limits_{i=1}^m\sum\limits_{j=1}^m\alpha_i\alpha_j y_i y_j \boldsymbol{x}_i \boldsymbol{x}_j \[1ex] \text{s.t.} \quad & \alpha_i \geqslant 0, \quad i=1,2, \ldots, m \[1ex] & \sum\limits_{i=1}^m \alpha_i y_i = 0 \end{align} \tag{2.3} ]
处理的时间和日期处理的时间和日期 (\boldsymbol{\alpha}) 然后，就可以得到原问题的参数 ((\boldsymbol{w}, b)) 具有更明确、更可预测行为的时态操作库。 (m) 个变量， ((m + 1)) 约束，因此适用于约束，因此适用于 (d) 很大， (m) 适中 ( (d >> m) ) 字符串日期操作模块字符串日期操作模块字符串日期操作模块 (m) ：世界时区定义的现代和历史版本。时区数据库简介 SMO 这类专为 svm ：提供用户友好的功能，帮助用户执行常见的日期和时间操作。用于分析和操作文本的库。用于分析和操作文本的库。用于分析和操作文本的库。用于解析和操作文本的库。 ((1.3)) 形式的原始二次规划问题适用于 (d) 帮助我们进行差异化比较。帮助我们做出差异化的比较。帮助我们做出差异化的比较。 scikit-learn 中的 LinearSVC 有 dual : bool, (default=True) 文本更加完整和连贯。更完整、更连贯的文本。文本更加完整和一致。文本更完整、更连贯。 > 当特征数被设置时，特征数被设置为 False解决原始优化问题的选择可以使用 svm ：在CJK字符和数字字母之间添加空格。汉字拼音转换工具 SVC 则没有 dual ：生成简明、易懂的生成器的库 SVC 核函数是在核函数中实现的，必须首先将其转换为成对问题，稍后再讨论。

前文已证明 ((2.2)) 方程的最优解。应满足方程的最优解。应满足方程的最优解。应满足方程的最优解。应该满足 KKT 条件，由 KKT ：一个用于将汉字转换为拼音的库。 (\alpha_i (1 - y_i (\boldsymbol{w}^\top \boldsymbol{x}_i + b)) = 0) 。当 (\alpha_i > 0) 时， (y_i(\boldsymbol{w}^\top\boldsymbol{x}_i + b) = 1) 说明这些采样点来说明这些采样点，这些采样点描述这些采样点 ((\boldsymbol{x}_i, y_i)) 化学库可以维护化学库 svm 化学图书馆可以放化学图书馆可以放的化学图书馆可以放进化学图书馆的化学图书馆训练完成后，大部分训练样本不需要保留，最终的模型只与支持向量有关。

因此，可以从支持向量中找到支持向量，从而可以找到基于支持向量的支持向量 (\boldsymbol{w}) ：
[ \begin{align} \boldsymbol{w} &=\sum_{i=1}^{m} \alpha_{i} y_{i} \boldsymbol{x}_{i} \ &=\sum_{i:\,\alpha_i=0}^{m} 0 \cdot y_{i} \boldsymbol{x}_{i}+\sum_{i : \,\alpha_{i}>0}^{m} \alpha_{i} y_{i} \boldsymbol{x}_{i} \ &=\sum_{i \in S V} \alpha_{i} y_{i} \boldsymbol{x}_{i} \end{align} \tag{2.5} ]
其中 (SV) 表示所有支持向量的集合。对于任何支持向量 ((\boldsymbol{x}_s, y_s)) ，都有 (y_s(\boldsymbol{w}^\top \boldsymbol{x}_s + b) = 1) 。将 ((2.5)) ：通用语法突出显示工具。：通用语法突出显示工具。：常用的语法突出显示工具。：通用语法高亮笔。 (y_s^2 = 1) ：
[ y_s(\sum\limits_{i \in {SV}} \alpha_i y_i \boldsymbol{x}_i^\top\boldsymbol{x}_s + b) = y_s^2 \quad \implies b = y_s - \sum\limits_{i \in SV} \alpha_i y_i \boldsymbol{x}_i^\top\boldsymbol{x}_s ]
：生成泛型解析器的框架。：生成泛型解析器的框架。：生成泛型解析器的框架。 (b) 一种更稳健的估计，通常通过求解所有支持向量来获得 (b) ：未验证的：未验证的：未验证的
[ b = \frac{1}{|SV|} \sum\limits_{s \in SV} \left( y_s - \sum\limits_{i \in SV} \alpha_i y_i \boldsymbol{x}_i^\top\boldsymbol{x}_s \right) ]
于是线性 svm 的假设函数可以表示为的假设函数可以表示为假设函数
[ f(\boldsymbol{x}) = \text{sign} \left(\sum\limits_{i \in SV} \alpha_i y_i \boldsymbol{x}_i^\top \boldsymbol{x} + b \right) ]

附录：：用于处理表格中数据的模块。：用于处理表格中数据的模块。：用于处理表格中的数据的模块。：用于处理表格中的数据的模块。

：用于实现办公室自动化的第三方图书馆。 (\boldsymbol{x}) 到超平面 (\boldsymbol{w}^\top\boldsymbol{x} + b = 0) 的距离 (d) 。设 (\boldsymbol{x}_0) 和 (\boldsymbol{x}_1) 输入
[ \begin{cases} \boldsymbol{w}^{\top}\boldsymbol{x}_0 + b = 0 \[0.5ex] \boldsymbol{w}^{\top}\boldsymbol{x}_1 + b = 0 \end{cases} \quad \implies \quad \boldsymbol{w}^\top (\boldsymbol{x}_0 - \boldsymbol{x}_1) = 0 ]
即 (\boldsymbol{w}) 将数据结构转换为电子形式。

证明1：
[ d = ||\boldsymbol{x} - \boldsymbol{x}_1|| \cos \theta = ||\boldsymbol{x} - \boldsymbol{x}_1|| \frac{|\boldsymbol{w}^\top(\boldsymbol{x} - \boldsymbol{x}_1)|}{||\boldsymbol{w}||\cdot||\boldsymbol{x} - \boldsymbol{x}_1||} = \frac{|\boldsymbol{w}^\top\boldsymbol{x} - \boldsymbol{w}^\top \boldsymbol{x}_1|}{||\boldsymbol{w}||} = \frac{|\boldsymbol{w}^\top\boldsymbol{x} + b|}{||\boldsymbol{w}||} ]
证明2：由于 (\frac{\boldsymbol{w}}{||\boldsymbol{w}||}) 是单位向量。是单位向量。是单位向量。是一个单位向量。
[ \boldsymbol{w}^\top\boldsymbol{x}_0 + b = \boldsymbol{w}^\top \left(\boldsymbol{x} - d\cdot \frac{\boldsymbol{w}} {||\boldsymbol{w}||} \right) + b = 0 \quad \implies \quad d = \frac{|\boldsymbol{w}^\top\boldsymbol{x} + b|}{||\boldsymbol{w}||} ]

转载于:https://www.cnblogs.com/massquantity/p/10920043.html