A support vector machine (SVM) is an algorithm which finds a hyperplane that optimally separates labeled data points in $\mathbb{R}^n$ into positive and negative classes. The data points on the margin of this separating hyperplane are called support vectors. We connect the possible configurations of support vectors to Radon's theorem, which provides guarantees for when a set of points can be divided into two classes (positive and negative) whose convex hulls intersect. If the convex hulls of the positive and negative support vectors are projected onto a separating hyperplane, the projections intersect in at least one point if and only if the hyperplane is optimal. Further, with a particular type of general position, we show that (a) the projected convex hulls of the support vectors intersect in exactly one point, (b) the support vectors are stable under perturbation, (c) there are at most $n+1$ support vectors, and (d) every number of support vectors from 2 up to $n+1$ is possible. Finally, we perform computer simulations studying the expected number of support vectors, and their configurations, for randomly generated data. We observe that as the distance between classes of points increases for this type of randomly generated data, configurations with two support vectors become the most likely configurations.
翻译:支持矢量机( SVM) 是一种算法, 它会发现一种超大平面, 最佳地将正和负支持矢量的标签数据点分隔为$\mathb{R ⁇ n$的正和负类。 这个分离的超平面边距上的数据点被称为支持矢量。 我们将支持矢量的可能配置与Radon的定理连接起来, 这为当一组点可以分为两种( 正和负), 其锥体相互交错时提供了保障。 如果正和负支持矢量的结壳被投射到一个分离的超平面上, 预测会至少将一个点相交错, 如果而且只有在超平面是最佳的。 此外, 我们用一种特定的一般位置, 我们显示 (a) 支持矢量的预测矩的矩形结构在精确的某一点中, (b) 支持矢量在扰动中保持稳定, (c) 最多是 $+1美元的支持矢量, 并且 (d) 每一个支持的矢量从2美元到$+1美元, 美元, 如果超平面点是最佳的点,,, 就会进行计算机类型数据 的 的 的 的模拟数据在生成中, 最后, 我们对这个矢量的 将进行这种 的 的 的 的 的 的 的 进行 的 的 的 的 的 进行 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 做为 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的