[toc]
给定点集
Voronoi Diagrams 将
以下讨论在
- Voronoi Edges: 是两个区域的边界, 以一条线或线段表示.
$e_{i,j}={x\in R^2||x-s_i|=|x-s_|\le|x-s_l|, \forall l\not=i,j}$
- Voronoi Vertices: 到三个 site 距离恰好相等
$v_{i,j,l}={x\in R^2||x-s_i|=|x-s_i|=|x-s_l|\le|x-s_k|, \forall k\not=i,j,l}$
由于这样的划分是一个 平面图
, 根据欧拉公式, 对于 n 个 vertices, m 条 edges, k 个 faces 有:
但对于
转换关系
Voronoi Diagram | Delaunay Triangulation |
---|---|
face |
vertex |
vertex |
triangle face |
edge |
edge |
其特点是:
- 所有的 triangulation 中, 最大化所有三角形中最小角的 triangulation.
- circle property(P156, 看不懂)
Assignment-based Cluster:
给定点集 X, 距离
- k-means:
$$\mathrm{minimize} \sum\limits_{x\in X}\mathbf{d}(\phi_S(x),x)^2$$ - k-center:
$$\mathrm{minimize} \max_{x\in X}\mathbf{d}(\phi_S(x),x)$$ - k-median:
$$\mathrm{minimize} \sum\limits_{x\in X}\mathbf{d}(\phi_S(x),x)$$ - 直观上相当于拿几个球包住所有点, 要求半径最小(Minimun Enclosing Ball, MEB)
思路: 每次选离各自类中心(site)最远的点
即:
证明如下:
假设
令
- 若其恰好分别落在
$A_1,\cdots,A_k$ 里, 不妨设为$c_1\in A_1,\cdots,c_k\in A_k$ , 则由三角不等式可知$$P\subset \bigcup\limits_{j=1}^kB(c_j,2r_{opt})$$ - 若
$\exists c_j, c_{j'}\in A_l$ , 可设$c_1\in A_1,\cdots,c_i\in A_i, c_{i+1}\in A_t, 1\le t\le i$ - (a).
$$|c_{i+1}-c_t|\ge \min\limits_{1\le j\le i}|c_{i+1}-c_j|$$ - (b). 每次取最远的:
$$\min\limits_{1\le j \le i}|c_{i+1}-c_j| \ge \max\limits_{p\in\bigcup\limits_{j=i+1}^k A_j}{\min\limits_{1\le j \le i}|p-c_j|}$$ - (c).
$c_{i+1}$ 和$c_t$ 共属于一个$A_t$ :$$|c_{i+1}-c_t|\le r_{opt}$$
- (a).
(a) + (b) + (c) 即得
算法:
实现: 维护一个表以记录各个点到其最近 site 的距离$\phi[x]$. 每轮迭代中, 用
复杂度:
将
该算法是 4-approx 的.
- 本地 Gonzalez 得到
$P_t\subset \bigcup\limits_{j=1}^k B(c_j^t,2r_{opt})$ - 中心服务器则有 $\bigcup\limits_{t=1}^TC_t\subseteq\bigcup\limits_{j=1}^kB(\widetilde{c}j,2r{opt})$
故 $P=\bigcup\limits_{t=1}^T P_t\subseteq B(\widetilde{c}j, 4r{opt})$
设迭代次数是
不保证质量, 可以无限差(考虑一个很长的矩形的四个顶点)
若已知最优 cluster:
故期望近似比为 2.
由 Markov 不等式:
亦称
近似比期望:
时间复杂度:
目标: 找到关于 V 的一个划分
- 目标函数:
$\sum\limits_i\sum\limits_j\alpha_{ij}x_{ij}$ - 约束: $$ \begin{array}{l} A\left[\begin{array}{c}x_{11} \ \vdots \ x_{nn}\end{array}\right]\le b \ \ X 是 SD\ matrix, 即 X\succeq 0 \end{array} $$
(半正定: 满足
定义变量 $y_i=\left{\begin{array}{ll} +1 & if\ i\in S \ -1 & if\ i\notin S \end{array}\right.$
则目标函数为
可以放松
从而目标函数变为
- 利用 SDP 算法求解上式, 得到 X. 通过分解 X (Cholesky 分解)得到
${v_1,\cdots,v_k}\subseteq S_n$ - 在
$S_n$ 随机取向量$r$ - 令
$S={i|\left<v_i,r\right>\ge 0}$ ,$V\backslash S={i|\left<v_i,r\right>< 0}$
证明其能达到小于 1 的近似比.
因此 $$\begin{align*} &\quad E[w(S,V\backslash S)] \ &=\sum\limits_{i<j}w_{ij}\cdot Pr[sgn(\left<v_i,r\right>\not= sgn(\left<v_j,r\right>)] \ &=\frac{1}{\pi}\sum\limits_{i<j}w_{ij}\arccos(\left<v_i, v_j\right>) \end{align*}$$
进而 $$\begin{align*} &\quad \frac{E[w(S,V\backslash S)]}{OPT} \ &\ge \frac{\frac{1}{\pi}\sum\limits_{i < j}w_{ij}\arccos(\left< v_i, v_j \right>)}{\frac{1}{2}\sum\limits_{i < j} w_{ij}(1-\left< v_i,v_j \right>)} \ &\ge\frac{2}{\pi}\cdot\min\limits_{i < j}\left{\left.\frac{\arccos(\left< v_i,v_j \right>)}{1-\left< v_i, v_j \right>}\right|1\le i\le j\le n\right} \ &\ge\frac{2}{\pi}\cdot\min\limits_{i < j}\left{\left.\frac{\theta}{1-\cos\theta}\right|1\le i\le j\le n\right} \ &\approx 0.878 \end{align*}$$