Spis treści

QPC - Quality of Projected Clusters ( Projection Pursuit Index)

Najlepsza projekcja na prostą

Maksymalizujemy wartość indeksu
<latex> QPC(\vec{w}) = \sum_{i,j=1}^n \alpha_{ij}{ G\left(\vec{w}^T(\vec{x}_i-\vec{x}_j)\right)} </latex>
gdzie:
<latex>$\alpha_{ij}</latex> jest stałą spełniającą warunek: jezeli <latex>C(\vec{x}_i) = C(\vec{x}_j)</latex> wówczas <latex>\alpha_{ij} > 0 </latex> oraz jeżeli <latex> C(\vec{x}_i) \ne C(\vec{x}_j) </latex> wówczas <latex> \alpha_{ij} < 0 </latex>
<latex>C(\vec{x}_i)</latex> zbór wektorów z taką samą etykietą jak wektor <latex>\vec{x}_i</latex>
<latex>G(x)</latex> funkcja lokalna posiadająca maksimum dla x=0
Przykłady funkcji G(x):

trójkątna <latex>
 G(x)= \left\{ 
 \begin{array}{lll}
    0             & \quad \textrm{dla} & \quad x < -b \\ 
    \frac{x+b}{b} & \quad \textrm{dla} & \quad -b \le x < 0 \\
    \frac{b-x}{b} & \quad \textrm{dla} & \quad 0 \le x < b  \\
    0             & \quad \textrm{dla} & \quad x \ge b \\
 \end{array}
 \right.    

</latex>

fx4 <latex> G(x)=\frac{1}{1+(bx)4} </latex>
bicentralna <latex> G(x)=\sigma(x+b)(1-\sigma(x-b)) </latex>

Przyjmując wartości:
<latex>A^+ = \frac{1}{\#C_i}</latex> oraz <latex>A^- = \frac{1}{(N - \#C_i)}</latex>
czynniki symy będą warzone względem liczebności wektorów w klasach. Maksymalną wartość indeks osiąga gdy wszystkie wektory są pogrupowane w oddzielne, oddalone od siebie klastry.

Przykłady projekcji

Poszukiwanie kolejnego kierunku - czynnik kary

Maksymalizujemy wartość indeksu
<latex> I_{\vec{w_1}}(X;\vec{w})= I(X;\vec{w}) - \lambda f_{\vec{w_1}} </latex>
gdzie funkcja f(x) wprowadza zaburzenie zależne od kierunku w1 znalezionego gdy λ=0.
Wymagamy aby szukany kierunek różnił sie od poprzedniego
<latex> f_{\vec{w_1}} = ({\vec{w_1}}^T\vec{w})^4 </latex>

Przykłady projekcji

Optymalizacja dwóch projekcji jednocześnie

Maksymalizujemy wartość indeksu
<latex> I_s(X;\vec{w},\vec{u})= I_{\vec{u}}(X;\vec{w}) + I_{\vec{w}}(X;\vec{u}) </latex>
poszukując dwuch projekcji x i u.

Wykresy - dwa kierunki - Scatterplots

Poszukiwanie kolejnego kierunku - ortogonalizacja danych

QPC + Naive Bayes

Szybkie QPC z prototypami