====== QPC - Quality of Projected Clusters ( Projection Pursuit Index) ======
===== Najlepsza projekcja na prostą =====
Maksymalizujemy wartość indeksu\\
QPC(\vec{w}) = \sum_{i,j=1}^n \alpha_{ij}{ G\left(\vec{w}^T(\vec{x}_i-\vec{x}_j)\right)}
\\
gdzie:\\
$\alpha_{ij} jest stałą spełniającą warunek: jezeli C(\vec{x}_i) = C(\vec{x}_j) wówczas \alpha_{ij} > 0 oraz jeżeli C(\vec{x}_i) \ne C(\vec{x}_j) wówczas \alpha_{ij} < 0 \\
C(\vec{x}_i) zbór wektorów z taką samą etykietą jak wektor \vec{x}_i\\
G(x) funkcja lokalna posiadająca maksimum dla x=0\\
Przykłady funkcji G(x):\\
^ trójkątna |
G(x)= \left\{
\begin{array}{lll}
0 & \quad \textrm{dla} & \quad x < -b \\
\frac{x+b}{b} & \quad \textrm{dla} & \quad -b \le x < 0 \\
\frac{b-x}{b} & \quad \textrm{dla} & \quad 0 \le x < b \\
0 & \quad \textrm{dla} & \quad x \ge b \\
\end{array}
\right.
|
^ fx4 | G(x)=\frac{1}{1+(bx)^4} |
^ bicentralna | G(x)=\sigma(x+b)(1-\sigma(x-b)) |
Przyjmując wartości:\\
A^+ = \frac{1}{\#C_i} oraz A^- = \frac{1}{(N - \#C_i)} \\
czynniki symy będą warzone względem liczebności wektorów w klasach.
Maksymalną wartość indeks osiąga gdy wszystkie wektory są pogrupowane w oddzielne, oddalone od siebie klastry. \\
==== Przykłady projekcji ====
* [[.:qpc_ort:ppi_bicentral|Spadek gradnientu - funkcja bicentralna - dane UCI]]
* [[.:qpc_ort:qpc_toy_fx4|Spadek gradnientu - funkcja fx4 - dane sztuczne]]
* {{http://www.fizyka.umk.pl/~grochu/results/ppi/index.html|Poprzednie wyniki (data)}}
===== Poszukiwanie kolejnego kierunku - czynnik kary =====
Maksymalizujemy wartość indeksu\\
I_{\vec{w_1}}(X;\vec{w})= I(X;\vec{w}) - \lambda f_{\vec{w_1}}
\\
gdzie funkcja f(x) wprowadza zaburzenie zależne od kierunku w1 znalezionego gdy λ=0. \\
Wymagamy aby szukany kierunek różnił sie od poprzedniego\\
f_{\vec{w_1}} = ({\vec{w_1}}^T\vec{w})^4
==== Przykłady projekcji ====
* [[.:qpc_ort:ppi_ort_bicentral|Spadek gradientu - funkcja bicentralna - dane UCI]]
* [[.:qpc_ort:ppi_orto_toy_fx4|Spadek gradientu - funkcja fx4 - sztuczne dane]]
* [[projects:data:grid8x8:grid8x8|Grid Model data (sztuczne)]] ([[http://kdobosz.wikidot.com/gridmodel-data|opis danych]])
===== Optymalizacja dwóch projekcji jednocześnie =====
Maksymalizujemy wartość indeksu\\
I_s(X;\vec{w},\vec{u})= I_{\vec{u}}(X;\vec{w}) + I_{\vec{w}}(X;\vec{u})
\\
poszukując dwuch projekcji x i u.
==== Wykresy - dwa kierunki - Scatterplots ====
* [[.:qpc_w2_fx4|Spadek gradientu - funkcja fx4 - dane UCI]]
* [[.:qpc_2w_toy_fx4|Spadek gradientu - funkcja fx4 - sztuczne dane]]
===== Poszukiwanie kolejnego kierunku - ortogonalizacja danych =====
* [[.:qpc_ort:qpc_toy_fx4|Sonar - projekcje 1-10]]
===== QPC + Naive Bayes =====
* [[projects:models:qpc_and_naivebayes:sonar_dim1-10_cv|QPC+NB CV on Sonar]]
===== Szybkie QPC z prototypami =====
* [[projects:models:qpc:qpctrain_simple|FastQPC - Wizualizacje - dane UCI]]