====== QPC - Quality of Projected Clusters ( Projection Pursuit Index) ====== ===== Najlepsza projekcja na prostą ===== Maksymalizujemy wartość indeksu\\ QPC(\vec{w}) = \sum_{i,j=1}^n \alpha_{ij}{ G\left(\vec{w}^T(\vec{x}_i-\vec{x}_j)\right)} \\ gdzie:\\ $\alpha_{ij} jest stałą spełniającą warunek: jezeli C(\vec{x}_i) = C(\vec{x}_j) wówczas \alpha_{ij} > 0 oraz jeżeli C(\vec{x}_i) \ne C(\vec{x}_j) wówczas \alpha_{ij} < 0 \\ C(\vec{x}_i) zbór wektorów z taką samą etykietą jak wektor \vec{x}_i\\ G(x) funkcja lokalna posiadająca maksimum dla x=0\\ Przykłady funkcji G(x):\\ ^ trójkątna | G(x)= \left\{ \begin{array}{lll} 0 & \quad \textrm{dla} & \quad x < -b \\ \frac{x+b}{b} & \quad \textrm{dla} & \quad -b \le x < 0 \\ \frac{b-x}{b} & \quad \textrm{dla} & \quad 0 \le x < b \\ 0 & \quad \textrm{dla} & \quad x \ge b \\ \end{array} \right. | ^ fx4 | G(x)=\frac{1}{1+(bx)^4} | ^ bicentralna | G(x)=\sigma(x+b)(1-\sigma(x-b)) | Przyjmując wartości:\\ A^+ = \frac{1}{\#C_i} oraz A^- = \frac{1}{(N - \#C_i)} \\ czynniki symy będą warzone względem liczebności wektorów w klasach. Maksymalną wartość indeks osiąga gdy wszystkie wektory są pogrupowane w oddzielne, oddalone od siebie klastry. \\ ==== Przykłady projekcji ==== * [[.:qpc_ort:ppi_bicentral|Spadek gradnientu - funkcja bicentralna - dane UCI]] * [[.:qpc_ort:qpc_toy_fx4|Spadek gradnientu - funkcja fx4 - dane sztuczne]] * {{http://www.fizyka.umk.pl/~grochu/results/ppi/index.html|Poprzednie wyniki (data)}} ===== Poszukiwanie kolejnego kierunku - czynnik kary ===== Maksymalizujemy wartość indeksu\\ I_{\vec{w_1}}(X;\vec{w})= I(X;\vec{w}) - \lambda f_{\vec{w_1}} \\ gdzie funkcja f(x) wprowadza zaburzenie zależne od kierunku w1 znalezionego gdy λ=0. \\ Wymagamy aby szukany kierunek różnił sie od poprzedniego\\ f_{\vec{w_1}} = ({\vec{w_1}}^T\vec{w})^4 ==== Przykłady projekcji ==== * [[.:qpc_ort:ppi_ort_bicentral|Spadek gradientu - funkcja bicentralna - dane UCI]] * [[.:qpc_ort:ppi_orto_toy_fx4|Spadek gradientu - funkcja fx4 - sztuczne dane]] * [[projects:data:grid8x8:grid8x8|Grid Model data (sztuczne)]] ([[http://kdobosz.wikidot.com/gridmodel-data|opis danych]]) ===== Optymalizacja dwóch projekcji jednocześnie ===== Maksymalizujemy wartość indeksu\\ I_s(X;\vec{w},\vec{u})= I_{\vec{u}}(X;\vec{w}) + I_{\vec{w}}(X;\vec{u}) \\ poszukując dwuch projekcji x i u. ==== Wykresy - dwa kierunki - Scatterplots ==== * [[.:qpc_w2_fx4|Spadek gradientu - funkcja fx4 - dane UCI]] * [[.:qpc_2w_toy_fx4|Spadek gradientu - funkcja fx4 - sztuczne dane]] ===== Poszukiwanie kolejnego kierunku - ortogonalizacja danych ===== * [[.:qpc_ort:qpc_toy_fx4|Sonar - projekcje 1-10]] ===== QPC + Naive Bayes ===== * [[projects:models:qpc_and_naivebayes:sonar_dim1-10_cv|QPC+NB CV on Sonar]] ===== Szybkie QPC z prototypami ===== * [[projects:models:qpc:qpctrain_simple|FastQPC - Wizualizacje - dane UCI]]