New Page 1

Ekstrakcja reguł logicznych i selekcja cech za pomocą sieci neuronowych

UMK - logo

          Włodzisław Duch 

wduch

Katedra Informatyki Stosowanej,
Uniwersytet Mikołaja Kopernika,

Grudziądzka 5, 87-100 Toruń, Poland.

e-mail: id: wduch, na serwerze fizyka.umk.pl.

WWW: https://www.fizyka.umk.pl/~duch

 


Baza danych dla grzybów:

Dane z podręcznika opisującego różne gatunki grzybów.

22 cechy i 3 klasy: jadalne, trujące, nie polecane.
4208 (51.8%) jadalnych, 3916 (48.2%) niejadalnych.

Cechy (nazwy oryginalne): cap shape (6, e.g.. bell, conical,flat...), cap surface (4), cap color (10), bruises (2), odor (9), gill attachment (4), gill spacing (3), gill size (2), gill color (12), stalk shape (2), stalk root (7, many missing values), surface above the ring (4), surface below the ring (4), color above the ring (9), color below the ring (9), veil type (2), veil color (4), ring number (3), spore print color (9), population (6), habitat (7).

Zadanie: zidentyfikować grzyby jadalne, znleźć ważne cechy. W książce wyraxnie napisano, że nie ma prostej reguły, która na to pozwoli.

Przykładowe dane:

Mushroom-1 is: edible,convex,fibrous,yellow,bruises,anise,free,crowded, narrow,brown,tapering,bulbous,smooth,smooth,white,white, partial,white,one,pendant,purple,several,woods

Mushroom-2 is: edible,flat,smooth,white,bruises,almond,free,crowded, narrow,pink,tapering,bulbous,smooth,smooth,white,white, partial,white,one,pendant,purple,several,woods

Mushroom-3 is: edible,bell,smooth,white,bruises,almond,free,close,broad, white,enlarging,club,smooth,smooth,white,white,partial, white,one,pendant,black,scattered,meadows

Mushroom-4 is: poisonous,convex,smooth,white,bruises,pungent,free,close, narrow,white,enlarging,equal,smooth,smooth,white,white, partial,white,one,pendant,black,scattered,urban

Mushroom-5 is: poisonous,convex,smooth,white,bruises,pungent,free,close, narrow,pink,enlarging,equal,smooth,smooth,white,white, partial,white,one,pendant,black,several,urban

Mushroom-8000 is: poisonous,convex,smooth,white,bruises,pungent,free,close, narrow,pink,enlarging,equal,smooth,smooth,white,white, partial,white,one,pendant,brown,scattered,urban

Reguły dla jadalnych grzybów:

IF odor=(almond.or.anise.or.none).and.spore_print_color=not.green THEN edible
48 błędy, 99.41% prawidłowe

Reguły dla grzybów niejadalnych - 6 attributes only:

R1) IF odor=not(almond.or.anise.or.none) THEN poisonous
120 błędów, dokładność 98.52%

R2) IF spore_print_color=green THEN poisonous
48 błędów, 99.41% prawidłowe

R3) IF odor=none.and.stalk_surface_below_ring=scaly.and.stalk_color_above_ring=not.brown THEN poisonous
8 błędów, dokładność 99.90%

R4) IF habitat=leaves.and.cap_color=white THEN poisonous
nie ma błędów!


Zbiór danych Iris: 150 kwiatów Iris z 3 gatunków, pomiary długości i szerokości płatków dużych i małych, w cm.

5.1,3.5,1.4,0.2, Iris-setosa
4.9,3.0,1.4,0.2, Iris-setosa
4.7,3.2,1.3,0.2, Iris-setosa
4.6,3.1,1.5,0.2, Iris-setosa
5.0,3.6,1.4,0.2, Iris-setosa
5.4,3.9,1.7,0.4, Iris-setosa
4.6,3.4,1.4,0.3, Iris-setosa
5.0,3.4,1.5,0.2, Iris-setosa
4.4,2.9,1.4,0.2, Iris-setosa
4.9,3.1,1.5,0.1, Iris-setosa
6.3,3.3,4.7,1.6, Iris-versicolor
4.9,2.4,3.3,1.0, Iris-versicolor
6.6,2.9,4.6,1.3, Iris-versicolor
5.2,2.7,3.9,1.4, Iris-versicolor
5.0,2.0,3.5,1.0, Iris-versicolor
5.9,3.0,4.2,1.5, Iris-versicolor
6.0,2.2,4.0,1.0, Iris-versicolor
6.1,2.9,4.7,1.4, Iris-versicolor
5.6,2.9,3.6,1.3 ,Iris-versicolor
6.7,3.1,4.4,1.4, Iris-versicolor
5.6,3.0,4.5,1.5, Iris-versicolor
5.8,2.7,4.1,1.0, Iris-versicolor
6.2,2.2,4.5,1.5, Iris-versicolor
5.6,2.5,3.9,1.1, Iris-versicolor
6.3,2.9,5.6,1.8, Iris-virginica
6.5,3.0,5.8,2.2, Iris-virginica
7.6,3.0,6.6,2.1, Iris-virginica
4.9,2.5,4.5,1.7, Iris-virginica
7.3,2.9,6.3,1.8, Iris-virginica
6.7,2.5,5.8,1.8, Iris-virginica
7.2,3.6,6.1,2.5, Iris-virginica
6.5,3.2,5.1,2.0, Iris-virginica
6.4,2.7,5.3,1.9, Iris-virginica
6.8,3.0,5.5,2.1, Iris-virginica
5.7,2.5,5.0,2.0, Iris-virginica
5.8,2.8,5.1,2.4, Iris-virginica
6.4,3.2,5.3,2.3, Iris-virginica
6.5,3.0,5.5,1.8 Iris-virginica

Jakie reguły pozwalają na klasyfikację?

IF (x3 < 2.5) iris-setosa;
IF (x3 > 4.8) iris-virginica
ELSE versicolor

Bardzo proste 2 reguły dają tylko 3 błędy, 98.0% dokładności:

IF (x3=small) iris-setosa;
IF (x3=large.or.x4 =large) virginica
ELSE versicolor

gdzie small i large to pewne przedziały.

Dalsze wyniki, w tym większość dla danych medycznych.