Informacja o prowadzonych w jednostce w sposób ciągły badaniach naukowych i pracach badawczo-rozwojowych (z określeniem dyscyplin i kierunków).
Katedra Metod Komputerowych jest unikalną jednostką naukowo-dydaktyczną Uniwersytetu Mikołaja Kopernika. Podejmujemy
interdyscyplinarne programy badawcze oraz organizujemy specjalistyczne wykłady i seminaria dotyczące zastosowań metod komputerowych w naukach ścisłych i humanistycznych oraz w naukach o poznaniu (kognitywistyce). Współpracując z kadrą naukową z różnych dyscyplin naukowych - fizyki, chemii, biologii, nauk humanistycznych - dążymy do rozwinięcia różnych dziedzin nauk podstawowych i stosowanych, stosujących wyrafinowane metody komputerowe zarówno w zakresie obliczeń numerycznych (symulacyjnych) jak i zagadnień wymagających obliczeń symbolicznych i sztucznej inteligencji.Problematyk
a badawcza KMK skoncentrowana jest wokół kilku głównych tematów:1. Metod komputerowych w fizyce i chemii.
2. Metod sztucznej inteligencji a w szczególności szeroko pojętych zagadnień
modelowania sieci neuronowych.
3. Kognitywistyki (cognitive sciences)
i teorii układów złożonych (complex systems theory).4. Dydaktyki wspomaganej metodami komputerowymi.
W szczególności w 1997/98 roku rozwijaliśmy następujące tematy:
1. W zakresie metod komputerowych w fizyce i chemii
Prof. J. Wasilewski z współpracownikami prowadził badania w ramach tematu: “Struktura energetyczna małych cząsteczek”. Uczestniczył też w badaniach kierowanych przez prof. K. Jankowskiego z Instytutu Fizyki UMK, dotyczących nowych metod opisu efektów korelacji elektronowej w stanach nie
zamknięto-powłokowych atomów i cząsteczek. Prowadzone są również prace w zakresie symulacji komputerowych w fizyce atomowo-molekularnej, szczególnie nad modelowaniem oddziaływania cząsteczek z powierzchniami krystalicznymi.Dr J. Meller prowadził badania nad zastosowaniem metod obliczeniowych typu dynamiki molekularnej oraz metod uwzględniających korelację elektronową do badania cząsteczek o znaczeniu biologicznym, w ramach badań własnych i statutowych, współpracując z ośrodkami zagranicznymi w Japonii, Fra
ncji i Izraelu. Dr Meller przebywał od listopada 1997 roku na Uniwersytecie Kyoto jako stypendysta Japan Society for Promotion of Science (JSPS) i pozostanie tam do końca 1999 roku.Do spółki z współpracownikami z siedmiu krajów Europy realizowano interdyscyplinarny projekt finansowany w 1997 roku w oparciu o grant komisji Unii Europejskiej w ramach współpracy COST. Projekt dotyczy inteligentnego oprogramowania dla potrzeb chemii komputerowej, a więc połączenia oprogramowania do zastosowań numerycznych z s
ystemami ekspertowymi i sieciami neuronowymi w celu stworzenia systemu ułatwiającego wykonywanie obliczeń chemikom, którzy nie są ekspertami w zakresie metod chemii komputerowej. Temat ten wiąże numeryczne metody komputerowe z metodami sztucznej inteligencji i wchodzi w zakres pracy doktorskiej realizowanej w KMK. Prof. Duch jest zastępcą kierownika tego projektu (prof. Diercksena z Instytutu Astrofizyki Maxa Plancka, Garching k. Monachium).Słowa kluczowe i dyscypliny pokrewne:
fizyka teoretyczna, fizyka komputerowa, chemia kwantowa, chemia teoretyczna, chemia komputerowa, dynamika molekularna, symulacje komputerowe.
2. W zakresie metod sztucznej inteligencji a w szczególności szeroko pojętych zagadnień modelowania sieci neuronowych.
Prace nasze dotyczą teorii i zastosowań algorytmów typu sieci neuronowych, logiki rozmytej, rozpoznawania obiektów (pattern recognition) i algorytmów opartych na śladach pamięci (memory-based), oraz fundamentalnych mechanizmów działania struktur adaptujących się, w tym również zagadnień związanych z działaniem mózgu i modelowaniem umysłu. Prof. Duch wraz z asystentami, doktorantami i magistrantami prowadzi prace nad uniwersalnym systemem neurorozmytym, Feature Space Mapping (FSM). Jest to system uczący się tak, jak sieci neuronowe a jednocześnie zdolny do korzystania z reguł logiki rozmytej, pozwalających na sekwencyjne procesy rozumowania wraz z użyciem predefiniowanej wiedzy w modelach uczących się, podobnie jak robi się to w systemach ekspertowych. Testowano i rozwijano oprogramowanie systemu FSM opartego na własnym, oryginalnym podejściu do systemów neurorozmytych, zainspirowanym przez model umysłu oparty na przestrzeniach psychologicznych. Prace te wspierane były przez zakończony w 1997 roku grant indywidualny KBN “Teoria i zastosowania systemów neurorozmytych”. Bardzo rozwinęliśmy metody ekstrakcji reguł logicznych z danych treningowych za pomocą sieci neuronowych i metod globalnej optymalizacji. Oprócz systemu FSM stosujemy w tym celu nowe algorytmy dla wielowarstwowych perceptronów trenowanych metodą wstecznej propagacji. Wyniki prezentowane były na sesjach specjalnych kilku prestiżowych konferencjach naukowych i w pracy napisanej na zamówienie pisma “Journal of Advanced Computational Intelligence”. Nasze rezultaty przechowywane są już w dostępnym przez Internet repozytorium baz danych do testowania metod uczenia maszynowego na Uniwersytecie Irvine w Kalifornii. Prof. Duch w 1997 roku zorganizował dwie sesje specjalne poświęcone metodom wyciągania reguł logicznych na międzynarodowych konferencjach. Otrzymaliśmy nowy grant KBN na zastosowanie sieci neuronowych i innych metod do analizy danych medycznych oraz na badania teoretyczne nad ontogenicznymi sieciami neuronowymi.
Pracujemy też nad metodami samoorganizacji i wizualizacji wielowymiarowych danych. Metody te, wyrastające z modelu samoorganizującej się sieci neuronowej Kohonena, powiązaliśmy z procedurami minimalizacji miar zgodności topograficznej przestrzeni danych i niskowymiarowych przestrzeni siatek neuronów (skalowaniem wielowymiarowym i podobnymi nieliniowymi transformacjami). Pracujemy nad oprogramowaniem, które pozwoli nam zobaczyć brzegi obszarów decyzji dowolnego klasyfikatora w dowolnej liczbie wymiarów. Wykonaliśmy testy porównawcze różnych wersji metod wizualizacji wielowymiarowych danych, stosując je miedzy innymi do klasyfikacji w zagadnieniach psychometrycznych. Naszym celem jest stworzenie wygodnego systemu do klasyfikacji, analizy i wizualizacji danych biomedycznych i innych. Badania te prowadziliśmy częściowo przy współpracy z laboratorium “VisieLab” Uniwersytetu w Antwerpii (RUCA), gdzie na rocznym stażu naukowym przebywał Antoine Naud, asystent w naszej Katedrze.
Słowa kluczowe i dyscypliny pokrewne: sieci neuronowe, sztuczna inteligencja, logika rozmyta, reguły logiczne, analiza danych, systemy neurorozmyte, rozpoznawanie obiektów, systemy eksperckie, biocybernetyka, kognitywistyka, nauki o poznaniu, badania nad mózgiem, symulacje komputerowe.
3. W zakresie kognitywistyki (cognitive sciences) i teorii układów złożonych (complex systems theory)
.Część naszych wysiłków badawczych skierowana została w stronę kognitywistyki (nauk o poznawaniu) i próby stworzenia empirycznej teorii umysłu w oparciu o modele sieci neuronowych. Teoria ta powinna nie tylko być pomocną w rozwiązaniu podstawowych problemów nauk o poznaniu lecz również prowadzić do nowych konstrukcji systemów uczących się i w tym kierunku zmierzają nasze badania. Jej zarysy, w postaci hipotez określających prawdopodobne związki pomiędzy zdarzeniami
w mózgu i ich korelacji z percepcją, wyższymi czynnościami poznawczymi i treścią świadomości zostały już nakreślone w kilku pracach i wystąpieniach konferencyjnych. Matematyczne metody opisu zdarzeń mentalnych wiążą się z teorią układów złożonych w zastosowaniu do sieci neuronowych z rekurencją. Prof. Duch napisał rozdział pt. “Platonic theory of mind as an approximation to neurodynamics” do książki “Brain-like Computing and Intelligent Information Systems”, wydanej przez prof. Amari i Kasabova, dwóch bardzo wybitnych specjalistów w zakresie sieci neuronowych. Platoński model umysłu zastosowany został do wyjaśnienia zagadnień dotyczących kategoryzacji w psychologii poznawczej. Rozpoczęliśmy współpracę z Instytutem Badań Psychologicznych Maxa Plancka w Monachium nad integracją sensomotoryczną, gdzie prof. Duch przebywał latem 1997 roku na miesięcznym stażu.Pracujemy nad integracją metod uczenia maszynowego (machine learning, ML) i neuronowych metod uczenia, opracowując ogólne podejście w którym metody rozpoznawania obiektów i sieci neuronowe są szczególnymi przypadkami. Integracja mało obecnie znanych metod uczenia maszynowego daje bardzo ciekawe rezultaty i kierunek ten zamierzamy rozwijać w najbliższych kilku latach. Pierwsza praca na ten temat przedstawion
a została na sesje specjalnej w czasie World Congress of Computational Intelligence w Anchorage na Alasce. Szukamy alternatywnych podejść do adaptacji i opisu działania sieci neuronowych, wykorzystujących metody statystyczne, metody teorii estymacji, metody oparte na lokalnych, nieliniowych transformacjach układów współrzędnych. Pracujemy również nad modelami wykorzystującymi procesy Markowa (modele HMM i DFA, Discrete Finite Automata) oraz metodami dynamiki symbolicznej do aproksymacji dynamiki sieci neuronowych z rekurencją. Pozwala to na opis zachowania się sieci w postaci ewolucji automatów skończonych a w niektórych przypadkach w postaci reguł logicznych. Metody te są bardzo ważne dla zastosowań teorii układów złożonych (układy dynamiczne, samoorganizujące się stany krytyczne i chaotyczne) do zagadnień kognitywistyki i nauk przyrodniczych. W szczególności badamy metody upraszczania opisu złożonych układów dynamicznych, takich jak zbiór neuronów, zamierzając znaleźć serię systematycznych przybliżeń, pozwalająca na uzasadnienie przejść pomiędzy modelami na różnym poziomie szczegółowości (od zjawisk bioelektrycznych na błonach komórkowych do opisu dużych grup neuronów). Mamy nadzieję na stworzenie dobrego, opartego na sieciach neuronowych, modelu tworzenia się reprezentacji mentalnych.Przy współpracy z logikami, filozofami i pedagogami z UMK utworzyliśmy nowe pismo, “Kognitywistyka i media w edukacji”, którego pierwszy numer ukaże się latem 1998. Pismo to ma na celu integrację środowiska osób interesujących się kognitywistyką w Polsce. Prof. Duch pracuje nad serią książek stanowiących wprowadzenie do tej dziedziny, pierwsza z nich powinna zostać złożona do druku jeszcze w 1998 roku. Wspólnie z pracownikami z innych jednostek UMK dążymy do powołania (w roku a
kademickim 1998/99) specjalizacji kognitywnej w ramach filozofii oraz nowego, interdyscyplinarnego kierunku studiów specjalnych w tym zakresie.Słowa kluczowe i dyscypliny pokrewne:
kognitywistyka, modele umysłu, układy złożone, układy dynamiczne, dynamika symboliczna, fizyka teoretyczna, teoria informacji, symulacje komputerowe, matematyka stosowana, biocybernetyka, sieci neuronowe z rekurencją.
4. Badania w zakresie dydaktyki wspomaganej metodami komputerowymi.
Badania w tym zakresie rozpoczęto w ramach programu “Komputerowo wspomagana edukacja” finansowanego przez biuro TEMPUS (1992-1995), są one kontynuowane również po zakończeniu tego projektu. Wykonywaliśmy prace w zakresie komputerowych metod wspomagania dydaktyki, zastosowania hipertekstu i technik
multimedialnych w edukacji, a w szczególności w nauczaniu matematyki, fizyki i chemii teoretycznej. W ramach indywidualnego grantu programu Tempus mgr Halina Małłek odbyła 3-miesięczny staż na Uniwersytecie w Manchester, Anglia pracując nad multimedialnym oprogramowaniem do nauczania matematyki stosowanej i fizyki. Czynnie włączyliśmy się również do formułowania nowych programów nauczania nauk komputerowych (computational science) oraz do reformy programu nauczania przedmiotów o charakterze informatycznym na Wydziale Fizyki i Astronomii UMK, za która odpowiedzialny jest prof. Wasilewski z naszej Katedry. Utrzymujemy strony WWW dotyczące wszystkich spraw związanych z komputerami, fizyką komputerową, sieciami neuronowymi, sztuczną inteligencją, kognitywistyką, badaniami nad mózgiem. Ze stron tych korzysta bardzo wiele osób.Słowa kluczowe i dyscypliny pokrewne
: dydaktyka fizyki, dydaktyka matematyki, dydaktyka chemii teoretycznej, pedagogika, fizyka komputerowa, symulacje środowiska naturalnego, multimedia w nauczaniu.
Załącznik nr 2
Raport
z działalności statutowej
Katedry Metod Komputerowych
w roku 1997
Opis merytoryczny realizowanych prac
W ramach działalności statutowej pracowaliśmy nad następującymi tematami:
I. Rozwój metod komputerowych w fizyce i chemii.
Główni wykonawcy: prof. J. Wasilewski i dr J. Meller, finansowanie - działalność statutowa, badania własne i granty indywidualne.
I.1 Teoretyczne badania struktury energetycznej małych cząsteczek (prof. Wasilewski).
Kontynuowano bada
nia stanów oscylacyjnych i efektów sprzężenia oscylacyjno-rotacyjnego w małych cząsteczkach metodami wykraczającymi poza elementarne przybliżenie harmoniczne. Rozpoczęto także badania stanów oscylacyjno-rotacyjnych metodami pseudospektralnymi. Wymieniona tematyka wchodzi m. innymi w zakres pracy doktorskiej mgr S. Zelka Zastosowanie technik wielociałowych w badaniach oscylacji molekularnych.
I.1.1. Badano punkty stacjonarne na singletowych i trypletowych powierzchniach energetycznych cząsteczki
SO2 . Zastosowano podejścia typu CAS SCF i DFT, oraz bazy funkcyjne wysokiej jakości. Ogólną charakterystykę rodziny stanów walencyjnych tego układu w ramach grupy C2v przedyskutowano na podstawie diagramu Walsha, i porównano na tym poziomie z izowalencyjną cząsteczką ozonu, O3. W obu wypadkach stwierdzono analogiczne nieciągłości energii orbitalnych dla pośrednich wartości kąta walencyjnego, które umożliwiają precyzyjną lokalizację i wyjaśnienie genezy poszczególnych minimów i barier energetycznych. Na poziomie CAS SCF uzyskano dobre odtworzenie energii adiabatycznych przejść elektronowych, parametrów widma oscylacyjnego (z uwzględnieniem efektów anharmonicznych), oraz stabilności poszczególnych stanów względem symetrycznych (S + O2) i asymetrycznych (SO + O) kanałów dysocjacji. Badania przy wykorzystaniu metod typu DFT są kontynuowane.Publikacja (S. Zelek, J. Wasilewski) w przygotowaniu.
I.1.2. W ramach szeregu metod typu MO (RHF, UHF, ROHF, CAS SCF, MP2) i DFT (S-VWN, B-LYP) badano względną stabilność izomerów układ
u H2CO2. Izomery te: peroxy-methylene (I), dioxirane (II, C2v), methylene-bis(oxy) (III, C2v) i kwas mrówkowy (IV, formic acid) są m. innymi produktami oddziaływania rodnika metylowego (CH2, 3B1) i tlenu molekularnego (O2, 3Sg-), np. w płomieniu acetylenowym. W wyniku oddziaływania powstać mogą produkty zarówno w stanach singletowych, jak i trypletowych. Jako wynik przeprowadzonych obliczeń (w bazie typu DZP) stwierdzono, że w stanach singletowych stabilność układów wzrasta w kolejności I, II, IV; III nie jest układem stabilnym, w symetrii C2v dysocjuje na CO2 i H2, a po zniesieniu ograniczeń symetrii przechodzi w IV. W stanach trypletowych II i III nie są odróżnialne, I i IV przechodzą w konformacje niepłaskie, powyżej odpowiednich stanów singletowych. Względne stabilności obliczone metodami MP2 i B-LYP są w porównywalnej zgodności z danymi literaturowymi, w metodach nieskorelowanych stabilności te są generalnie za niskie, w przybliżeniu lokalnym (S-VWN) - za wysokie.
Publikacja: J. Wasilewski, M. Wierzbowska, Relative stability of the H2CO2 isomers: A Comparison of WFT and DFT Approaches
wysłana do druku; wyniki zaprezentowano na konferencji DFT-97, Wiedeń, 9.97 i sympozjum FAMO, Toruń, 2.98.
I.1.3. W ramach współpracy z prof. J. Heldtem (WSP Słupsk) podjęto badania teoretyczne niższych stanów elektronowych glioksalu (C
2O2H2) przy zastosowaniu różnych wariantów metody funkcjonałów gęstości (DFT). Podejście takie zastosowane także z dobrym wynikiem do otwartpowłokowego stanu singletowego; tego typu zastosowania są w literaturze nieliczne. Obliczenia teoretyczne mają na celu interpretację wyników doświadczalnych, otrzymanych przez prof. Heldta w ramach współpracy międzynarodowej najnowszą techniką "zwolnionej fluorescencji" (slow fluorescence).Publikacja
(J. Heldt, J. Wasilewski, S. Zelek) w przygotowaniu, wyniki zaprezentowano na konferencji fizyki komputerowej, Kraków, 11.97 i na sympozjum FAMO, Toruń, 2.98.
I.1.4. Podjęto szczegółowe badania nad modelowaniem zjawisk powierzchniowych w kryształach jonowych i nad teoretyczną analizą procesów oddziaływania małych cząsteczek z takimi powierzchniami. Badania te rozpoczęte zostały w ramach 3 miesięcznego stażu prof. Wasilewskiego w roku 1996 na Uniwersytecie w Bochum (RFN), w kierowanym przez prof. V. Staemmlera
Graduirtenkolleg “Dynamische Processe an Festkoerperoberflaechen”. Tematem było modelowanie oddziaływania tlenu atomowego i molekularnego z powierzchnią Cr2O3 (0001). Zastosowana została technika “embedded cluster” i metoda Hartree-Focka. Badania te są kontynuowane w Toruniu, także przy wykorzystaniu metody funkcjonałów gęstości (DFT), i są przedmiotem pracy doktorskiej mgr M. Wierzbowskiej (przewód doktorski: Oddziaływanie małych cząsteczek z powierzchniami kryształów jonowych został otwarty 28.05.1997). Zastosowano modele elektrostatyczne dla opisu stwierdzonej doświadczalnie kontrakcji struktury kryształu przy powierzchni i redystrybucji ładunku elektrycznego. Przebadano szereg modeli pola Madelunga o różnych rozmiarach i kształtach. Wstępne wyniki zostały zaprezentowane na konferencji DFT-97 w Wiedniu, 9.97, i na konferencji fizyki komputerowej w Krakowie, 11.97. Mgr Wierzbowska przebywała na 3-miesięcznym stażu (1.3-31.5.1998) w zespole prof. Staemmlera.I. 2. Opracowanie nowych metod opisu efektów
korelacji elektronowej w stanach niezamknięto-powłokowych (grant KBN kierowany przez prof. K. Jankowskiego z Instytutu Fizyki UMK, uczestniczy w nim prof. Wasilewski).
Prowadzone były badania układów modelowych w ramach nowych wersji wieloreferencyjnych metod sprzężonych klasterów (MRCC - Multi-Reference Coupled Clus_ters) w sformułowaniach walencyjnie-uniwersalnym, stanowo-uniwersalnym i stanowo-specyficznym. Badania dotyczyły wpływu bazy jednocząstk
owej (formy orbitali molekularnych) na zbieżność rozwinięcia klasterowego dla stanów podstawowych i wzbudzonych, ze szczególnym uwzględnienie występowania tzw. stanów obcych ("intruderów").Publikacja: Jankowski K, Kowalski K, Rubiniec K., Wasilewski J, Model study of the impact of orbital choice on the accuracy of Coupled Cluster energies: Single-reference-state formalism.
Int. J. Quantum Chem. - wysłana
I.3. Symulacje komputerowe w fizyce atomowo-molekularnej (badania własne, prof. Wasilewski).
Prowad
zono prace rozpoznawcze i studialne w następujących kierunkach: oddziaływanie tlenu molekularnego z atomami i małymi cząsteczkami; zastosowanie różnego typu funkcjonałów mieszanych w metodzie DFT; zastosowanie metod DFT do opisu stanów otwartopowłokowych; zastosowanie reprezentacji zmiennej dyskretnej (DVR - Discrete Variable Representation) do numerycznego wyznaczania poziomów oscylacyjno-rotacyjnych małych cząsteczek.
I.3.1. Wykonano obliczenia krzywych potencjalnych dla stanów X 2
S1/2, A 2P1/2 układów HeNe+, HeAr+. Zastowano metodę funkcjonałów gęstości w wariancie “adiabatycznej kontynuacji“, dokonując reparametryzacji oryginalnego funkcjonału Becke'go B3. Użyto wysokiej klasy bazy funkcyjne typu cc-pVQZ (klasa “quadruple-zeta“), specjalnie poszerzone dla dobrego opisu polaryzowalności He w polu jonów dodatnich atomów ciężkich; uwzględniono sprzężenie spin-orbita. Otrzymane krzywe potencjalne użyte zostały do wyznaczenia (metodą całkowania numerycznego) rodzin poziomów oscylacyjno-rotacyjnych, i na tej podstawie, poprzez analizę Dunhama - zestawów stałych molekularnych charakteryzujących poszczególne stany elektronowe. Stosując stosunkowo proste i niekosztowne podejście typu DFT uzyskano ostatecznie odtworzenie znanych doświadczalnie wartości stałych molekularnych z dokładnością porównywalną z najlepszymi wynikami innych autorów, obliczonymi przy użyciu najbardziej zaawansowanych metod molekularnej mechaniki kwantowej.Publikacja: M. Siódmiak, J. Wasilewski, DFT calculations for the X 2
S1/2, A 2P1/2 states of HeNe+ and HeAr+ - w przygotowaniu, wyniki zaprezentowano na konferencji EPS młodych fizyków w Wiedniu, 8.97
I.3.2. Przeprowadzono wstępne badania nad modelowaniem elementarnych procesów prowadzących do powstawania tzw. reaktywnych form tlenu (RFT), odgrywających istotną role w wielu procesach chorobowych. Badano tzw. cyklu Fentona (rozpad H
2O2 pod działaniem O2- katalizowany jonami Fe2+/3+), przyjmowany obecnie jako podstawowy mechanizm generowania rodników wodorotlenowych (OH.) w organizmach aerobowych. Zastosowane zostały metody HF i DFT. Badania będą kontynuowane, konieczne jest bowiem uwzględnienie środowiska wodnego, w którym reakcja ta zachodzi w warunkach fizjologicznych.
Praca magisterska (pod kierunkiem J. Wasilewskiego, specjalność: chemia środowiska): Juźków K,
Cykl Fentona. Badania z zastosowaniem metody DFT, Katedra Metod Komputerowych, UMK Toruń, 1997.
I.3.3. W oparciu o literaturę (prace grupy Lighta) zbudowano zespół programów komputerowych realizujących podejście
Discrete Variable Representation (DVR) do numerycznego wyznaczania poziomów oscylacyjnych cząsteczek dwu- i trój-atomowych. Przebadano stabilność numeryczną algorytmów w róznych warunkach. W podejściu DVR wyznaczono poziomy oscylacyjno-rotacyjne układów HeNe+ i HeAr+, oraz poziomy oscylacyjne (z pełnym uwzględnieniem efektów anharmonicznych i ruchów o dużych amplitudach) układów LiCN, LiNC, HNS, HSN, SO2. Wyniki tych obliczeń włączone zostaną do kilku publikacji.
Praca magisterska (pod kierunkiem J. Wasilewskiego, specjalność: fizyka komputerowa): Cyrnek L.,
Reprezentacja zmiennej dyskretnej w badaniach oscylacji molekularnych, Katedra Metod Komputerowych, UMK Toruń, 1998.Wstępne wyniki zaprezentowane zostały na konferencji FAMO, Toruń, 2.98.
I.4. Inne prace dotyczące teoretycznego badania struktury energetycznej małych cząsteczek (prof. Wasilewski):
Wygłoszonych zostało kilka referatów na seminariach międzynarodowych. Regularnie odbywało się seminarium naukowe Metody komputerowe w badaniach układów wieloatomowych
, prowadzone wspólnie z Zakładem Chemii Teoretycznej i Zakładem Chemii Kwantowej (Wydział Chemii UMK); członkowie zespołu prof. Wasilewskiego wygłosili na nim w omawianym okresie w sumie 14 referatów.
I.5. Rozwój i zastosowania metod oddziaływania konfiguracyjne
go (badania statutowe, kierownik dr J. Meller).W 1997 roku kontynuowano prace nad rozwojem i zastosowaniami metod obliczeniowych w fizyce molekularnej, a w szczególności:
I.5.1. Zastosowano metody dynamiki molekularnej (przy współpracy z R. Elberem z z Centrum Fritza Habera Uniwersytetu Hebrajskiego w Jerozolimie) do symulacji oddziaływania cząsteczki tlenku węgla z mioglobiną. W druku ukazała się praca:
J. Meller, R. Elber, Computer Simulations of Carbon Monoxide Photodissociation in Myoglobin: Structural Interpretation of the B states. Biophysical Journal 74 (1998) 789-802
Elber R, Meller J, Folding of a small peptide: path integral technique using the Onsager-Machlup action (w druku)
I.5.2 Przy współpracy z grupą z Laboratorie Physique Quantique, Paul Sabatier Universite, rozwijano kilka wersji rozszerzeń metody CI korygujących jej ekstensywność w sposób zbliżający ją do metod sprzężonych klasterów. Laboratorie Physique Quantique jest najbardziej znaną grupą fran
cuską zajmującą się rozwojem metod chemii komputerowej. Mgr J. Meller odbył staż w Lab. Physique Quantique, na Paul Sabatier Universite w Tuluzie.Meller J, Malrieu J.P, Heully J.L, Size-consistent multireference CI method through the dressing of the norm of determinants (w druku)
I.5.3. Przy współpracy z Instytutem Chemii Uniwersytetu w Kyoto rozpoczęto pracę nad zastosowaniem metod oddziaływania konfiguracyjnego do opisu stanów wzbudzonych cząsteczek o znaczeniu biologicznym. Dr Meller przebywać będzie na stażu na tym uniwersytecie do końca 1999 roku.
II. Rozwój teorii i zastosowań
metod sztucznej inteligencji a w szczególności szeroko pojętych zagadnień modelowania sieci neuronowychKierownik prof. W. Duch, finansowanie - badania statutowe i granty KBN.
W ramach rozwoju teorii inteligencji obliczeniowej, a szczególnie sieci neuronowych i metod sztucznej inteligencji opartych na logicznym opisie danych pracowaliśmy nad kilkoma tematami.
II.1. Rozwój i zastosowania systemu FSM (Feature Space Mapping)
P
oszukiwanie empirycznej teorii umysłu dającej odpowiedzi na tysiące szczegółowych pytań i wyjaśniającej wyniki licznych eksperymentów neuropsychologów i psychologów poznawczych można sformułować jako precyzyjnie określone zagadnienie aproksymacji działania grup neuronów i tworzenia reprezentacji wewnętrznych w przestrzeniach cech (feature spaces, knowledge spaces). Realizacja takich modeli prowadzi do szczególnego rodzaju systemów uczenia maszynowego jakimi są systemy neurorozmyte. Jest to bardzo obiecujący kierunek badań, wymagający integracji wiedzy z wielu dziedzin. W ostatnich latach znajdujemy coraz więcej potwierdzeń słuszności takiego podejścia, próbując ogarnąć jego powiązania z wieloma dziedzinami nauki. Te rozważania stały się dla nas inspiracją do rozwoju modelu Feature Space Mapping.Znacznie rozwinięto teorię jak i oprogramowanie systemu FSM (prace wspierane przez grant KBN, zakończony w 1997 roku). Jest to uniwersalny system neurorozmyty oparty na ogólnych przesłankach teoretycznych wynikających ze wspomnianego już podejścia do modelowania umysłu. System ten można traktować jako typową sieć neuronową, system oparty na śladach pamięci integrujący dwa podstawowe modele kategoryzacji w psychologii (teorię prototypów i teorię egzemplarzy) jak i syst
em logiki rozmytej korzystający z zależnych od kontekstu funkcji przynależności (wydaje się, że jest to nowe, wprowadzone przez nas pojęcie w teorii zbiorów rozmytych). Zagadnienia związane z rozwojem tego systemu w zastosowaniach do aproksymacji i klasyfikacji są związane pracami doktorskimi N. Jankowskiego i Rafała Adamczaka, oraz kilkoma pracami magisterskimi.W 1997 roku zaimplementowaliśmy i przetestowaliśmy bardzo efektywny sposób inicjalizacji parametrów adaptacyjnych sieci FSM (można go zastosować również w sieciach RBF). Testowaliśmy nowe funkcje transferu realizowane przez neurony, w tym funkcje uniwersalne, dające zarówno zlokalizowane jak i zdelokalizowane gęstości – zagadnienie to jest mocno niedoceniane wśród ekspertów od sieci neuronowych, a
jak stwierdziliśmy czasami zmiana funkcji transferu może prowadzić do znacznie prostszej struktury sieci o mniejszej liczbie parametrów adaptacyjnych. Funkcje biradialne pozwalają na płynne przejście do funkcji prostokątnych, dzięki czemu sieć FSM wykorzystaliśmy również do ekstrakcji reguł logicznych oraz interpretacji decyzji sieci w oparciu o reguły logiczne. Rozwiązaliśmy i wykonaliśmy testy dla bardzo ważnego zagadnienia obrotów gęstości prawdopodobieństwa w dowolnej liczbie wymiarów, i to zarówno na etapie inicjalizacji, gdzie pozostawiamy uproszczoną macierz obrotu nie dokonując dalszej optymalizacji jej parametrów (wersja przetestowana), jak i adaptacji parametrów w czasie uczenia. Za pomocą N parametrów możemy dokonać obrotu gęstości w N-wymiarowej przestrzeni.Sieć FSM zastosowaliśmy do zagadnień klasyfikacji danych medycznych i innych, osiągając bardzo dobre wyniki. Pracujemy nad przekształceniem systemu FSM w narzędzie do automatycznej klasyfikacji, analizy i wizualizacji danych. Opracowany został prosty interfejs graficznym do naszego oprogramowania, działający zarówno w środowisku Unixowym (Solaris, Linux) jak i pod Windows 95/NT.
Publikacje związane z tematem:
Duch W, Jankowski N,
New neural transfer functions. Applied Mathematics and Computer Science 7 (1997) 639-658Duch W, Adamczak R, Jankowski N, New developments in the Feature Space Mapping model, Third Conference on Neural Networks and Their Applications, Kule, October 1997, pp. 65-70, oraz dłuższa wersja: CIL-KMK-2/97, Computational Intelligence Lab. Technical Report
Duch W, Adamczak R, Jankowski N, Initialization of adaptive parameters in density networks, Third Conference on Neural Networks and Their Applications, Kule, October 1997, pp. 99-104
II.2. Inicjalizacja parametrów i dobór architektur sieci neuronowych.
Jednym z największych problemów w rozwoju zastosowań sieci neuronowych, powodującym trudności w zbieżności algorytmów uczenia się oraz problemy z doborem właściwej architektury jest brak dobrych metod inicjalizacji parametrów sieci. Początkowo prowadziliśmy prace nad inicjalizacją sieci FSM z estymacją gęstości w oparciu o metody wstępnej klasteryzacji, uzyskując w ten sposób bardzo dobre wyniki. Następnie udało się nam sformułować bardzo efektywną metodę inicjalizacji dla sieci
typu MLP. W ostatnim okresie do inicjalizacji zastosowaliśmy również znane z statystyki wielowymiarowej metody dyskryminacji Fishera i dyskryminacji liniowej. Metody te określają zarówno liczbę neuronów, wagi, progi a także pozwalają na optymalizację nachyleń sigmoid dla indywidualnych neuronów. W niektórych przypadkach po inicjalizacji sieć rozwiązuje problemy klasyfikacyjne bez dalszego uczenia się. W bardziej skomplikowanych przypadkach (szum w danych) dodatkowo zastosowaliśmy optymalizację struktury sieci pozwalającą na otrzymanie bardzo prostych struktur. Zwykła regularyzacja w przypadku dużych sieci, mających wiele parametrów, daje dobre wyniki, prowadząc do dużej liczby małych wag. Zastosowana przez nas metoda regularyzacji pozwala sieci na usunięcie zbędnych połączeń z warstwą wejściową (selekcja cech istotnych dla klasyfikacji) pozostawiając potrzebne silne połączenia (duże wagi), zarówno dodatnie i ujemne.Badanie wstępnych transformacji danych wejściowych doprowadziło nas do odkrycia zupełnie nowej klasy sieci neuronowych, które nazwaliśmy sieciami nieeuklidesowymi, gdyż wykorzystują nieeuklidesowe miary odległości. Obecnie rozwijamy algorytmy uczenia tych modeli, co powinno zaowocować szeregiem prac w nadchodzącym roku. Zbadaliśmy również użyteczn
ość kilku metod klasteryzacji pod kątem ich przydatności do wstępnej inicjalizacji.Publikacje związane z tym tematem:
Duch W, Adamczak R, Jankowski N
, Initialization of adaptive parameters in density networks, Third Conference on Neural Networks and Their Applications, Kule, October 1997, pp. 99-104Duch W, Adamczak R, Jankowski N, Initialization and optimization of multilayered perceptrons, Third Conference on Neural Networks and Their Applications, Kule, October 1997, pp. 105-110
Duch W, Adamczak R, Jankowski N, Initialization and optimization of multilayered perceptrons. CIL-KMK-3/97, Computational Intelligence Lab. Technical Report (long version)
II.3. Ekstrakcja reguł logicznych i poszukiwanie informacji w bazach danych (data mining)
W 1997 roku jedn
ym z naszych głównych zainteresowań były metody ekstrakcji reguł logicznych z danych treningowych przy pomocy sieci FSM jak i przy pomocy zmodyfikowanych sieci typu wielowarstwowych perceptronów. Opracowaliśmy bardzo efektywne podejście, polegające na transformacji sieci MLP w sieć, której działanie można zinterpretować za pomocą funkcji logicznych, a więc o wagach 0 (niepotrzebne połączenia) lub +1 (cecha musi wystąpić) oraz -1 (cecha nie powinna wystąpić). Takie własności wag wymuszamy dodając odpowiedni człon do funkcji błędu i używając algorytmu konstruktywistycznego. Rozwiązaliśmy też problem kwantyzacji danych ciągłych (określania zmiennych lingwistycznych) wprowadzając specjalne jednostki złożone z podsieci dwóch neuronów, które mają ustalone wagi i dwa progi traktowane jako parametry adaptacyjne. Opracowaliśmy metody optymalizacji otrzymanych w ten sposób reguł (G. Żal, praca magisterska), wykorzystując w tym celu metody globalnej minimalizacji, takie jak metoda stopniowego studzenia (zaadaptowano program ASA, Adaptive Simmulated Annealing) oraz bardzo obiecujące metody minimalizacji wielosympleksowej (w oparciu o program otrzymany z University of Arizona).Wykorzystujące te metody osiągnęliśmy doskonałe wyniki znajdując najprostszą strukturę logiczną powalającą na dokonanie klasyfikacji kilku testowych baz danych. Nasze rezultaty dla bazy 8124 grzybów, które na podstawie 22 podanych cech należy podzielić na grzyby jadalne i trujące, są obecnie traktowane jako rezultaty wzorcowe i dostępne są przez In
ternet w repozytorium danych Uniwersytetu Kalifornijskiego w Irvine. Mamy też wiele rezultatów dla danych medycznych, w tym najdokładniejsze wyniki na świecie dla bazy danych dotyczącej chorób tarczycy. Otrzymywane przez nas reguły są proste i posługują się niewielka liczbą ważnych diagnostycznie testów – wiele metod uczenia maszynowego generuje dużo bardziej skomplikowane (a przez to mniej zrozumiałe) oraz mniej dokładne reguły. Porównaliśmy też nasze rezultaty z regułami rozmytymi, które okazały się mniej dokładne, chociaż spodziewaliśmy się raczej odwrotnego wyniku.Temat ekstrakcji reguł logicznych nabiera coraz większego znaczenia, na wielu konferencjach organizuje się sesje specjalne poświęcone temu zagadnieniu. W 1997 roku W. Duch zorganizował i wygłosił zaproszone referaty na sesji specjalnej kongresu ICNN’97 w Houston, sesji specjalnej na kongresie ICONIP'97 w Dunedin (Nowa Zelandia) oraz na konferencji sieci neuronowych w Kule (wspólnie z prof. Bobrowskim z IBIB PAN), gdzie odbyła się sesja poświęco
na klasyfikacji danych medycznych.Publikacje:
Duch W, Adamczak R, Grąbczewski K,
Extraction of logical rules from backpropagation networks. Neural Processing Letters 7 (1998) 1-9Duch W, Adamczak R, Grąbczewski K, Jankowski N, Żal G,
Medical diagnosis support using neural and machine learning methods, Proc. of the Intern. Conference EANN'98, Gibraltar, 10-12.06.1998, pp. 292-295Duch W, Adamczak R, Grąbczewski K, Żal G
, Hybrid neural-global minimization logical rule extraction method for medical diagnosis support, Intelligent Information Systems VII, Malbork, Poland, 15-19.06.1998, pp. 85-94Duch W, Adamczak R, Grąbczewski K,
Extraction of crisp logical rules using constrained backpropagation networks, International Conference on Artificial Neural Networks (ICNN'97), Houston, 9-12.6.1997, pp. 2384-2389 (invited session)Duch W, Adamczak R, Grąbczewski K
, Ishikawa M, Ueda H (1997) Extraction of crisp logical rules using constrained backpropagation networks - comparison of two new approaches, Proc. of the European Symposium on Artificial Neural Networks (ESANN'97), Brugge 16-18.4.1997, pp. 109-114Duch W, Adamczak R, Grąbczewski K,
Constraint MLP and density estimation for extraction of crisp logical rules from data. International Congress on Neural Information Processing (ICONIP'97), New Zealand, Nov.1997, pp. 831-834Duch W, Adamczak R, Grąbczewski
(1997) Logical rules for classification of medical data using ontogenic neural algorithm. Solving Engineering Problems with Neural Networks, Proc. of the Intern. Conference EANN'97, Stockholm, 16-18.06.1997, pp.. 199-202Kasabov N, Kozma R, Duch W, Rule extraction from linguistic rule Networks and from Fuzzy Neural Networks: Propositional versus Fuzzy Rules, Fourth International Conference on Neural Networks and their Applications, March 11-13, 1998, Marseille, France, pp. 403-406
II.4. Badanie złożoności ontogenicznych sieci neuronowych.
Przy współpracy z dr Visakanem Kadirkamanathanem z Computer Science Department, University of Sheffield, prowadzono dalsze prace nad ontogenicznym modelem sieci neuronowej (zmienna liczba neuronów) IncNet. Wprowadzono nowa metodę kontroli złożoności sieci tej sieci opartą na statystyce. Uzyskano doskonała rezultaty w ramach uproszonej metody uczenia sieci IncNet opartej na filtrze
Kalmana, w szczególności w zastosowaniu do klasyfikacji danych medycznych oraz w zagadnieniach związanych z aproksymacją.Współpraca jest nadal kontynuowana a wykonane w jej ramach prace będą częścią pracy doktorskiej mgr Jankowskiego, która jest na ukończeniu. Otrzymaliśmy promotorski grant KBN na rok 1998/99 na dokończenie tego tematu.
Publikacje związane z tym tematem:
Jankowski N, Kadirkamanathan V, Statistical Control of Growing and Pruning in RBF-like Neural Networks, Third Conference on Neural Networks and Their Applications, Kule, October 1997, pp. 663-670
Jankowski N, Kadirkamanathan V, Statistical Control of RBF-like Networks for Classification. 7th International Conference on Artificial Neural Networks, Lausanne, Switzerland, October 1997, pp. 385-390
II.5. Zastosowanie metod inteligencji obliczeniowej do analizy danych medycznych i psychometrycznych.
W 1997 roku napisaliśmy wniosek o grant KBN dotyczący analizy danych medycznych w oparciu o rozwijane przez nas metody typu sieci neuronowych, metod opartych na podobieństwie i reguł logicznych. Grant ten został przyznany i będzie realizowany przez nasz zespół w latach 1998/99 roku. Korzystając z publicznie dostępnych medycznych baz danych osiągnęliśmy już liczne i ciekawe rezultaty, w niektórych p
rzypadkach otrzymując najlepsze z dotychczas publikowanych dokładności. Do analizy otrzymaliśmy też dane z polskich, niemieckich i japońskich ośrodków naukowych. Planujemy wydanie książki poświęconej różnym metodom analizy danych dotyczących chorób wątroby - będzie to porównanie wielu metod w zastosowaniu do trudnego problemu praktycznego. Zebraliśmy też sporo danych psychometrycznych, które posłużą do opracowania systemu do diagnostyki problemów osobowościowych.Duch W
, Rewolucja informatyczna w medycynie. Kardiologia Polska Lipiec/Sierpień 1998, (w druku)Duch W, Adamczak R, Grąbczewski K, Jankowski N, Żal G
, Medical diagnosis support using neural and machine learning methods, Proc. Of the Intern. Conference EANN'98, Gibraltar, 10-12.06.1998, pp. 292-295D
uch W, Adamczak R, Grąbczewski K, Żal G, Hybrid neural-global minimization logical rule extraction method for medical diagnosis support, Intelligent Information Systems VII, Malbork, 15-19.06.1998, pp. 85-94Duch W, Adamczak R, Grąbczewski
(1997) Logical rules for classification of medical data using ontogenic neural algorithm. Solving Engineering Problems with Neural Networks, Proc. of the Intern. Conference EANN'97, Stockholm, 16-18.06.1997, pp. pp. 199-202Duch W, Adamczak R, Grąbczewski K
, Extraction of logical rules from medical datasets, Third Conference on Neural Networks and Their Applications, Kule, October 1997, pp. 707-712
II.6. Integracja metod inteligencji obliczeniowej.
Badaliśmy teorie alternatywne w stosunku do sieci neuronowych. Naszym celem jest tu integracja metod uczenia maszynowego (ML, machine learning) i metod statystycznych z metodami sieci neuronowych. Metody oparte na pamięci (memory-based methods) znajdują szerokie zastosowanie praktyczne skutecznie konkurując z sieciami neuronow
ymi. Udało się nam opracować ogólny schemat dla metod opartych na podobieństwie, obejmujący jako szczególne przypadki metody rozpoznawania obiektów, takie jak różne warianty k-NN czy kwantyzacji wektorowej, wiele modeli sieci neuronowych, w tym najbardziej popularne modele MLP i RBF, oraz wiele innych metod. Z teorii wynika szereg zupełnie nowych algorytmów, implementowanych i testowanych obecnie w ramach pracy doktorskiej przez mgr K. Grudzińskiego. Zamierzamy stworzyć oprogramowanie, które pozwoli na automatyczne wybranie jednej z wielu metod mieszczących się we wspólnym schemacie, metody najlepiej działającej dla konkretniej bazy danych.W minionym roku prof. W. Duch zorganizował sesje specjalne poświęcone integracji metod uczenia maszynowego i sieci neuronowych na kongresie 1998 IEEE World Congress on Computational Intelligence, w Anchorage, Alaska oraz na konferencji The 8th Workshop on Open Systems and Information Dynamics, 3-5.03.1998 w Toruniu. Temat ten zamierzamy intensywnie rozwijać w nadchodzącyc
h latach. We wrześniu 1999 roku odbędzie się piąta z serii konferencja Engineering Applications of Neural Networks, organizowana tym razem przez prof. Ducha w Warszawie.Publikacje:
Duch W,
A framework for similarity-based classification methods, Intelligent Information Systems VII, Malbork, 15-19.06.1998, pp. 288-291Duch W, Neural minimal distance methods, Third Conference on Neural Networks and Their Applications, Kule, October 1997, pp. 183-188
Duch W, Grudziński K
, Diercksen Geerd H.F, Minimal distance neural methods. World Congress of Computational Intelligence, May 1998, Anchorage, Alaska, IJCNN'98 Proceedings, pp. 1299-1304
II.7. Samoorganizacja i wizualizacja wielowymiarowych danych.
Interesującym modelem samoorganizacji, przydatnym do symulacji tworzenia się map topograficznych w mózgu, jest sieć Kohonena. Ponieważ sieć ta nie bardzo nadaje się do aproksymacji czy klasyfikacji (dając stosunkowo niskie dokładności, jak przyznaje sam Kohonen), chociaż stosowana jest w takim celu nawet w komercyjnym
oprogramowaniu, takim jak SOMine, jej najbardziej atrakcyjną cechą pozostaje wizualizacja danych w postaci zachowania topograficznego sąsiedztwa wielowymiarowych danych odwzorowanych na dwuwymiarową siatkę neuronów. Wprowadzone przez nas miary ilościowe zgodności topograficznej przestrzeni danych i niskowymiarowych przestrzeni siatek neuronów pokazują jednak, że jest to odwzorowanie dalekie od optymalnego. Podejście oparte na minimalizacji takich miar, czyli skalowanie wielowymiarowe (MDS) oraz odwzorowanie Sammona, ma solidniejsze podstawy matematyczne niż metoda Kohonena, ale jest bardzo kosztowne obliczeniowo.Opracowano nowe algorytmy minimalizacji dla MDS i porównano różne metody redukcji wymiarowości i ich przydatność do określania najważniejszych cech lub ich nieliniowej kombinacji. Praca będzie kontynuowana a metoda opisana bardziej szczegółowo w pracy doktorskiej A. Nauda. Przy współpracy z grupą Visi Lab Uniwersytetu w Antwerpii, gdzie A. Naud przebywał na rocznym stażu, algorytm SOM zastosowano r
ównież w zagadnieniach klasyfikacji obrazu, w szczególności klasyfikacji tekstur.Publikacja:
de Backer S, Naud A, Scheunders P, Non-linear dimensionality reduction techniques for unsupervised feature extraction. Pattern Recognition Letters (w druku)
S. de Backer, A. Naud, P. Scheunders: Non-linear mapping for feature extraction. Second Workshop on Statistical Pattern Recognition, Sydney, Australia (w druku)
II.8. Inteligentne oprogramowanie dla potrzeb chemii komputerowej.
Projekt ten dotyczy zastosowania
metod sztucznej inteligencji, w szczególności budowy systemu ekspertowego i systemu neurorozmytego do wspomagania wszystkich etapów wykonywania obliczeń przy pomocy wielkich systemów programów numerycznych rozwiniętych dla potrzeb chemii komputerowej i fizyki molekularnej. Prowadzenie takich obliczeń wymaga dużego doświadczenia, wiedzy i intuicji, w szczególności w wyborze odpowiedniej metody obliczeniowej i bazy funkcji jednocząstkowych. Celem jest stworzenie systemu nadającego się do użytku przez fizyków czy chemików zainteresowanych badaniem przyrody a nie algorytmami numerycznymi. Jest to bardzo ambitne przedsięwzięcie, wymagające stworzenia obiektowo-zorientowanego oprogramowania dla obliczeń numerycznych w chemii kwantowej (nic podobnego dotychczas nie istnieje), które będzie współpracować z systemem ekspertowym. W pierwszym etapie opracowaliśmy prototyp systemu opartego na śladach pamięci (memory-based reasoning).Projekt “Intelligent support for computational chemistry” realizowany jest w ramach pro
gramu współpracy COST Unii Europejskiej, w której biorą udział eksperci z Max-Planck-Institut für Astrophysik z Garching k. Monachium, Computer Based Learning Unit, University of Leeds, Center for Scientific Computing, Espoo, Finlandia), Laboratory of Chemical Physics, University of Groningen, Holandia, Queen's University of Belfast, Department of Computer Science oraz Comenius University, Department of Physical Chemistry. Prof. Duch jest zastępcą kierownika tego projektu i był osobą odpowiedzialną za przygotowanie tego wniosku. Wstępne wyniki, osiągnięte w pierwszym roku projektu wydają się zachęcające, ale brakuje nam dużej bazy danych przykładowych obliczeń. Baza taka stworzona została w amerykańskim laboratorium rządowym PNL (Pacific Northwest Laboratory) ale nie mamy jeszcze zgody na jej użycie. Rola grupy prof. Ducha będzie się ograniczać w nadchodzących latach tylko do części projektu związanej ze sztuczną inteligencją, opracowania reguł dla systemu eksperckiego na podstawie analizy przykładowych obliczeń za pomocą algorytmów neuronowych. Kwestie opracowania oprogramowania numerycznego i graficznego interfejsu użytkownika rozwijane są przez pozostałych uczestników tego projektu.Duch W
, Artificial Intelligence Support for Computational Chemistry, Advances in Quantum Chemistry 29 (1997) 329-343
II.9. Inne tematy teoretyczne.
Ocena złożoności systemów rozwiązujących zagadnienia klasyfikacji może być przydatna do oceny ich przydatności dla baz danych różnego typu. Zagadnienie to przedstawione zostało jako problem skalowania się złożoności systemów wraz ze wzrostem liczby przykładów, liczby klas i liczby cech wektorów poddawanych klasyfikacji.
Publikacja:
Duch W, Scaling properties of neural classifiers, Third Conference on Neural Networks and Their Applications, Kule, October 1997, pp. 189-194
Dokonaliśmy przeglądu metod globalnej minimalizacji w zastosowaniu do sieci neuronowych, ze szczególnym uwzględnieniem roli algorytmów genetycznych. Brak znajomości metod globalnej optymalizacji powoduje, że algorytmy genetyczne są niemal jedyną metoda znajdująca zastosowanie do uczenia sieci neuronowych. Tymczasem metody alternatywne mogą dawać znakomite wyniki. Powszechnie stosowane metody gradientowe załamują się szczególnie przy zastosowaniach sieci neuronowych
do poszukiwania reguł logicznych.Publikacja:
Duch W
, Korczak J (1997) Optimization and global minimization methods for neural networks, CIL-KMK/LSIIT-2/97, Technical Report, po rozszerzeniu zostanie wysłany do Neural Network SurveysW ramach nieukończonej jeszcze pracy magisterskiej pracowaliśmy nad zastosowaniami modeli opartych na procesach Markowa (modele HMM i DFA, Discrete Finite Automata) do aproksymacji dynamiki sieci neuronowych z rekurencją i w zastosowaniu do opisu struktury makrocząsteczek (DN
A, RNA), w szczególności nad sposobami określenia reguł dla probabilistycznych automatów skończonych na podstawie dynamiki sieci z rekurencją.W ramach innej pracy magisterskiej zbadano różne realizacje funkcji logicznych za pomocą prostych układów dynamicznych. Szczególnie wiele wysiłku włożyliśmy w wizualizację basenów atrakcji takich układów.
III. Kognitywistyka
(cognitive sciences) i teoria układów złożonych (complex systems theory) (badania statutowe, kierownik prof. W. Duch)Badania w tym z
akresie zmierzają w kilku kierunkach. Z jednej strony dążymy do powołania kognitywistyki jako odrębnego kierunku studiów (nauczanie rozpocznie się w roku akademickim 1997/8) i rozwoju interdyscyplinarnego programu badań. Służyć temu mają “konwersatoria kognitywne”, organizowane na naszej uczelni oraz utworzenie Centrum Nauk Kognitywnych. W ramach konwersatoriów specjaliści z tak różnych dziedzin jak filozofia, lingwistyka poznawcza czy fizjologia zwierząt dyskutują zagadnienia związane z teorią umysłu. Opracowane przez prof. Ducha wykłady z wstępu do kognitywistyki cieszyły się nadal dużą popularnością i pozwoliły na znaczną integrację wyników wielu dziedzin nauki. W 1997/8 roku był recenzentem 2 prac doktorskich dotyczących zagadnień kognitywnych w filozofii, wygłosił też referat na Kongresie Filozofii Analitycznej w Monachium.
III.1. Modele umysłu przydatne w psychologii.
Rozwinięto nowy punkt widzenia na tworzenie modeli sieci neuronowych, a w szczególności modeli inspirowanych przez kognitywistykę. Polega on na systematycznym poszukiwaniu przybliżeń do dynamiki działania grup neuronów na różnych poziomach, począwszy od poszukiwania najlepszych funkcji pozwalających na aproksymację opisu działania pojedynczych neuronów, przez grupy neuronów opisanych pr
zy pomocy neurofizjologicznie poprawnych modeli opartych na neuronach wysyłających impulsy, do uproszczeń w postaci sieci z rekurencją o elementach reprezentujących uśrednioną aktywność realnych neuronów. Podejście behawiorystyczne zadowala się badaniem dyskretnych przejść pomiędzy kwazistacjonarnymi stanami (atraktorami) sieci z rekurencją. Podejście nazwane przez nas “Platońskim”, gdyż zdarzenia umysłowe reprezentowane są w nim przez obiekty zdefiniowane przez funkcje działające w przestrzeni psychologicznej, korzysta z uproszczonego opisu sieci z rekurencją przy pomocy dynamiki symbolicznej wprowadzając stosowane w psychologii przestrzenie cech (feature spaces). Pozwala to na tworzenie modeli sieci neuronowych do bezpośredniego modelowania zdarzeń zachodzących w umyśle a nie w mózgu. Teoria ta opisana została w obszernym artykule “Platonic theory of mind as an approximation to neurodynamics” napisanym do książki pt. “Brain-like Computing and Intelligent Information Systems” (Springer Verlag 1997). Książka ta, wydawana przez prof. Amari i Kasabova, zawiera artykuły tak wybitnych specjalistów w zakresie sieci neuronowych jak S-i. Amari, K. Fukushima, P. Werbos. Platoński model umysłu zastosowany został do wyjaśnienia zagadnień dotyczących kategoryzacji w psychologii poznawczej, planujemy zastosować go do modelowania procesu powstawania reprezentacji mentalnych. Referaty na temat tego modelu wygłoszono na kilku ważnych konferencjach międzynarodowych.Publikacje związane z tym tematem:
Duch W
, Platonic model of mind as an approximation to neurodynamics, w: Brain-like computing and intelligent information systems, ed. S-i. Amari, N. Kasabov (Springer, Singapore 1997), chap. 20, pp. 491-512Duch W, Yves Burnod, An Adaptive Neural Network. The Cerebral Cortex, Minds and Machines 7 (1997) 144-147
Duch W, Czym jest kognitywistyka? Kognitywistyka i Edukacja Medialna 1 (1998) str. (w druku)
Duch W, Neural implementation of psychological spaces. Int. Conf. on Neural Network and Brain (NN&B'98), Beijing, China, October 1998, (w druku)
III.2. Neurobiologia teoretyczna.
W 1996/7 roku rozszerzyliśmy nasze badania na sieci o neuronach symulujących działanie neuronów biologicznych. Wstępne wyniki osiągnięte za pomocą symulatora GENESIS, otrzymanego od prof. Bowera z Kalifornijskiego Inst. Technologii pokazały, że przybliżenie aktywności neuronu za pomocą funkcji sigmoidalnych prawdziwe jest tylko przy nierealistycznych założeniach dotyczących sygnałów pobudzających synapsy. Niemonotoniczne funkcje transferu, wychodzące przy b
ardziej realistycznych założeniach, mają coraz szersze zastosowanie prowadząc do modeli pamięci asocjacyjnych o większych pojemnościach niż w przypadku funkcji monotonicznych. Chociaż uzyskane początkowo wyniki były obiecujące prowadzący te badania uczestnik studium doktoranckiego, mgr A. Ludwiczewski, zrezygnował z dalszej działalności i chwilowo nie mamy nikogo, kto mógłby się podjąć tego tematu.Przy współpracy z grupą eksperymentalistów z Max Planck Institut fur Psychologische Forschung w Monachium W. Duch rozpoczął badania nad zjawiskami integracji sensomotorycznej. Doświadczenia dotyczyły pomiarów czasu latencji, szybkości i dokładności ruchów sakadycznych oczu i ruchów ręki w wyniku działania bodźców wzrokowych i dotykowych. Zaproponowano szczegółowy
schemat obszarów mózgu zaangażowanych w przetwarzanie informacji i dokonano przeglądu literatury w tej dziedzinie. Niestety nie ma dotychczas żadnych możliwości obliczenia czasów latencji w oparciu o modele neuronowe dla tak skomplikowanego zagadnienia. Za pomocą programu otrzymanego od Michaela Arbiba (Uniw. Południowej Kalifornii) i jego współpracowników, stworzonego w ramach "Brain models on the Web" można jednak modelować efekty różnicowe.Publikacje związane z tym tematem:
Duch W
, Bekkering H, Neggers B (1997) Sensorimotor integration, CIL-KMK/MPPF-4/97, Technical Report
III.3. Kontynuowano prace nad wykładem “Umysł, mózg i sieci neuronowe”, będącym wstępem do kognitywistyki, integrującym wiadomości dotyczące filozofii, neurofizjologii, psychologii poznawczej i sieci neuronowych. Od czerwca 1997 roku W. Duch otrzymywał stypendium UMK na napisanie pierwszego tomu wstępu do kognitywistyki. W książce tej przedyskutowane zostaną problemy związane z tworzeniem teorii umysłu, począwszy od problemów filozofic
znych i modeli historycznych, przez teorie psychologiczne i badania nad mózgiem, do modeli matematycznych. W ramach interdyscyplinarnego programu badawczego związanego z zastosowaniami i rozwojem teorii sieci neuronowych w fizyce, chemii, ekonomii, lingwistyce i innych naukach zorganizowano szereg seminariów.
IV. Badania w zakresie dydaktyki wspomaganej metodami komputerowymi
Badania w zakresie komputerowego wspomagania edukacji rozpoczęto w ramach grantu biura TEMPUS. Są one nadal kontynuowane przez pracujących w Katedrze Metod Komputerowych wykładowców. Efektem tego projektu są również dwie książki W . Ducha, które ukazały się w maju i grudniu 1997 roku.
Zastosowaniem hipertekstowych systemów multimedialnych w edukacji
do nauczania informatyki na poziomie uniwersyteckim zajmowała się mgr H. Małłek w czasie stażu na Salford University, Manchester, W. Brytania. Dokonaliśmy gruntownej reformy programów nauczania na Wydziale Fizyki i Astronomii (prof. J. Wasilewski) i będziemy pracować nad nowymi programami nauczania w nadchodzących latach.Utrzymujemy najlepiej w Polsce zorganizowane strony WWW dotyczące zagadnień związanych z:
Publikacje:
Duch W
, książka: Fascynujący świat komputerów. (Nakom, Poznań, Maj 1997; 444 str.)Duch W,
książka: Fascynujący świat programów komputerowych. (Nakom, Poznań, Grudzień 1997; 456 str.)Duch W, Internet i WWW
. Materiały dla Podyplomowego Studium Badania Środowiska PRONAT (26 stron).Małłek H,
Komputer na lekcjach matematyki: Mathwise - system do nauczania matematyki, Komputer w szkole 5 (1998)46-51
Załącznik 2b
Wykaz prac opublikowanych w 1997 roku i pierwszym półroczu 1998 roku
przez pracowników Katedry Metod Komputerowych UMK
A. Oryginalne prace opublikowane w czasopismach recenzowanych o zasięgu międzynaro
dowym.
B. Publikacje z konferencji naukowych.
Inne publikacje
Prace przyjęte do druku lub w druku
C. Prace wysłane do druku
D. Artykuły popularno-naukowe i inne
Udział w konferencjach naukowych pracowników KMK UMK
REFERATY I WYKŁADY NA ZAPROSZENIE (poza konferencjami)
Staże zagraniczne.
Goście zagraniczni KMK
Granty
Pozostała działalność naukowa w
1997 roku
Pracownicy i współpracownicy KMK, 1997-98
Doktoranci
Magistranci
Załącznik nr 3
Informacja
o działalności naukowej i zatrudnieniu w jednostce w I półroczu roku
złożenia wniosku wg. stanu na dzień 30 czerwca 1998
I. Działalność naukowa
1. liczba publikacji:
orygina
lne monograficzne przeglądowe ogółem26 0 0 51
2. liczba publikacji w recenzowanych czasopismach i wydawnictwach
o zasięgu światowym 7
3. konferencje:
1/ liczba pracowników jednostki uczestniczących w konferencjach
naukowych: ogółem 61
, w tym z referatami 47,przewodniczących sesjom 7
2/ liczba pracowników jednostki uczestniczących w konferencjach
naukowych międzynarodowych: ogółem 47
, w tym z referatami 36,przewodniczących sesjom 7
3/ liczba konferencji zorganizowanych przez jednostk
ę:krajowe 0 międzynarodowe 0 (współorganizacja 6 międzyn. konf.)
4. seminaria w ośrodkach zamiejscowych:
liczba referatów wygłoszonych na zaproszenie
ogółem 24
w tym seminaria międzynarodowe 17
w tym seminaria w ośrodkach zagranicznych 16
II.
Zatrudnienie (łącznie z uczestnikami Studium Doktoranckiego Fizyki i Chemii)1. Liczba pracowników ogółem w przeliczeniu na pełne etaty: 8.5 etatów + 5 doktorantów
w tym: z tytułem prof. 1, ze stopniem dr hab. 1, dr 2
2. Liczba pracowników z tytułem profe
sora i stopniem naukowym dr hab.zatrudnionych w niepełnym wymiarze czasu pracy: 0
3. adiunktów 0 w tym ze stopniem doktora 0
4. asystentów 4, osób pobierających stypendia doktoranckie 5
osób mających otwarte przewody doktorskie 2
5. pracowników inżynie
ryjno-technicznych 06. bibliotekarzy, archiwistów 0
7. pracowników administracyjnych 0
8. Innych pracowników: 2.5, w tym
1 starszy wykładowca (dr matematyki), 1 wykładowca (mgr fizyki),
0.5 wykładowca (mgr inż. elektroniki)
Data Kierownik jednostki
15 lipca 1998 /podpis i pieczęć/
INFORMACJA
O MIĘDZYNARODOWEJ WSPÓŁPRACY NAUKOWEJ
I NAUKOWO-TECHNICZNEJ
WYKONANIE I PLAN
Nie prowadzimy wymiany w oparciu o podpisane umowy, tylko o długoletnią współpracę nieformalną z Belgią, Francją, Izraelem, Japonią, RFN.
Projekt “Intelligent support for computational chemistry”, realizowany w ramach programu współpracy COST Unii Europejskiej, od 1995 roku
Kraje: Niemcy, Anglia, Finlandia, Holandia, Irlandia, Słowacja
nazwy placówek: Max-Planck-Institute for Astrophysics z Garching k. Monachium; Computer Based Learning Unit, University of Leeds; Center for Scientific Computing, Espoo; Laboratory of Chemical Physics, University of Groningen; Queen's University of Belfast, Department of Computer Science; Comenius University, Department of Physical Chemistry.
kraj: RFN, okres trwania umowy: od 1979
nazwa placówki: Uniwersytet w Bochum, Wydział Chemii (prof. dr V. Staemmler)
tematyka: zagadnienia struktury energetycznej atomów i cząsteczek w
stan
ach otwartopowłokowych, w tym teoretyczny opis stanówlokalnych i procesów adsorpcji na powierzchniach kryształów
jonowych.
Inne: wieloletnia współpraca nieformalna, staże naszych pracowników
kraj: RFN, okres trwania umowy: od 1984
nazwa placówki: Instytut Astrofizyki Maxa Plancka w Garching k. Monachium
tematyka: rozwój i zastosowania metody SGGA-CI i innych metod obliczeniowych fizyki molekularnej; systemy ekspertowe w fizyce molekularnej.
Inne: Wspólne rozwijanie dużych systemów programów komputerowych, nieformalna długoletnia umowa, wspólni doktoranci i magistranci.
kraj: Francja, okres trwania umowy: 1995
nazwa placówki: Paul Sabatiere Universite, Lab. Physique Quantique
tematyka: metody obliczeniowe chemii kwantowej
Inne: w lata
ch 1995/96 w ramach Cooperation scientifique entre la France et la Pologne, KBN/Le ministre Francais des affaires etrangeres, No. 114, póxniej nieformalna wymiana pracowników i stażekraj: Japonia, okres trwania umowy: 1996-98
nazwa placówki: Kyushu Institute of Technology,
Department of Control and Engineering
tematyka: modelowanie sieci neuronowych
Inne: współudział w organizacji kongresu ICONIP'98
kraj: Belgia, okres trwania umowy: 1996/97
nazwa placówki: Uniwersytecie Antwerpii (RUCA), laboratorium "VisieLab"
tematyka: metody inteligencji obliczeniowej
Inne: dłuższy staż A. Nauda