login webmail english
PARF
IRB Home PARF
pretraživanje imenik kontakt gdje smo? mapa weba pomoć print Bookmark and Share

PARF - Paralelni RF Algoritam

Algoritam slučajnih šuma jedan je od najboljih trenutno poznatih algoritama za klasifikaciju (i regresijsku analizu), sposoban klasificirati ogromne količine podataka s velikom točnošću. Također, to je algoritam koji je inherentno paralelizabilan. Izvorno algoritam je napisan u programskom jeziku Fortran 77, koji je zastario i ne pruža mnoge mogućnosti koje moderniji jezici pružaju; također, originalni kôd nije primjer "urednog" programiranja, te ga je vrlo teško primijeniti u edukativne svrhe.

U sklopu ovog projekta predlaže se adaptacija algoritma glede prikladne primjenjivosti, prevođenjem ovog algoritma u Fortran 90. Za razliku od Fortrana 77, Fortran 90 je strukturirirani paralelni programski jezik, pa je program pisan u njemu lako pokrenuti na paralelnoj infrastrukturi, te je lako čitljiv, kako istraživačima tako i studentima. Osim toga, odnedavno je puštena u opticaj (za nekomercijalne potrebe) besplatna implementacija, čije je nepostojanje bilo jedna od većih prepreka pri originalnoj implementaciji algoritma, zbog straha da neće biti prihvaćen u akademskoj zajednici. Stvoritelj algoritma, profesor emeritus Leo Breiman pri Berkeleyu, izrazio je u korespondenciji velik interes za ovu zamisao. Potvrdio je da još nitko nije radio na paralelnoj implementaciji njegovog algoritma, te obećao svoju podršku i pomoć. Leo Breiman jedan je od začetnika područja machine learning-a i data mining-a, te ko-autor prvog značajnog programa (CART – Classification and Regression Trees) u području.

Izvorni kod PARF-a može se naći ovdje. Za stvaranje izvršnog koda potreban je Fortran 90 prevodilac. Podržani su: Intel Fortran, Portland Group Fortran i GNU g95.

RF i Random Forests su zaštićeni znakovi Lea Breimana i Adele Cutler.

PARF je razvijen u Centru za informatiku i računarstvo Instituta Ruđer Bošković, pod financijskom podrškom Ministarstva znanosti obrazovanja i športa, i-Projekt 2004-111.

Kontakt: prof. dr. sc. Karolj Skala