Uporaba metode Monte Carlo za izračun Pi-ja v okolju Hadoop

V tej nalogi je bilo potrebno uporabiti metodo Monte Carlo, za aproksimacijo vrednosti Pi. Metoda Monte Carlo je metoda, ki se zanaša na ponavljajočo naključno vzorčenje podatkov za pridobivanje rešitev. Tako pridemo pri naši nalogi do težave velike količine podatkov. Zato smo uporabili okolje, ki je bilo razvito posebej za takšne naloge. Imenuje se Hadoop, katerega distributer je Apache. Hadoop je okolje, ki vhodne podatke razbije na več manjših kosov, kateri so nato vsaki posebej posredovani manjšim procesorjem. Tako imamo mrežo manjših procesorjev, ki vsak prejme manjšo količino podatkov in jih obdela. Tako pridobimo na času delovanja za vsak nov procesor ki ga dodamo. V Hadoop-u lahko procesorje združimo za reševanje enega problema s pomočjo programov MapReduce. Ti nam najprej vhodne podatke razbijejo, mapirajo, zložijo in nato zmanjšajo na količino izhodnih podatkov.