FAQ

Kazalo/Content

Odgovori na pogosta vprašanja

Odjemalec ARC in dostop do grid-a
Kako generirati proksi?
arcproxy -S ime_VO
#generiranje proksija za gen.vo.sling.si
arcproxy -S gen.vo.sling.si  
#generiranje proksija, ki bo veljal 1 teden
arcproxy -S gen.vo.sling.si -c validityPeriod=168h
Kako preveriti, ce je proksi pravilno generiran?
arcproxy -I
Z orodjem fetch-crl ne prenese CRL-jev prek protokola HTTPS:

Potrebno je namestiti paket:

yum install perl-Crypt-SSLeay
Kako preveriti, ali deluje informacijski sistem:
ldapsearch -x -h imegruce.domena.si -p 2135 -b ' Mds-Vo-name=local,o=grid'
Pri pridobivanju atributov VOMS pride do napake, ali pa je napaka v konfiguraciji. Napaka: Failed to process VOMS configuration or no suitable configuration lines found

Manjka vam datoteka vomses (ponavadi v ~/.arc or /etc/grid-security) ali pa ta datoteka vsebuje sintaktično napako:

cat ~/.arc/vomses
"gen.vo.sling.si" "voms.sling.si" "15001" \
"/C=SI/O=SiGNET/O=SLING/CN=voms.sling.si""gen.vo.sling.si"

Če datoteka obstaja, a ni na predvidenem mestu, uporabite stikalo -V in navedite pot do datoteke:

arcproxy -V ~/.arcijs/vomses
Napaka “Handle is not authenticated/connected”
VERBOSE: Connect: Failed authentication: an end-of-file was reached/globus_xio:An end of file occurred
VERBOSE: Disconnect: Failed aborting - ignoring: Handle not in the proper state
VERBOSE: Disconnect: Failed aborting - ignoring: globus_i_ftp_control_encode_command: gss_wrap failed
DEBUG: Disconnect: Failed closing - ignoring: globus_ftp_control_force_close: Handle is not connected
INFO: Submit: Failed to connect
DEBUG: Job database created successfully (/home/user/.arc/jobs.dat)
ERROR: One or multiple job descriptions was not submitted.

Obstaja več možnih rešitev:

  • potekel je certifikat na strani ARC strežnika
  • niste avtorizirani za pošiljanje nalog na to gručo (ste že član virtualne organizacije, ki je podprta na tej gruči? Ste navedli ime virtualne organizacije pri ustvarjanje proksija? Preverite z ukazom arcproxy -I)
  • manjka reverzni zapis DNS za ARC strežnik
  • neustrezna sinhronizacija časa (uporabite NTP)
  • CRL-ji niso nameščeni ali pa niso posodobljeni (namestite paket fetch-crl in dodajte posodabljanje v cron, da se izvede vsak dan. Poglejte vsebino mape /etc/grid-security/certificates)
Kaj, če ne najde nobene gruče, ki bi bila na voljo?

V tem primeru ste v opisu naloge navedli neke zahteve, ki niso na voljo na nobeni gruči. Morda ste zahtevali preveč RAM-a? Ne pozabite, da je atribut memory=”xy” velikost RAM-a na posamezno jedro, ne skupen seštevek za celotno nalogo).

Napaka pri razčlenjevanju datoteke xrsl: zour XRSL cannot be parsed

V opisu naloge je sintaktična napaka. Odjemalec ponavadi javi, kaj je narobe. Uporabite stikalo -d DEBUG.

Želene gruče ne najdem v informacijskem sistemu.

Možni razlogi:

  • potekel je certifikat na strežniku ARC
  • informacijske storitve na gruči ne tečejo
  • požarni zid onemogoča dostop do informacijskega sistema f
  • težava v sinhronizaciji časa (uporabite NTP)
Kako v opis naloge XRSL vključiti še nastavitve okolja?
(environment=("<VAR>" "<STRING>"))
(environment=("MPIHOME" "/path/to/mpi/home")
Programska oprema
Kako namestiti programsko opremo na gručo?
  • Programsko opremo lahko priložite k poslani nalogi, če je velikost le-te majhna.  Progamsko opremo navedite v datoteki xrsl pod InputFiles.
  • Preverite morebitno dosegljivost programske opreme v sklopu okolij za izvajanje RTE ( Runtime Environments).
  • Pošljite zahtevo za namestitev programske opreme na support@sling.si
Kateri pretvorniki so na voljo?

Različice po meri so na voljo prek okolij za izvajanje (RTE) Custom versions can be arranged via RTE. Kateri so sicer na voljo, preverite na gruči sami oziroma povprašajte skrbnika gruče.

Kako zagnati nalogo MPI?

Oglejte si navodila na tej strani.

Ob zagonu svojega programa dobim napako “command not found”.

Za uspešen zagon programa je potrebno v opisu naloge xrsl navesti ustrezno okolje za izvajanje, t.j. RTE. Okolje bo vsebovalo vse potrebne nastavitve.

Kako zagnati nalogo tipa OpenMP?

Potrebno je uskladiti atributa count in countpernode v xrsl. Oba morata vsebovati enako število jeder. Count ponazarja število vseh zahtevanih jeder, countpernode pa število jeder na istem vozlišču.

Število jeder je potrebno omejiti, zgornja omejitev je strojna, torej število vseh jeder na enem vozlišču. Skoraj vse gruče imajo vsaj 32-jedrna vozlišča, veliko pa tudi 64.

V program ali xrsl je nujno potrebno dotati še to nastavitev:  

export OMP_NUM_THREADS=<number of cores>

Ob tem je potrebno poudariti nastavitev procesorske afinitete. Po privzetih nastavitvah je le-ta izklopljena, ni pa nujno. Preverite pri skrbniku gruče.

V primeru da je procesorska afiniteta v lokalnem upravljavcu vrst omogočena, jo izklopite, če ne boste porabili vseh jeder na vozlišču. Nastavitev je odvisna od izbire prevajalnika.

Primer, kako procesorsko afiniteto izklopiti:

export IPATH_NO_CPUAFFINITY=1
ali
export MV2_ENABLE_AFFINITY=0

Če je nastavitev omogočena in boste uporabili vsa jedra na vozlišču:

export MV2_ENABLE_AFFINITY=1
ali 
export IPATH_NO_CPUAFFINITY=0

Omenjene nastavitve lahko vklučite v xrsl:

(environment=
( "OMP_NUM_THREADS" "64" )
( "MV2_ENABLE_AFFINITY" "1" )
)

Lahko pa jih vključite pri zagonu programa.

mpirun -genv $OMP_NUM_THREADS -genv MV2_ENABLE_AFFINITY 0 -np $NUM_TASKS ./program
Kakšne so prednosti  tehnologije “hyperthreading”?

Izboljšanje hitrosti izvedbe programa, običajno je doprinos okoli 10-15%, vendar tehnologije ne znajo uporabiti vsi programi.

Pošiljanje nalog

Uporabite ukaz arckill.

Uporabite ukaz arcsub.

Kako pridobiti rezultate naloge?
#prenese rezultate vseh koncanih nalog
arcget -a 
#prenese le nalogo, ki jo dolocite
arcget gsiftp://ime-gruce:2811/jobs/ID_naloge
#prenese vse naloge iz gruce jost.arnes.si
arcget -c jost.arnes.si
#prenese rezultate vseh nalog v joblist.xml
arcget -o joblist.xml

arcclean (če je naloga že končana) oziroma arckill (če je naloga v vrsti).

Kako preveriti status naloge?

Uporabite ukaz arcstat

#preveri status vseh nalog
arcstat -a 
#preveri status za posamezno nalogo
arcstat gsiftp://ime-gruce:2811/jobs/ID_naloge 
# preveri statuse vse nalog na gruci jost.arnes.si
arcstat -c jost.arnes.si
Ali lahko prenesem naloge iz drugega racunalnika

Da, uporabite ukaz arcsync.

arcsync -c ime-gruce
Zakaj ima moja naloga ves čas status “preparing”?

V tem koraku se na gručo prenašajo input podatki. Če naloga obstane v tem koraku, kontaktirajte skrbnika gruče.

Zakaj se naloga, ki je že v vrsti, ne zažene?

Sistemski viri so omejeni, zato je potrebno na zahtevane kapacitete nekoliko počakati. Naloge so razvrščene v vrsto po prioriteti, in sicer se le-ta računa na podlagi:

  • zgodovine poslanih nalog,
  • članstva v virtualni organizaciji,
  • starosti naloge v vrsti,
  • velikosti zahtevanih računskih virov.

Nastavljeno je tudi maksimalno število nalog, ki lahko hkrati tečejo na gruči. Če se naloga ne zažene, ste dovoljeno število prekoračili in bo naloga zagnana šele takrat, ko se bo druga končala.

Dobim napako Ćbash: ./configure: /bin/sh^M: bad interpreter: No such file or directory”?

Uporabite ukaz dos2unix program.sh, zato da shranite datoteko v Unix formatu. Obstoječa datoteka namreč kaže na DOS končnico.

Moja naloga po nekaj minutah spodleti.

Razlog za napako boste našli v dnevniških datotekah (glej gridftp error). Največkrat je razlog v nepopolni zbirki vhodnih podatkov ali pa v tem, da ste prekoračili dovoljene sistemske vire. Poraba virov je na gruči omejena s sistemom cgroup, ki programe, ki prekoračijo dovoljeno omejitev, predčasno prekini. Nastavite več zahtevanih virov v datoteki xrsl.

Ostalo
Kako ukaze zagnati v debug nacinu?
-d DEBUG #velja za vse ukaze 
arcsub -c jost.arnes.si -o joblist.xml test.xrsl -d DEBUG
Kako preverimo, kateri RTE-ji so na voljo na gruci:
ldapsearch -x -h jost.arnes.si -p 2135 -b ' Mds-Vo-name=local,o=grid'| grep \ nordugrid-cluster-runtimeenvironment
Kje lahko preverim zasedenost gruč?

Na naslovu http://www.sling.si/gridmonitor/loadmon.php

Kako lahko prekličem svoje digitalno potrdilo?

Podpisano sporočilo pošljite nacionalnemu izdajatelju digitalnih potrdil: signet-ca@ijs.si

Podrobna navodila boste našli v splošnih pogojih, na strani SiGNET CA.

Kaj naredim, če so mi ukradli moje digitalno potrdilo?

Digitalno potrdilo je potrebno nemudoma preklicati in obvestiti nacionalnega izdajatelja digitalnih potrdil ( signet-ca@ijs.si).

Po nesreči sem izbrisal rezultate svoje naloge. Kje jih lahko dobim?

Žal so rezultati po tem, ko jih preneste iz gruče, na njej izbrisani. Obrnite se na lokalnega skrbnika gruče, če jih morda še hranijo.