Supernova

Z KdmWiki
Przejdź do nawigacji Przejdź do wyszukiwania

< Podręcznik użytkownika KDM < Maszyny obliczeniowe

{{{nazwa}}}
[[Plik:
Klaster Nova
|250px|noframe|center]]
Kontakt
nova @ kdm.wcss.wroc.pl

Nova - klaster zainstalowany w WCSS, włączony w struktury projektu EGEE i PL-Grid. Architektura wszystkich komputerów to x86_64 (Intel Core micro Architecture, EM64T).

Elementy klastra:

  • węzeł dostępowy (nova),
  • dwa węzły usługowe (darkmass/SE i dwarf/CE),
  • 328 węzłów obliczeniowych (wn001 - wn328),
  • sieć obliczeniowa - Infiniband DDR fat-tree full-cbb,
  • sieć zarządzania - gigabit ethernet.

Zasoby obliczeniowe klastra:

  • 2016 rdzeni obliczeniowych,
  • ~4 TB pamięci operacyjnej (2GB/rdzeń)
  • ~100 TB przestrzeni dyskowej (dyski lokalne + Lustre),
  • komunikacja pomiędzy węzłami klastra: przepływność 20Gbps, opóźnienia < 5 us.


Zestawienie

klaster :
moc obliczeniowa :
węzły :
CPU :
liczba CPU :
cache :
pamięć :
dysk /home :
dysk /scratch :
system operacyjny :

nova.wcss.wroc.pl
19 TFLOPS
dostępowy
Intel Xeon 3GHz
2x dual-core
4MB
16GB
500GB
-
ScientificLinux



obliczeniowe (328)
Intel Xeon 2.33/2.4/2.5 GHz
1 lub 2x quad-core
4MB
2GB/core
-
160GB/node + Lustre
ScientificLinux

Oprogramowanie

Aplikacje

Abaqus, ACES2, Autodock, CAMFR, CPMD, FDS-SMV ,GAMESS, Gaussian, LAMMPS, Meep, MOLCAS, Molpro, Matlab, NWChem, R, TURBOMOLE aplikacje własne użytkowników.

Kompilatory

GNU GCC, Intel, PGI

Biblioteki
  • MVAPICH1,
  • MVAPICH2,
  • MKL (/opt/intel/mkl/WERSJA/lib/em64t/),
  • GotoBLAS (/usr/local/lib/),
  • ATLAS 3.8.3 (/usr/local/atlas-3.8.3)
  • ...
Narzedzia
System kolejkowania

PBS

RSA key fingerprint

d5:85:f7:5a:92:9b:72:7d:d3:74:67:ab:e4:46:28:e9

Zalecenia

  • na dysku /home wprowadzone zostały kwoty dyskowe: limit miękki 8GB, limit twardy 10GB, limit czasowy 7 dni; sprawdzenie stanu:
repquota -a

opis systemu kwot:

man quota
  • zainstalowane zostały nowe kompilatory Intela oraz nowa biblioteka MKL; oprogramowanie korzystające ze starych bibliotek może nie uruchamiać się lub pracować nieoptymalnie - wymagana jest rekompilacja;
  • oprogramowanie zrównoleglone w standardze MPI musi zostać przekompilowane, aby mogło korzystać z sieci Infiniband; domyślna implementacja MPI to MVAPICH1;
  • zadania MPI uruchamiane poprzez sieć Ethernet a nie Infiniband bądą zabijane bez ostrzeżenia - sieć Ethernet jest dedykowana dla NFS;
  • zadania MPI należy uruchamiac poprzez narzędzie MPIEXEC a nie mpirun;
  • oprogramowanie zrównoleglone w innym standardze niż MPI musi zostać przekonfigurowane - prosimy o kontakt użytkownikow takich aplikacji;
  • zalecenia dotyczące współdzielonego dysku scratch - Lustre

Zobacz też