Archiwizacja danych

Z KdmWiki
Przejdź do nawigacji Przejdź do wyszukiwania

< Podręcznik użytkownika KDM < Dostęp do KDM < Archiwizacja danych

Jeżeli użytkownik potrzebuje miejsca na przechowywanie dużej ilości danych, powinien w tym celu skorzystać z archiwum. Archiwizacja danych dla użytkowników KDM możliwa jest przez katalog /archiwum/$USER dostępny na wszystkich maszynach obliczeniowych WCSS. Katalog ten jest prywatnym archiwum użytkownika, niedostępnym dla innych użytkowników.

System archiwizacji automatycznie tworzy kopie zapasowe składowanych plików, z maksymalną częstotliwością trzy razy na dobę. Częstotliwość jest regulowana przez administratorów.

Nie należy sugerować się pojemnością katalogu /archiwum ani jego podkatalogów pokazywaną przez narzędzie takie jak df czy du. Katalog ten jest jest tylko "wierzchołkiem góry lodowej" - po jego zapełnieniu powyżej wartości progowej dane są automatycznie przenoszone na robota taśmowego, bez zmiany sposobu dostępu dla użytkownika. Dlatego odczytywanie pliku z archiwum może potrwać nawet kilkadziesiąt minut (w zależności od jego wielkości), w tym czasie plik, jeśli został wcześniej zarchiwizowany, jest automatycznie przywracany i udostępniany w odpowiednim katalogu archiwum użytkownika.

Dostęp do archiwum

Korzystanie z archiwum na klastrze Supernova odbywa się za pośrednictwem dedykowanego węzła archiwum.wcss.pl. Z tego węzła użytkownik ma dostęp do katalogu domowego i swojego katalogu na roboczym systemie plików. Aby przenieść swoje dane z katalogu domowego lub tymczasowego do/z archiwum należy zalogować się na ten węzeł i wykonać potrzebne operacje na danych.

  • Można zalogować się bezpośrednio na węzeł archiwum:
> ssh archiwum.wcss.pl
  • lub najpierw na węzeł dostępowy klastra Supernova, a następnie na węzeł archiwum:
> ssh supernova.wcss.pl
supernova> ssh archiwum

Operacje na plikach

Korzystanie z archiwum nie różni się od korzystania ze zwykłego katalogu na dysku.

Archiwizacja danych

Aby przenieść dane do archiwum wystarczy je skopiować, np. dla użytkownika user1:

> cd /home/user1
> cp plik.txt /archiwum/user1/
> ls /archiwum/user1/
plik.txt

Po skopiowaniu pliku należy usunąć go z dotychczasowej lokalizacji (/home lub /lustre/scratch), aby zwolnić miejsce zajmowane przez niego na dysku, np:

> cd /home/user1
> rm plik.txt 
Przywracanie danych

Aby ponownie skorzystać z pliku wystarczy skopiować go do swojego katalogu w przestrzeni /home lub /lustre/scratch, np:

> cp /archiwum/user1/plik.txt /home/user1/
> ls /home/user1/plik.txt

Jeżeli nie ma potrzeby przechowywania pliku w archiwum, można go stamtąd usunąć, np:

> ls /archiwum/user1/
plik.txt
> rm /archiwum/user1/plik.txt 
Pakowanie i kompresja (TAR)

Pakowanie i kompresowanie większej liczby małych plików w paczki TAR:

> tar czvf nazwa_paczki.tar.gz <lista plikow do spakowania>

Rozpakowywanie narzędziem TAR:

> tar xzvf nazwa_paczki.tar.gz [<opcjonalna lista plikow do rozpakowania>]

Sprawdzanie zawartości archiwum TAR:

> tar tzvf nazwa_paczki.tar.gz
Pakowanie i kompresja (ZIP)

Pakowanie i kompresowanie większej liczby małych plików w paczki ZIP:

> zip -r9 nazwa_paczki.zip <lista plikow do spakowania>

Rozpakowywanie narzędziem ZIP:

> unzip nazwa_paczki.zip [<opcjonalna lista plikow do rozpakowania>]

Sprawdzanie zawartości archiwum ZIP:

> zipinfo nazwa_paczki.zip