Archiwizacja danych: Różnice pomiędzy wersjami

Aktualna wersja na dzień 13:00, 5 sty 2018

< Podręcznik użytkownika KDM < Dostęp do KDM < Archiwizacja danych

Jeżeli użytkownik KDM potrzebuje miejsca na przechowywanie dużej ilości danych, powinien w tym celu skorzystać z archiwum. Dostęp do archiwum mają wszyscy użytkownicy klastra Bem.

System archiwizacji automatycznie tworzy kopie zapasowe plików składowanych w archiwum, z maksymalną częstotliwością trzy razy na dobę. Częstotliwość jest regulowana przez administratorów.

Dane z archiwum są automatycznie przenoszone na robota taśmowego, bez zmiany sposobu dostępu dla użytkownika. Jedyną różnicą po przeniesieniu pliku na robota taśmowego może być wydłużenie czasu dostępu do niego. Dlatego odczytywanie pliku z archiwum może potrwać nawet kilkadziesiąt minut (w zależności od jego wielkości), w tym czasie plik, jeśli został wcześniej zarchiwizowany, jest automatycznie przywracany i udostępniany w odpowiednim katalogu archiwum użytkownika.

!

Regulamin korzystania:

Użytkownik może archiwizować wyłącznie dane wejściowe, pośrednie i końcowe używane do obliczeń realizowanych jedynie na komputerach KDM WCSS - archiwizowanie innych danych używanych prywatnie, służbowo i w innych centrach KDM jest zabronione.
Zabronione jest zapełnianie katalogu /archiwum w 100%. Prowadzi to do przeciążenia systemu archiwizacji. Należy nadzorować swoje operacje na plikach w sposób ciągły, aby nie doprowadzić do przepełnienia.
Zabronione jest składowanie plików mniejszych niż 50 megabajtów ze względu na fakt że obsługa wielu małych plików prowadzi do przeciążenia systemu archiwizacji.
Zabronione jest zmienianie nazw plików i katalogów po skopiowaniu na archiwizator.

Dostęp do archiwum

Korzystanie z archiwum na klastrze Bem odbywa się za pośrednictwem dedykowanego węzła archiwum.wcss.pl. Z tego węzła użytkownik ma dostęp do katalogu domowego i swojego katalogu na roboczym systemie plików. Aby przenieść swoje dane z katalogu domowego lub tymczasowego do/z archiwum należy zalogować się na ten węzeł i wykonać potrzebne operacje na danych.

Logowanie na węzeł archiwum (ten sam login i hasło jak na klaster Bem):

ssh archiwum.wcss.pl

Po zalogowaniu archiwum dostępne jest jako katalog o nazwie /archiwum/$USER. Katalog ten jest prywatnym archiwum użytkownika, niedostępnym dla innych użytkowników.

Operacje na plikach

Korzystanie z archiwum nie różni się od korzystania ze zwykłego katalogu na dysku.

Archiwizacja danych

Aby przenieść dane do archiwum wystarczy je skopiować, np. dla użytkownika user1:

Sprawdzenie zawartości katalogu osobistego:

ls /archiwum/user1/

Skopiowanie pliku:

cp plik.txt /archiwum/user1/

Po skopiowaniu pliku należy usunąć go z dotychczasowej lokalizacji (/home lub /lustre/scratch), aby zwolnić miejsce zajmowane przez niego na dysku, np:

rm plik.txt

Przeniesienie (skopiowanie i skasowanie w jednym kroku):

mv plik.txt /archiwum/user1/

Przywracanie danych

Aby ponownie skorzystać z pliku wystarczy skopiować go do swojego katalogu w przestrzeni /home lub /lustre/scratch, np:

ls /archiwum/user1/ 
cp /archiwum/user1/plik.txt /home/user1/
ls /home/user1/plik.txt

Jeżeli nie ma potrzeby przechowywania pliku w archiwum, można go stamtąd usunąć, np:

rm /archiwum/user1/plik.txt

Pakowanie i kompresja

Jeśli użytkownik posiada wiele małych plików, które chce przenieść do archiwum, należy je spakować razem i skompresować (kompresja bezstratna). Można to zrobić z wykorzystaniem poleceń tar lub zip.

Pakowanie i kompresja - TAR

Pakowanie i kompresowanie większej liczby małych plików w paczki TAR:

tar czvf nazwa_paczki.tar.gz <lista plikow do spakowania>

Rozpakowywanie narzędziem TAR:

tar xzvf nazwa_paczki.tar.gz [<opcjonalna lista plikow do rozpakowania>]

Sprawdzanie zawartości archiwum TAR:

tar tzvf nazwa_paczki.tar.gz

Pakowanie i kompresja - ZIP

Pakowanie i kompresowanie większej liczby małych plików w paczki ZIP:

zip -r9 nazwa_paczki.zip <lista plikow do spakowania>

Rozpakowywanie narzędziem ZIP:

unzip nazwa_paczki.zip [<opcjonalna lista plikow do rozpakowania>]

Sprawdzanie zawartości archiwum ZIP:

zipinfo nazwa_paczki.zip

Zobacz też: Dostępna przestrzeń dyskowa

@@ Linia 1: / Linia 1: @@
 <small>< [[Podręcznik użytkownika KDM]] < [[Dostęp do KDM]] < Archiwizacja danych</small>
+{{toc-right}}
+Jeżeli użytkownik [[KDM]] potrzebuje miejsca na przechowywanie dużej ilości danych, powinien w tym celu skorzystać z archiwum. Dostęp do archiwum mają wszyscy użytkownicy klastra [[Bem]].
-'''Archiwizacja danych''' dla użytkowników [[KDM]] możliwa jest przez katalog '''/archiwum/$USER''' dostępny na wszystkich [[maszyny obliczeniowe|maszynach obliczeniowych]] WCSS.  Na serwerach [[Tezro]] i [[Leo]] katalog dostępny jest po zalogowaniu. Korzystanie z archiwum na klastrze [[Supernova]] odbywa się za pośrednictwem dedykowanego węzła - serwera [[archiwum.wcss.wroc.pl | '''archiwum.wcss.wroc.pl''']].
+System archiwizacji automatycznie tworzy kopie zapasowe plików składowanych w archiwum, z maksymalną częstotliwością trzy razy na dobę. Częstotliwość jest regulowana przez administratorów.
-Jeżeli użytkownik potrzebuje miejsca na przechowywanie dużej ilości danych, powinien w tym celu skorzystać z archiwum.
+Dane z archiwum są automatycznie przenoszone na robota taśmowego, bez zmiany sposobu dostępu dla użytkownika. Jedyną różnicą po przeniesieniu pliku na robota taśmowego może być wydłużenie czasu dostępu do niego. Dlatego odczytywanie pliku z archiwum może potrwać nawet kilkadziesiąt minut (w zależności od jego wielkości), w tym czasie plik, jeśli został wcześniej zarchiwizowany, jest automatycznie przywracany i udostępniany w odpowiednim katalogu archiwum użytkownika.
-W katalogu '''/archiwum''' użytkownicy mają do dyspozycji prywatne archiwa. Pliki widziane w tym katalogu mogą zostać automatycznie przeniesione do systemu [[Archiwizacja|archiwizacji]].
+{{uwaga2|Regulamin korzystania:
+* Użytkownik może archiwizować wyłącznie dane wejściowe, pośrednie i końcowe używane do obliczeń realizowanych jedynie na komputerach KDM WCSS - archiwizowanie innych danych używanych prywatnie, służbowo i w innych centrach KDM jest zabronione.
+* Zabronione jest zapełnianie katalogu /archiwum w 100%. Prowadzi to do przeciążenia systemu archiwizacji. Należy nadzorować swoje operacje na plikach w sposób ciągły, aby nie doprowadzić do przepełnienia.
+* Zabronione jest składowanie plików mniejszych niż 50 megabajtów ze względu na fakt że obsługa wielu małych plików prowadzi do przeciążenia systemu archiwizacji.
+* Zabronione jest zmienianie nazw plików i katalogów po skopiowaniu na archiwizator.}}
+=== Dostęp do archiwum ===
+Korzystanie z archiwum na klastrze [[Bem]] odbywa się za pośrednictwem dedykowanego węzła '''archiwum.wcss.pl'''. Z tego węzła użytkownik ma dostęp do katalogu domowego i swojego katalogu na roboczym systemie plików. Aby przenieść swoje dane z katalogu domowego lub tymczasowego do/z archiwum należy zalogować się na ten węzeł i wykonać potrzebne operacje na danych.
+* Logowanie na węzeł archiwum (ten sam login i hasło jak na klaster Bem):
+ ssh archiwum.wcss.pl
+Po zalogowaniu archiwum dostępne jest jako katalog o nazwie '''/archiwum/$USER'''. Katalog ten jest prywatnym archiwum użytkownika, niedostępnym dla innych użytkowników.
+=== Operacje na plikach ===
 Korzystanie z archiwum nie różni się od korzystania ze zwykłego katalogu na dysku.
+===== Archiwizacja danych =====
 Aby przenieść dane do archiwum wystarczy je skopiować, np. dla użytkownika <code>user1</code>:
- > cd /home/user1
- > cp plik.txt /archiwum/user1/
- > ls /archiwum/user1/
- plik.txt
-Po skopiowaniu pliku należy usunąć go z dotychczasowej lokalizacji (/home lub /scratch), aby zwolnić miejsce zajmowane przez niego na dysku, np:
+Sprawdzenie zawartości katalogu osobistego:
+ ls /archiwum/user1/
-  > cd /home/user1
- > rm plik.txt
+Skopiowanie pliku:
+ cp plik.txt /archiwum/user1/
-Odczytywanie pliku z archiwum może potrwać od kilkunastu do kilkudziesięciu sekund, w tym czasie plik, jeśli został wcześniej zarchiwizowany, jest automatycznie przywracany i udostępniany w odpowiednim katalogu archiwum użytkownika.
+Po skopiowaniu pliku należy usunąć go z dotychczasowej lokalizacji (/home lub /lustre/scratch), aby zwolnić miejsce zajmowane przez niego na dysku, np:
+  rm plik.txt
+Przeniesienie (skopiowanie i skasowanie w jednym kroku):
+  mv plik.txt /archiwum/user1/
+===== Przywracanie danych =====
+Aby ponownie skorzystać z pliku wystarczy skopiować go do swojego katalogu w przestrzeni /home lub /lustre/scratch, np:
-Aby ponownie skorzystać z pliku wystarczy skopiować go do swojego katalogu w przestrzeni /home lub /scratch, np:
+ ls /archiwum/user1/
+  cp /archiwum/user1/plik.txt /home/user1/
- > cp /archiwum/user1/plik.txt /home/user1/
+  ls /home/user1/plik.txt
-  > ls /home/user1/
- plik.txt
 Jeżeli nie ma potrzeby przechowywania pliku w archiwum, można go stamtąd usunąć, np:
-  > ls /archiwum/user1/
+  rm /archiwum/user1/plik.txt
-  plik.txt
-  > rm /archiwum/user1/plik.txt
+=== Pakowanie i kompresja ===
+Jeśli użytkownik posiada wiele małych plików, które chce przenieść do archiwum, należy je spakować razem i skompresować (kompresja bezstratna). Można to zrobić z wykorzystaniem poleceń <code>tar</code> lub <code>zip</code>.
+===== Pakowanie i kompresja - TAR =====
+Pakowanie i kompresowanie większej liczby małych plików w paczki TAR:
+ tar czvf nazwa_paczki.tar.gz <lista plikow do spakowania>
+Rozpakowywanie narzędziem TAR:
+ tar xzvf nazwa_paczki.tar.gz [<opcjonalna lista plikow do rozpakowania>]
+Sprawdzanie zawartości archiwum TAR:
+  tar tzvf nazwa_paczki.tar.gz
+===== Pakowanie i kompresja - ZIP =====
+Pakowanie i kompresowanie większej liczby małych plików w paczki ZIP:
+ zip -r9 nazwa_paczki.zip <lista plikow do spakowania>
+Rozpakowywanie narzędziem ZIP:
+  unzip nazwa_paczki.zip [<opcjonalna lista plikow do rozpakowania>]
+Sprawdzanie zawartości archiwum ZIP:
+ zipinfo nazwa_paczki.zip
-Archiwizowane pliki są przechowywane w dwóch kopiach i są tworzone ich kopie zapasowe. Archiwum ma dużą pojemność.
+Zobacz też: [[Dostępna przestrzeń dyskowa]]
 [[Kategoria:Podręcznik użytkownika]]