Autor Wątek: Opis skanów materiałów archiwalnych - standard nazw plików  (Przeczytany 16722 razy)

0 użytkowników i 1 Gość przegląda ten wątek.

Offline Roman Kusyk

  • młodszy(a) archiwista(ka)
  • *
  • Wiadomości: 89
Coraz powszechniejszy w archiwach państwowych proces digitalizacji zasobu oznacza konieczność stworzenia jednolitego systemu opisu skanów materiałów archiwalnych. Jego szczególnie ważnym elementem jest skonstruowanie przejrzystego modelu nazwy pliku (skanu), uniwersalnego i możliwego do przyjęcia we wszystkich archiwach, uwzględniającego różne metody digitalizacji w nich wdrażane. Propozycję takiego rozwiązania opracowaliśmy w Archiwum Państwowym w Lublinie wspólnie z Rafałem Magrysiem i Markiem Krzykałą. Mieliśmy okazję i przyjemność zaprezentować ją na naradzie zespołu problemowego „Informatyka i Archiwa” w Poznaniu w dniach 21-22 kwietnia 2004 roku. Poniższy tekst uwzględnia uwagi członków tego zespołu, za które serdecznie dziękujemy.

1. Realia i założenia

W archiwach państwowych digitalizacja ograniczona jest zazwyczaj do skanowania fragmentów jednostek archiwalnych w celu realizacji zamówień użytkowników zasobu lub dla własnych potrzeb archiwów (strony www, publikacje itp.). Proponowany system opisu skanów powinien uwzględniać ten stan i ułatwiać poruszanie się wśród takich „fragmentarycznych” zasobów cyfrowych. W szczególności, poprzez możliwość szybkiego dotarcia do informacji, czy jakieś części określonej jednostki archiwalnej zostały już zeskanowane, powinien umożliwiać uniknięcie wielokrotnego skanowania tych samych fragmentów (stron, kart). Powinien również ułatwić wykorzystanie dotychczas wykonanych skanów przy realizacji digitalizacji systemowej, będącej zaplanowanym sprowadzeniem do postaci cyfrowej całych jednostek i zespołów.
Doświadczenia lubelskie skłaniają do przyjęcia reguły, że w przypadku doraźnej potrzeby zeskanowania znacznej części jednostki (np. ponad 50%), należy zeskanować ją w całości. Przemawiają za tym względy organizacyjne i ekonomiczne. O ile tylko jest to możliwe, należy również stosować zasadę „jedna strona – jeden skan”, przy czym standard opisu powinien uwzględniać dotychczasową numerację kart (stron).

2. Cele standaryzacji

Proponowany standard opisu powinien umożliwiać:
    - ujednolicenie formatu opisu skanów w archiwach państwowych,
    - uzyskanie informacji o zeskanowanych jednostkach oraz o tym, co w obrębie jednostki zostało zeskanowane,
    - digitalizację „krokową” (tj. skanowanie jednostek we fragmentach i późniejsze ich scalanie),
    - „kompatybilność” z międzynarodowymi standardami opisu archiwalnego, bazami danych  oraz środkami ewidencyjnymi (np. ISAD, SEZAM, IZA)
    - możliwość łatwego wyszukiwania poszczególnych jednostek i ich fragmentów.


Umożliwi to budowę ogólnopolskiego systemu informacji o zdigitalizowanym zasobie, a jeśli okaże się to celowe – utworzenie wspólnej biblioteki zeskanowanych materiałów na centralnym serwerze. System taki może być podstawą do budowy bazy danych uwzględniającej informacje o jednostce archiwalnej (a nie o pliku) – ale naszym zdaniem sama nazwa pliku nie powinna tych informacji zawierać. W proponowanej postaci ma on przede wszystkim umożliwiać odpowiedź, czy konkretny fragment konkretnej jednostki został już zeskanowany. Standard nie musi informować o technicznych parametrach skanu, dacie jego wykonania autorze itp. – mogą być one bowiem generowane automatycznie. Naszym założeniem było użycie w proponowanym systemie elementów głównie numerycznych, co ułatwi w przyszłości budowę systemów wyszukiwawczych.

3. Propozycja formatu opisu

Proponowany przez nas format opisu składa się z 8 elementów, w tym tylko jednego literowego. Są to:
    - kod literowy kraju (w przypadku archiwów polskich – PL),
    - numer archiwum (zgodny z bazą SEZAM),
    - numer zespołu,
    - ciąg dalszy numeru zespołu,
    - sygnatura jednostki,
    - numer karty (strony),
    - cyfrowy symbol recto (1) / verso (2) – lub 0 w przypadku, gdy poprzedni element jest numerem strony, a nie karty,
    - numer kolejny skanu (może się zdarzyć, że konkretna karta (strona) jednostki będzie posiadać kilka skanów, np. związanych z dokumentowaniem prac konserwatorskich czy stanowiących zbliżenia fragmentów strony – pieczęci, inicjałów itp.).


4. Przykład opisu

Przykładowy opis dla skanu z jednostki (dane z bazy SEZAM) 35/322/0/9 (Archiwum Państwowe w Lublinie, zespół:  Akta Florentyna Jana Górskiego notariusza w Lublinie 1810-1822, sygn. jednostki: 9 [Księga aktów notarialnych nr 1671-1933]), karta 57 v, skan nr 1 – miałby postać:

PL-35-322-0-9-57-2-1

Kolejne elementy oznaczają:
    PL – kraj,
    35 – numer archiwum (Archiwum Państwowe w Lublinie – Centrala)
    322 – numer zespołu
    0 – ciąg dalszy numeru zespołu
    9 – sygnatura jednostki
    57 – numer karty
    2 – oznaczenie verso
    1 – pierwszy skan tej strony.


Proponowany przez nas standard stosujemy w Archiwum Państwowym w Lublinie. Mając świadomość różnorodności doświadczeń z digitalizacją w archiwach państwowych i chcąc je uwzględnić w możliwie najszerszej skali - pragniemy poddać go pod dyskusję na forum IFAR. Będziemy wdzięczni za wszelkie uwagi i komentarze.

Piotr Zawilsk

  • Gość
opis skanów
« Odpowiedź #1 dnia: Sierpień 04, 2004, »
Trochę jestem zdziwiony, że problem opisu skanów poruszony przez lubelskich kolegów nie spotkał się do tej pory z żadnym odzewem. :shock: Być może najtrudniej jest zacząć dyskusję. W zwiąku z tym Piotrków będzie pierwszy. Swego czasu w naszym archiwum problem opisu skanów był także dyskutowany i dla własnych potrzeb spróbowaliśmy opracować własny standart opisu zdając sobie przy tym sprawę, że problem wymaga szerszego omówienia i ustalenia standartów obowiązujących w całej sieci archiwlnej (problem był omawiany przy okazji próby zeskanowania w całości księgi posiedzeń Trybunału Koronnego). Jednakże z uwagi na to, że APPT nie jest tak dobrze wyekwipowane jak APL (AgfaScan 330 vs Minolta PS-700) zastosowany przez nas opis był dużo skromniejszy  :wink: i ograniczył się kolejno do następujących pozycji:
nr archiwum
nr zespołu
sygnaturajednostki
nr strony
Teraz po lekturze artykułu kolegów z APL widzimy jak dalece "nasz" opis był daleki od doskonałości.
Moim skromnym zdaniem zaproponowany przez Lublin standart opisu skanów może stanowić podstawę do dalszej dyskusji. Nasz głos w tej sprawie ogranicza się do 2 kwestii:
1. Zaproponowany opis według mnie można spokojnie zastosować także do zdjęć cyfrowych materiałów archiwalnych wykonywanych w archiwach (kilka z nich w tym piotrkowskie zakupiło już aparaty cyfrowe dla swoich potrzeb). Tutaj zgłaszam gotowość do poprowadzenia dyskusji na temat zastosowania fotografii cyfrowej w archiwach państwowych.
2. Zaproponowany standart nie określa sposobu zapisu skanu/zdjęcia okładek jednostek archiwalnych. A te w archiwach państwowych były i są nadal fotografowane metodą tradycyjną. Tutaj można by zaproponować oznaczanie skanów/zdjęć okładek przy użyciu zer: jedno zero dla przedniej okładki, dwa zera dla tylnej (w dalszym ciągu zastowane byłoby oznaczenie recto/verso).
Pozdrawienia dla kolegów z APL
Piotr Zawilski
APPT

Offline staszko67

  • słuchacz(ka)
  • Wiadomości: 4
Opis skanów materiałów archiwalnych - standard nazw plików
« Odpowiedź #2 dnia: Kwiecień 05, 2007, »
W jaki sposób zapisujecie fragmenty tej samej strony

Offline Rafał Rufus Magryś

  • Administrator
  • st. kustosz(ka)
  • *****
  • Wiadomości: 1503
  • Płeć: Mężczyzna
Fragmenty stron
« Odpowiedź #3 dnia: Kwiecień 10, 2007, »
Witam,

 Tu jest nieco większy problem. To co do tej pory było zaproponowane nie przywidywało czegoś takiego jak "fragment strony". Ostatnio dyskutowaliśmy na ten temat w gronie osób zajmujących się w Lublinie digitalizacją i z dyskusji wyszło coś takiego:
Przyjmujemy, że struktura skanów ma charakter hierarchiczny tj. odzwierciedleniem fizycznym jest struktura katalogów a więc:

nr archiwum (katalog)-> nr zespołu(w nim katalog)->ciąg dalszy numeru zespołu (w nim katalog)-> nr jednostki (w nim katalog)->strona(w nim katalog w miarę potrzeby)

"W miarę potrzeby" oznacza, że jeśli strona ma kilka skanów (fragmentów lub dodatkowych obrazów koncentrujących się na jakimś szczególe -np. inicjale, pieczęci) tworzymy dla tej strony dodatkowy katalog i są one w nim umieszczone wraz z, jeśli to możliwe, skanem całości strony/karty. Dodatkowo fragmenty oznaczamy literą "f" dodawaną do wypracowanego wcześniej numeru skanu.
Jest to oczywiście propozycja dodatkowo można rzec "w fazie beta" - do przedyskutowania i (co ważniejsze) do sprawdzenia w praktyce.
Rafał "Rufus" Magryś
...patience is a virtue...

Offline sirsilis

  • archiwa_2.5
  • st. kustosz(ka)
  • *
  • Wiadomości: 998
  • Płeć: Mężczyzna
Jako ze zajmuje sie digitalizacja chce parę słów dorzucic

Re:
4. Przykład opisu

Przykładowy opis dla skanu z jednostki (dane z bazy SEZAM) 35/322/0/9 (Archiwum Państwowe w Lublinie, zespół:  Akta Florentyna Jana Górskiego notariusza w Lublinie 1810-1822, sygn. jednostki: 9 [Księga aktów notarialnych nr 1671-1933]), karta 57 v, skan nr 1 – miałby postać:
PL-35-322-0-9-57-2-1
Kolejne elementy oznaczają:

      PL – kraj,
      35 – numer archiwum (Archiwum Państwowe w Lublinie – Centrala)
      322 – numer zespołu
      0 – ciąg dalszy numeru zespołu
      9 – sygnatura jednostki
      57 – numer karty
      2 – oznaczenie verso
      1 – pierwszy skan tej strony.

Niestety ja mam teki problem ze w pracy muszę wg wytycznych stosować nazwy plików również skomplikowane jak powyższy przykład Utrudnia mi to cholernie prace, bo ja nie skanuje tylko robie zdjęcia efekt podobny a szybciej....


moja propozycja

AP_35_322_9_0000
Kolejne elementy oznaczają:

      AP – skrót od archiwum państwowe
      35 – numer archiwum
      322 – numer zespołu
      9 – sygnatura jednostki
      0000 – numer karty tj 0001, 0002, 0002v
   
      z reszty elementów zrezygnowałbym...

wg mnie nazwy plików, skanów trzeba jak najbardziej uprościć

Offline staszko67

  • słuchacz(ka)
  • Wiadomości: 4
Odp: Opis skanów materiałów archiwalnych - standard nazw plików
« Odpowiedź #5 dnia: Sierpień 21, 2007, »
Uważam, że standard zapisu powinien uwzgledniac dążność do likwidacji szczątków zespołów i unikać zasadniczo pojęcia karty na rzecz strony. Obecna tendencja bowiem zaklada paginowanie materiałów według systemu stron. Stąd tez zapis powinien wyglądać: PL-60-7-123-1, gdzie - PL - kraj, 60 - numer archiwum, 7 - numer zespolu, 123- sygnatura, 1 - strona. Dalsza rozbudowa powinna sie odbywac według dalszego dodawania kolejnego numeru, co będzie równożnaczne z kolejnym numerem skanu np. jeżeli do pozycji PL-60-7-123-1  dodamy kolejna jedynke, to będzie to oznaczało, że jest to kolejny skan tej strony lub fragmentu. Stąd zapis ten będzie bardziej czytelny niż dodawanie liter. Natomiast przed skanowaniem zespół powinien byc do niego przygotowany poprzez sprawdzenie paginacji stron i wprowadzenie ewentualnie właściwej paginacji, co wparawdzie zajmie troche czasu dodatkowo, ale pozwoli uniknąć wielu problemów z późniejsza identyfikacją dokumentu

Offline Wojciech Woźniak

  • Moderator
  • st. kustosz(ka)
  • *****
  • Wiadomości: 1132
Odp: Opis skanów materiałów archiwalnych - standard nazw plików
« Odpowiedź #6 dnia: Sierpień 21, 2007, »
Witam
Uważam, że standard zapisu powinien uwzgledniać dążność do likwidacji szczątków zespołów i unikać zasadniczo pojęcia karty na rzecz strony. Obecna tendencja bowiem zaklada paginowanie materiałów według systemu stron.
Zasadniczo zgoda co do dążenia do likwidacji szczątków, ale póki co taki poziom opisu w archiwach funkcjonuje i podejrzewam, że akcja likwidacji szczątków znacząco opóźniłaby digitalizację, gdyby uzależnić opis skanu od likwidacji szczątku.
Jeśli zaś chodzi o kwestię paginacja-foliacja to nie jest to sprawa tak prosta - wystarczy zajrzeć tu: http://www.lublin.ap.gov.pl/ifar/ifarforum2/index.php?topic=853.0. Uważam, że należałoby zachować symbol (literowy czy cyfrowy) recto i verso. Nie ma sensu paginować na nowo całych zespołów przyjętych do archiwum z foliacją.
Sometimes you eat the bear
and sometimes the bear eats you

Offline staszko67

  • słuchacz(ka)
  • Wiadomości: 4
Odp: Opis skanów materiałów archiwalnych - standard nazw plików
« Odpowiedź #7 dnia: Sierpień 21, 2007, »
Wydaje mi sie, że lepiej jest zrobic raz coś dobrze niż poprawiac nieustannie to samo. Zespół do skanowania powinien być wybierany według kryterium jego opracowania, tzn. po zakończeniu prac. W sprawie paginacji niejednokrotnie spotkałem sie w róznych archiwach z nieustannymi poprawkami np. raz pusta strona jest spaginowana, a innym razem nie. Po co utrudniać jeszcze bardziej sprawę?. Przykład pustej strony jest o tyle ciekawy, że raczej nie zakłada się skanowania stron, które nie są zapisane. W przypadku ich pominięcia zawsze powstaje luka, która zawsze będzie rodziła pytanie: co jest na stronie stronie 123, skoro jej nie zeskanowano i nie udostepniono. Jeżeli styka sie Pan z osobami korzystającymi z archiwaliów, to z całą pewnością wie Pan jacy potrafią być "dociekliwi". W końcu może też pojawić sie problem, że sporo czasu będzie potrzebne na udzielanie takich bezesensownych odpowiedzi, a użytkownik i tak nie uwierzy - typowy przypadek amatorów genealogów, którzy w nigdy nie mogą uwierzyć, że czegoś nie ma i zawsze prawie zakładają, że ktoś próbuje ich oszukać. Można wprawdzie stosować tradycyjną kartę z informacją stron niezapisanych, co jest niekiedy stosowane w archiwach, ale w moim przekonaniu jest to ciagle stosowanie tych samych metod, które niczego nie usprawniają i niczego nie załatwiają ostatecznie, bo kto czyta informację, że gdzieś pomiędzy stroną 123 a 125 jest niezapisana karta 124? Takie karty  w zespolach akt gmin czy miast można spotkać sporo w każdym archiwum. Podejście do tek kwestii w Pana propozycji jest też, w moim przekonaniu o tyle szkodliwe, że nie wypracowuje jednolitej metody, a zakłada funkcjonowanie kilku, co wcale nie ułatwia zamknięcia tej kwestii.

Offline Wojciech Woźniak

  • Moderator
  • st. kustosz(ka)
  • *****
  • Wiadomości: 1132
Odp: Opis skanów materiałów archiwalnych - standard nazw plików
« Odpowiedź #8 dnia: Sierpień 21, 2007, »
Witam
Panie Staszku67 wydawało mi się że rozmawialiśmy o kwestii czy zamieniać foliację na paginacje a nie o poprawności numeracji stron. Moja wypowiedź nie odnosiła sie do błędnie spaginowanych akt - więc niepotrzebnie podnosi Pan argument z pustą, spaginowaną stroną. Na tym etapie naszej dyskusji takiego problemu nie ma - przeciwnie: przy pozostawieniu foliacji może być tak, że niektóre strony będą miały tylko recto a inne recto i verso. A więc użytkownikom może się wydawać, że jest za dużo skanów... Ale to już chyba przypisywanie korzystającym cech, których nie mają. Nieufność w polskim społeczeństwie jest ponoć ogromna i równie dobrze ktoś może nie uwierzyć, że jednostka ma tylko 135 stron...
Sometimes you eat the bear
and sometimes the bear eats you

Offline sirsilis

  • archiwa_2.5
  • st. kustosz(ka)
  • *
  • Wiadomości: 998
  • Płeć: Mężczyzna
Odp: Opis skanów materiałów archiwalnych - standard nazw plików
« Odpowiedź #9 dnia: Wrzesień 03, 2007, »
najlepsze są te teczki które w środku nie są  uporządkowane i ponumerowane ;/  a trzeba je np pilnie zeskanować czy sfotografować, nie mówię że przy skanie teczki powinny być rozszyte  pytanie kto ma później zszywać - osoba skanująca czy archiwista

jeżeli chodzi o numeracje - jestem za numeracja kart a nie stron

pozdr.

Offline Kazimierz Schmidt

  • młodszy(a) archiwista(ka)
  • *
  • Wiadomości: 146
Odp: Opis skanów materiałów archiwalnych - standard nazw plików
« Odpowiedź #10 dnia: Październik 04, 2007, »
Zagadnienie nie jest takie proste (też mi się kiedyś wydawało że tak wystarczy, ale na pewno lepiej tak niż pakować pliki do folderów z nazwami takimi jak j.a.)
Myślę, że taki sposób uporządkowania  informacji o obiektach cyfrowych powstałych w wyniku digitalizacji (nazwa pliku odzwierciedla numer karty lub numer strony) będzie niewystarczający.
Niedługo bowiem się okaże że chcielibyśmy wiedzieć że na pierwszy dokument w teczce składają sie pliki:
<AP_35_322_9_0001, AP_35_322_9_0002, AP_35_322_9_0003>
drugi to pliki od AP_35_322_9_0004 do AP_35_322_9_0098
na trzeci składają sie pliki od AP_35_322_9_0099 do AP_35_322_9_0110 ale to była mapa która nie zmieściła się w jednym pliku i zeskanowano ją w 12 kawałkach. No i ja się pytam: skąd będę wiedział który to jest kawałek pierwszy z lewej strony na górze?
Wreszcie jeśli (kiedyś, może za 30 lat) zejdziemy z opisem do poziomu dokumentu to NIE MAJĄC ich identyfikatorów nie będziemy wiedzieli do jakiego obiektu przyporządkować opis. Polecam w tym zakresie wskazówki każdej większej uznanej w świecie instytucji (np. NARA, LOC, NLNZ). NARA bez ogródek podaje że dla każdego zeskanowanego DOKUMENTU (nie pliku i nie jednostki archiwalnej) trzeba dopisać minimum trzy metadane.
A zresztą zobaczcie sobie tu:
zob. http://www.ihrc.umn.edu/research/vitrage/all/ma/ihrc1538.html
Nie wiem czy wszystkie znajdujące się w zbiorze Stelli Muchy dokumenty zostały zeskanowane (pewnie nie), ale te co są udostępnione mają metadane odnoszące się bezpośrednio do nich a nie tylko do teczek w których siedziały.
Jak jest zeskanowany list Elsy Butler  to jest zestaw metadanych opisowych dotyczący tylko tego listu (Autor, data, a nawet prawa do kopii cyfrowej... oczywiście niezależnie od relacji do obiektów wyższego rzędu (i/mmigration History Research Center Images [Polish American Collection/] i Mickritz, Stella Mucha, Papers)  a także do instytucji przechowującej (University of Minnesota. Immigration History Research Center)
A to tylko potwierdza moje gadanie, że już na etapie skanowania trzeba poszczególne dokumenty od siebie rozdzielać jako osobne obiekty cyfrowe (a nie jako kolejne karty/strony z teczek). Bo potem będzie to bardzo kosztowne.
A jak to zrobić to może napisze jak się wyśpię...
Kazimierz Schmidt

Offline minak

  • słuchacz(ka)
  • Wiadomości: 2
Odp: Opis skanów materiałów archiwalnych - standard nazw plików
« Odpowiedź #11 dnia: Październik 04, 2007, »
Przepraszam, ale nie rozumiem dyskusji... Wygodnie jest, gdy z nazwy np. pliku można odczytać jego położenie; ale pamiętajmy, że zawsze będzie tak, że to względne położenie będzie się zmieniać (bo np. przy scontrum ktoś znajdzie zgubioną kartę i włoży, albo się okaże, że dana karta zabłąkała się przypadkowo etc. etc.). Takich przypadków należy unikać, ale przy tej skali wystarczy, że wystąpią raz na 10.000 kart - i już narobią bałaganu.

Dlatego moim zdaniem rozwiązanie optymalne (i takie stosuję np. opracowując różne źródła do genealogii Potomków Sejmu Wielkiego - http://www.sejm-wielki.pl ) jest takie, że:
- każdy obiekt (w moim przypadku wzmianka o osobie w danym artykule) ma swój unikalny identyfikator, nadany zgodnie z tym, jak dany obiekt był znaleziony)
- jednak w chwili nadania identyfikatora, jego znaczenie się od niego "odkleja" (tzn. sens znaków w identyfikatorze ma związek z jego sensem w momencie powstania, a nie później!) a wszelkie metadane przechodzą do bazy danych.

Dlatego sposób nadawania identyfikatorów może być dowolny, np. (pesel osoby skanującej)_(data)_(numer_kolejny).tiff: to jest BEZ ZNACZENIA, bo metadane muszą być trzymane osobno. A identyfikatory (np. nazwy plików) muszą być po prostu NIEPOWTARZALNE.

Przykład: Krzysztof hr. Gołąbek-Jezierski (prywatnie, syn prezesa NIK) pojawia się u mnie jako zi.7.28.a1a1a1 ( http://www.sejm-wielki.pl/b.php?o=zi.7.28.a1a1a1 ) - co oznacza, że opracowując źródło "zi" (Ziemianie Polscy XX Wieku), w tomie 7, w artykule 28 dana osoba jest w relacji a1a1a1 do probanta (a1a1a1 to u mnie syn z pierwszego małżeństwa syna z pierwszego małż. syna z pierwszego małż.). Jednak także w tym przypadku informację o związku genealogicznym tej osoby z probantem mogę zmienić w swojej bazie w każdej chwili (bo np. okaże się, że źle coś odczytałem), a w identyfikatorze owe "a1a1a1" pozostanie in sacula saeculorum!

Pozdrawiam,
dr Marek J. Minakowski, historyko-genealogo-logik , na etacie w dziale IT Onet.pl - prywatnie syn bibliotekarza i archiwistki :-)

Ale

Offline Kazimierz Schmidt

  • młodszy(a) archiwista(ka)
  • *
  • Wiadomości: 146
Odp: Opis skanów materiałów archiwalnych - standard nazw plików
« Odpowiedź #12 dnia: Październik 04, 2007, »
Bardzo dziękuję. Myślę że bardzo dobrze Pan rozumie widząc jak pięknie Pan to wyłożył :) Pełna (prawie) zgodność z taką ideą.

postaram się więc ją rozwinąć:
Próby "wpakowania" informacji o przynależności danego pliku do określonej grupy dokumentów (albo jeszcze gorzej: próby definiowania folderów z nazwami odzwierciadlającymi tę przynależność) są nieoptymalne. Mimo że doświadczenia z zaszywaniem w identyfikatorze zdigitalizowanego obiektu całej struktury "analogowej" mają za sobą poważne instytucje zob. http://www.nla.gov.au/initiatives/nlapi.html niekoniecznie musi to być droga dobra. Wystarczy zobaczyć np co proponuje w wytycznych archiwum Nowej Zelandii http://www.archives.govt.nz/continuum/documents/publications/s6/s6-app6.php#6

Wystarczy że identyfikatory będą unikatowe i tyle i to jest właśnie to o co chodzi:
Cytuj
sposób nadawania identyfikatorów może być dowolny, np. (pesel osoby skanującej)_(data)_(numer_kolejny).tiff: to jest BEZ ZNACZENIA, bo metadane muszą być trzymane osobno. A identyfikatory (np. nazwy plików) muszą być po prostu NIEPOWTARZALNE

Inną rzeczą są informacje o strukturalnej przynależności do obiektu cyfrowego który TEŻ ma mieć swój unikatowy identyfikator (i wcale nie musi to być od razu identyfikator   jednostki archiwalnej tylko np. jednego kilkustronicowego dokumentu należącego do tej jednostki ale stanowiącego oddzielną całość, mającego twórcę datę itp. dane inne od pozostałych obiektów należących do tej jednostki). Taki obiekt może składać się z wielu plików a informacja o tym że składają się one na ten obiekt powinna być zapisana w metadanych strukturalnych.

Aby jednak tak postępować trzeba mieć dwie rzeczy załatwione:
1. Zasady nadawania unikatowych identyfikatorów. Może niech nie będzie to od razu PESEL (bo ochrona danych osobowych jeszcze się doczepi), ale z cała pewnością powinien to być identyfikator oparty o jakiś unikatowy ID z referencyjnego rejestru publicznego - najlepiej wskazany oficjalnie przez ... ministra właściwego ds informatyzacji. I wtedy skończą się dyskusje.
2. Zasady opakowania zdigitalizowanego "contentu" w metadane strukturalne na co zwracałem uwagę w poprzednim poście. I tu może być kilka rozwiązań które trzeba przemyśleć.

Zdaję sobie sprawę że zaraz ktoś może krzyknąć "zastosujmy METS" i już. I może to będzie dobre rozwiązanie. Wszak byłoby pięknie i standardowo. Tylko będzie to oznaczało że MUSIMY mieć oprogramowanie wspomagające proces digitalizacji które będzie "umiało" automatycznie takie np. metadane tworzyć:
http://www.loc.gov/standards/mets/harvard/leaf129123.xml
Oprogramowanie takie (od strony interfejsu użytkownika) musiałoby (po wpisaniu identyfikatora skanowanego obiektu) pozwalać na wskazywanie kolejnych jego odrębnych części. Jeszcze lepiej by było gdyby oprogramowanie wspomagające proces digitalizacji potrafiło "pobrać" identyfikator z oprogramowania w którym już byłby on przyporządkowany do skanowanego obiektu (wpisywanie czegokolwiek z ręki to nie jest dobry pomysł).
Mam nadzieję, że w tym kierunku pójdą prace w tworzonym NAC. Oczywiście nie sądzę, że takie oprogramowanie mają napisać ludzie z NAC - to byłoby nieporozumienie. ADM(NAC) powinno po prostu takie oprogramowanie zamówić.
Bez narzędzi wspomagających (z górnej półki jak sądzę, ale może nie?) możemy zacząć rozmawiać o tym jak w nazwie pliku ukryć metadane strukturalne obiektów które nie są tylko "kartami". Ale uwaga! każda zmiana typu "przeniesienie części zespołu z archiwum A do archiwum B" spowoduje że nasza pieczołowicie nadana nazwa pliku będzie funta kłaków warta. I to też warto przemyśleć.
... no i może teraz ludzie zrozumieją, że EAD nie jest "zaklęciem" rozwiązującym problem digitalizacji. Bo zakodowany w XML-u inwentarz elektroniczny w którym opis kończy się na jednostce archiwalnej nijak się ma do metadanych strukturalnych koniecznych do zarządzania obiektami cyfrowymi w długim czasie. Gdybyż tak na każdym stanowisku digitalizacyjnym było jeszcze oprogramowanie tworzące METS-owe pliki XML...
Kazimierz Schmidt

Offline Bogusława Deryło

  • młodszy(a) archiwista(ka)
  • *
  • Wiadomości: 159
Odp: Opis skanów materiałów archiwalnych - standard nazw plików
« Odpowiedź #13 dnia: Grudzień 18, 2007, »
Czy jest już opracowany standard nazw plików zdygitalizowanych dokumentów dla wszystkich AP? Czy ktoś nad tym pracuje, a jeżeli tak, to kiedy należy się spodziewać jakiegoś zarządzenia? Chciałabym znormalizować nazwy plików w moim AP, ale jeżeli ma się wkrótce pojawić jakiś standard, to szkoda tracić czas. 

Offline Jacek

  • słuchacz(ka)
  • Wiadomości: 3
Odp: Opis skanów materiałów archiwalnych - standard nazw plików
« Odpowiedź #14 dnia: Styczeń 11, 2009, »
Czy jest już opracowany standard nazw plików zdygitalizowanych dokumentów dla wszystkich AP?

Wydaje mi się, że każdy opisuje jak mu wygodnie.
Ja opisuję tak: PL-numer archiwum-numer zespołu-numer jednostki-numer strony.
Mój kierownik to zaakceptował i chyba jest dobrze  ;)

Jacek