Internetowe Forum Archiwalne > Archiwizacja materiałów cyfrowych i digitalizacja analogowych

Co to jest struktura dokumentu elektronicznego?

(1/2) > >>

Kazimierz Schmidt:
W projekcie ustawy o informatyzacji czytamy:
Minister właściwy do spraw informatyzacji w porozumieniu z ministrem właściwym do spraw administracji publicznej określi, w drodze rozporządzenia:
1) strukturę dokumentów elektronicznych wykorzystywanych w wymianie informacji w formie elektronicznej między podmiotami publicznymi;

pytania brzmią:
1. Co to jest dokument elektroniczny?
2. Co powinien okreslic w rozporządzeniu Minister? albo inaczej: Co to jest struktura dokumentu elektronicznego?

Ankieta dotyczy struktury dokumentu elektronicznego którą powinien okreslić minister w rozporządzeniu. Projekt znajduje sie na stronach Sejmu RP zob. http://orka.sejm.gov.pl/SQL.nsf/projustkom4?OpenAgent&NIF

Myślę, że nie musze przekonywać iż bedzie to miało kapitalne znaczenie dla archiwalizacji takich dokumentów...
Czekam na posty (sam mam juz wyrobione zdanie) W związku z tym że sprawa jest skomplikowana a ankieta musi zawierac poste pytania prosze o zaznaczenie opcji najbliższej prawdzie i dopisanie komentarza w postaci postu...
Mam nadzieję że trochę rozruszam to Forum
Wasz moderator

Scalarvector:
Ja bym zdefiniował dokument elektorniczny jako sekwencję danych możliwych do odczytu przez człowieka  jak jest możliwy do odczytana przez oprogramowanie - jak jest napisane że minister ma określić strukturę danych - to oznacza że minister może opisać jakie technologie mają być stosowane w wymianie informacji.

ideałem byłoby pokazanie przepływu danych z informacją za pomocą pewnych modeli - ale język prawniczy raczej zagmatwałby całe rozporządzene o dokumencie elektronicznym (może ktoś czytał ustawę o podpisie elektronicznym i rozporzadzeńia do tej ustawy).

no jestem ciekawy czy będzie on definiował pojęcia takie jak TCP czy HTTP jako warstwę transmisyjną - a może będze określał dokument jako "plik" czy jako "rekordy bazy danych" a może wybierze jakiś format danych typu PDF czy .DOC (i napisze że tylko te formaty pozwalają na stosowanie podpisu elektronicznego)

Może ja na miejscu ministra napisałbym schemat XML i usługęWeb
i niech już programiści piszą do tego schematu oprogrsmowanie (klienta)

Najprosciejszy schemat XML opisywałby "to co już ustaliła dyplomatyka"
treść, podpis i do kogo oraz "znaczek opłaty skarbowej"

Pozdrawiam
Scalarvector

Kazimierz Schmidt:
Scalarvector napisał:
...no jestem ciekawy czy będzie on definiował pojęcia takie jak TCP czy HTTP jako warstwę transmisyjną - a może będze określał dokument jako "plik" czy jako "rekordy bazy danych" a może wybierze jakiś format danych typu PDF czy .DOC (i napisze że tylko te formaty pozwalają na stosowanie podpisu elektronicznego)...
odsyłam tu do projektu ustawy o infrormatyzacji o której już pisałem. Definiując strukturę dokumentu elektronicznego wg mnie nie powinniśmy w ogóle wtrącać się w format zapisu. To dlatego pytałem co rozumiemy przez strukturę dokumentu elektronicznego.
Zauważcie że dla różnych ludzi struktura dokumentu elektronicznego będzie oznaczać co innego:
1. - format zapisu (przeważnie informatyk)
2. - struktura metadanych (przeważnie zaawansowany użytkownik infromatyki)
3. - struktura treści na ekranie lub wydruku (przewąznie początkujący użytkownik infromatyki)

Nie ukrywam że uważam się za tego drugiego. Mnie nie interesuje czy dokument będzie zapisywany na sposób DOC, PDF. SXW, XML+DTD czy w jakikolwiek inny sposób ... techniczny. Ja sobie życzę żeby miał możliwość zapisywania np.w takich metadanych jak:

a.   twórców i współtwórców dokumentu,
b.   rozmiar dokumentu (ilość znaków, ilustracji, rozmiar w bajtach itp.)
c.   datę i czas powstania dokumentu,
d.   status dokumentu (roboczy, wstępnie zatwierdzony, zatwierdzony)
e.   datę i czas zatwierdzenia dokumentu oraz osobę/instytucję upoważnioną do zatwierdzenia
f.   tytuł dokumentu
g.   powiązania/relacje  z innymi dokumentami,
h.   tematykę dokumentu
i.   język dokumentu
j.   cel powstania dokumentu (w szczególności adresatów dokumentu)
k.   dostępność treści dokumentu (ograniczenia dotyczące czasu lub osób upoważnionych do odczytania treści)
l.   prawa autorskie (czy dokument jest chroniony prawem autorskim, ewentualne ograniczanie dotyczące czasu, lub obszaru eksploatacyjnego praw autorskich)
m.    typ dokumentu (np .rozporządzenie, sprawozdanie, kwestionariusz, raport)
n.   kategorię archiwalną dokumentu /informację o długoterminowym przechowywaniu (obowiązkowy czas przechowywania dokumentu wraz z kompletem metadanych, czas przekazania do archiwum państwowego)
o.   unikatowy numer dokumentu nadany przez system teleinformatyczny
p.   numer kancelaryjny dokumentu określony zgodnie z obowiązującą w instytucji publicznej instrukcją kancelaryjną

czyli taki DUBLIN CORE + E-GMS po polsku. Możliwośc zapisania metadanych ma być od formatu zapisu (systemu zapisu), czy jakkolwiek go nazwiemy, niezależna. Ma być to możliwe tak jak ma być możliwe pobrubianie czcionek , kursywa, duże litery itp.
więcej na ten temat w nastęnym dużym poście
ks

Justyna Adamus:
Kochani!
O czym my mówimy? CZy o dokumentach elektronicznych, których mamy całe mnóstwo, chociażby strony www?? czy o materiałach archiwalny? Po co dla całego ogromu istniejących dokumentów elektronicznych metadane? Oczywiscie mozemy je tworzyc dla niektórych dokumentów. Pytanie jakich?
W nawiązaniu do mojej poprzedniej wypowiedzi na ifar.
W archisityce polskij dokument jest tak definiowany jak ang. "record"; na całym świecie, natomiast akt jako ang. "document". Strasznie kłopotliwe jest wybrnięcie z tego problemu. Nalezałoby czym predziej zamienic te terminy w naszej archiwistyce!!! bo nie przystają do wymagań międzynarodowych!!! Stad cały problem. Co już nieco chaotycznie zostało nakreślone w mojej poprzedniej wypowiedzi.
W kontekście ustawy jest mowa o dokumentach elektornicznych, czyli co nas archiwistów to wogóle obchodzi, jak oni chcą tworzyc Plan Informatyzacji Państwa w oparciu o dokumenty elektorniczne. czyli co?
cytat z projektu ustawy: "dokument elektroniczny – dane, które są zapisane i przechowywane na jakimkolwiek elektronicznym nośniku informacji albo w systemie teleinformatycznym, albo w innym podobnym urządzeniu, dające się odczytać lub odebrać przez osobę lub system teleinformatyczny lub inne podobne urządzenie"
Dane, czyli wszystko co mozna zapisac i odczytac.
Ustawa oczywiscie jest potrzebna, ale dla Nas archiwstów co znaczy??

Nie ma tam terminu akta, mamy termin dokument elektroniczny. W ustawie ma zastosowanie bo mówimy o informacjach pubicznych, a wiec wszystko może nim być (archiwizacja zaczyna się oczywiscie od takiego "nic nie znaczącego" dokumentu), ale dla nas archiwistów ważne jest wyodrębnienie tych dokumentów które beda istotne z punktu widzenia archiwistyki!!! Czyli ang. "records" według mnie akta. Termin tak dobry i prosty, bo inny niż dokument i w rozumieniu potocznym właściwy, lepszy. Tylko niezgodny z  Polskim Słownikiem Archiwalnym (1974r.). Jeśli ktos wie o co mi chodzi to się ciesze  :wink:  jeśli nie to chętnie dokladnie wyjaśnię  :wink:
W momencie tworzenia owszem wszystkie dane w formie elektronicznej możemy traktowac jako dokument i wazne jest aby instytucje publiczne przyjęły tu już pewnien standard ale dla Nas takie aby łatwo było "zrobic" z każdego dokumentu "record" czyli akt (definiowany w PSA pod hasłem dokument!). Taka zamiana byłaby zgodna z terminologią miedzynarodową. Dość powiedzieć, że Def. dokumentu z projektu ustawy zgodna jest z ang. "electronic document" a z archiwalnym dokumentem (PSA) NIE. W koncu na cos sie musimy zdecydowac.
Projekt ustawy w ogóle nie podoba mi sie w tym momencie, wogóle nie mówi o aktach "records" tylko o dokumentach elektronicznych. Chyba ze mamy w planach własną ustawę. Ustawa o informatyzacji mało ma wspólnego z archiwizacją. Przyjmujemy dokument elektroniczny jako odpowiedni do archiwizownia?? zamiast zajmować się informacją publiczną musimy juz pracować nad wymaganiami systemu archiwizowaia elektorniczny akt. Ponadto Plan, który ma powstać na podstawie ustawy chyba szybko się zdezaktualizuje i nie uwazam aby to było dobre, aby przejmować kontrolę nad systemem teleinformatycznym. Należałoby stworzyć system informacji gospodarczej.
Dla nas wazne byloby przyjecie ustawy w swietle przepisów kancelaryjno-archiwalnych, które powinny byc opracowywane dla archiwizowania dokumentów elektronicznych.
Metadane dla dokumentów elektoricznych owszem, ale dla archiwistów ważniejsze będą metadane dla akt. Jakby Pan chciał np. każdą stronę www instytucji pubicznych opisywać zgodnei z powyższym schematem to powodzenia! Choc strona internetowa instytucji pod nadzorem tez może powinna być zarchiwizowana, tylko kiedy ? w którym momencie jej istnienia? I wreszcie jaka to kategoria archiwalna? hehe

Ustawa ma określać "minimalne wymagania" tego i tamtego, a moze lepiej by było gdyby okreslala funkcje jakie ma spełniać ten cały system, powiedzmy informacyjny a nie informatyczny, bo zadne zarządzenie nie jest w stanie okrelic minimalnych wymagan. Dzis owszem ale co one beda znaczyly jutro!?Ustawa wogole...moze wystarczy, bo "chce życ"! W kazdym razie dla archiwistów to moze byc tylko problem, bo beda za chwile musili dostosowac swoje przepisy archiwizacji dokumentów elektornicznych, czyli tworzenia elektronicznych akt do tych "minimalnych wymagan", system archiwizowania bedzie musial byc kompatybilny z systemem teleinformtycznym. Tworcy ustawy i instytucja nadzorujaca to cale przesięwziecie bedzie nam dyktowac warunki.
Co do metadanych to opracowanie zestawu elementów opisu w metadanych interesuje nas przede wszystkim dla
elektronicznych akt!!!
Co ma robić Naczelna według ustawy -
cytat z projektu:
"Art. 16.   Minister właściwy do spraw informatyzacji, po zasięgnięciu opinii Naczelnego Dyrektora Archiwów Państwowych, określi, w drodze rozporządzenia, sposób rejestracji, przechowywania i archiwizacji dokumentów elektronicznych powstałych i gromadzonych w  podmiotach publicznych, uwzględniając potrzebę długotrwałego przechowywania dokumentów elektronicznych oraz minimalne wymagania dla rejestrów publicznych i wymiany informacji w formie elektronicznej." pozostawie bez szerszego komentarza, bo to jakby wskazuje juz, ze My bedziemy "tańczyc jak nam zagrają", z całym szacunkiem oczywiście!!!
Nie wiem czy wszystko dobrze rozumie, bo moze archiwa mają koordynowac te działania?
 Art. 5 pkt 2 2) 2)   koordynację realizowanych przez więcej niż jeden podmiot publiczny projektów informatycznych o publicznym zastosowaniuPo co az koordynowac? czy nie lepiej okreslic wymagania funkcjonalne i niech kazda instytucja je spełnia. Nalezałoby raczej koordynowac funkcje instytucji w zakresie informacji publicznych oraz stosowane narzędzia, a nie informatyków lub firmy informatyczne. Czy minister wogóle powinien nieć takie uprawnienia? Lepiej byloby okreslic co ma robic system. W tym samym art.  opracować:zestawienie oraz charakterystykę głównych i sektorowych projektów informatycznych służących realizacji priorytetów, o których mowa w pkt 1, szacunkowe koszty realizacji tych projektów oraz wskazanie źródeł ich finansowania; bez komentarza, szczególnie pierwsza część!
I wreszcie czym jest Rejestr publiczny? Co znaczy dla archiwisty? Cytat z projektu ustawy:
rejestr publiczny – rejestr, ewidencja, wykaz, lista, spis albo inne podobne urządzenie ewidencyjne służące do realizacji zadań publicznych, prowadzone przez podmiot publiczny na podstawie odrębnych przepisów;
Zastanowmy sie poki ustawa nie weszla w zycie! A moze juz za późno?!
I na koniec troche samokrytki, prawda taka ze najłatwiej jest krytykowac!
Ogólnie rzecz ujmując to wspaniale bedzie wreszcie w naszym Państwie: prowadzić wymianę informacji również w formie elektronicznej przez wymianę dokumentów elektronicznych związanych z załatwianiem spraw należących do ich zakresu działania, przy wykorzystaniu elektronicznych nośników informacji lub środków komunikacji elektronicznej.[art. 15]
Idea przyswiecająca ustawie jest bardzo szczytna! Dla nas archiwistów pojawiają sie nowe wyzwania!!!
Pozdrawiam ciepło!!!
justyna

Kazimierz Schmidt:

--- Cytat: "Justyna Adamus" ---
O czym my mówimy? CZy o dokumentach elektronicznych, których mamy całe mnóstwo, chociażby strony www?? czy o materiałach archiwalny? Po co dla całego ogromu istniejących dokumentów elektronicznych metadane? (...)
Metadane dla dokumentów elektoricznych owszem, ale dla archiwistów ważniejsze będą metadane dla akt. Jakby Pan chciał np. każdą stronę www instytucji pubicznych opisywać zgodnei z powyższym schematem to powodzenia! Choc strona internetowa instytucji pod nadzorem tez może powinna być zarchiwizowana, tylko kiedy ? w którym momencie jej istnienia? I wreszcie jaka to kategoria archiwalna?"

Otóż uważam że:

1. Strona www nie jest dokumentem elektronicznym tylko ... zbiorem dokumentów elektronicznych. I należy ją zupełnie inaczej traktować. Nie szukac analogii do świata papieru bo w ten sposób nakłada  się ograniczenia.

2. Na pytanie "w którym momencie jej istnienia" odpowiedzią są właśnie matadane. Pozwolę sobie zacytować tu ... siebie - z bratniego forum na stronie www.archiwa.net
...podzielić się tutaj pewnymi spostrzeżeniami które być może nie są takie oczywiste. "Duże" strony www opierają się o konstrukcje typu bazy danych istniejące "w tle" tego co widzimy na ekranie monitora. Zapamiętywanie dla potrzeb historycznych "wyglądu" strony www takiego Onetu czy Gazety, a także dowolnego BIP-u (który z definicji zawartej w przepisach prawa także powinien opierać się o bazę danych)to wg mnie bardzo droga metoda postepowania. Inaczej: zrzucanie stron www (jako stron) nie wydaje sie dobrym sposobem ich archiwizacji. Wszak dla każdej takiej strony istnieje projekt który w miarę czasu wypełnia się zmianiającą się treścią. Dlatego wystarczy zapamiętać projekt strony (i ew. kolejne zmiany) + pojedyncze elementy wypełniające stronę. Każdej wiadomości, fotografii czy innemu plikowi danych towarzaszą metadane "umiejscowiające" w odpowiednim miejscu strony. Data i godzina powieszenia pliku na stronie, a także jego przesunięcia do archiwum (strony!) to także metadane. Wystarczy więc zapamiętywać pojedyńcze "cegiełki" z jakich sie strona składa wraz z metadanymi a możliwe będzie odtworzenie wyglądu strony w dowolnym momencie jej istnienia. W ten sposób od razu rozwiązujemy problem zapamiętywania "zagłębień" w strukturze strony i jej dynamicznych zmian. Tak więc "archiwizacja stron www" jest możliwa, a gdzieniegdzie nawet już się (automatycznie) dokonuje. Ewentualna gazeta (czy gmina) po plajcie lub likwidacji będzie mogła przekazać PLIKI z metadanymi a nie "strony www" do archiwum. Przepraszam ale nie moge się powstrzymać to od analogii do telewizji. Archiwizacja programu informacyjnego to archiwizacja pojedyńczych "newsów" a nie całego programu "jak leci". Wszak potem z tych cegiełek można odtworzyć całość... Oczywiście nie jest to takie proste jak tu piszę ale to tez tylko mały głos w dyskusji wskazujący pewną ideę...
i dalej:
Archiwizacja danych i archiwizacja metadanych nie jest czym innym: jest tym samym. Metadane powinny być integralną częścią danych. Mówią o tym wszystkie rekomendacje wynikające z programów UE sponsorowanych w ramach 5 i 6 programu ramowego, a także standard OAIS czy UNESCO GUIDELINES FOR THE PRESERVATION OF DIGITAL HERITAGE
Dziś powstaje taka masa dokumentów elektronicznych, że żadnego państwa nie będzie stać na aby je potem archiwalizować (bo taka jest definicja w PSA) inaczej jak w pełni automatycznie. To twórca dokumentu powinien już momencie jego powstania go prawidłowo, zgodnie ze standardem, wyposażyć w metadane.

3. Strona www (np. BIP) jest wtórnikiem złożonym z wcześniej przygotowanych w instytucji dokumentów. Najpierw je się pisze a potem wiesza na stronie. Gdyby zająć się osobno stroną www i osobno wewnętrznym systemem obiegu dokumentów dwa razy robilibyśmy tę samą robotę. Trzeba zapamiętać pojedyncze dokumenty które mają swoich autorów, i dopiero z nich budować "elektroniczne akta". NIE ODWROTNIE. Metodyka pracy znakomicie sprawdzająca się przy papierze tj. od ogółu do szczegółu (zespół, seria, jednostka, dokument) jest całkowicie nieprzydatna dla dokumentów elektronicznych. Dobym przykładem jest to forum internetowe. Nie jest ono niczym innym jak bazą danych gdzie każdy post (także i ten) ma automatycznie zapamiętaną datę, autora, tytuł, a nawet głowny temat. I archiwizowanie tegoż jako "strony www" nie ma sensu. Gdy powstanie Państwowe Archiwum Dokumentów Elektronicznych to będzie ono potrzebowało "paczki" z pojedyńczymi dokumentami (postami) dla których będzie określone to co się da automatycznie przekazać. I nie chciałbym aby ktokolwiek próbował przygotowywać ... spis zdawczo-odbiorczy dokumentów z forum IFAR, i jeszcze łaczyć je w jednostki archiwalne.
Może ktoś tu zabłądzi z Gazety Wyborczej albo z Rzeczpospolitej i napisze jak są "archiwizowane" wydania www. Bynajmniej nie "jako strony www" tylko jako pojedyńcze teksty którym "dokłada się metadane" zawierające informację kiedy i gdzie wisiały. Mało tego - system typu CRM dołoży nowe metadane jak ktoś taki "archiwalny" artykuł znajdzie i go wyświetli czy skopiuje. W ten sposób każdy tekst jest zapamiętany JEDEN RAZ. Oczywiście istnieją jeszcze "backupy" systemu ale one służa tylko do odtworzenia po awarii.

Dla dokumentów "biurowych"  będzie nieco inaczej: każdy dokument może mieć wiele wersji w miarę jak będzie powstawał. Ale uwaga: jak ktokolwiek będzie chciał taki dokument załączyć to w nowoczesnym systemie obiegu dokumentów nie dołączy jego kopii (jak dziś ksero) tylko link do miejsca gdzie on się znajduje. Tak samo będzie ze stronami www, jak i z wewnętrznymi "elektroteczkami" zastępującymi dzisiejsze teczki wiązane...
Podsumowując:
Uważam że nie będzie się opisywac "akt" tylko pojedyncze dokumenty. Nie będą tego robić archiwiści tylko urzędnicy. Archiwiści wyjdą z archiwów i będą wspomagać (uczyć) urzędników. Takie szkolenia angielska PRO (jeszcze jako PRO) robiła dla całego rządu. Po to żeby się automatycznie archiwizowało.
Może być tez tak, że nie odejdziemy od naszej metodyki i wtedy stosowne przepisy zrobi za nas Ministerstwo Nauki i jak pisze moja znakomita koleżanka zostaniemy odsunięci.
Zawsze jednak możemy się pocieszyć że archiwiści i tak bedą mieć roboty jeszcze na kilkadziesiąt lat z papierem.
--- Koniec cytatu ---

Nawigacja

[0] Indeks wiadomości

[#] Następna strona

Idź do wersji pełnej