IFAR
Internetowe Forum Archiwalne => Help desk => Wątek zaczęty przez: Grzegorz Gałęzowski w Listopad 20, 2009,
-
Zestawienie narzędzi związanych z programem Data Preservation:
ACE (Audit Control Environment)
ACE to prototypowe narzędzie, które sprawdza integralność plików cyfrowych za pomocą technik matematycznych. Celem tego programu jest zapewnienie autentyczności obiektów cyfrowych w długiej perspektywie czasu. ACE składa się z dwóch składników IMS (Integrity Management Service), który wydaje tokeny integralności dla cyfrowych obiektów i AM (Audit Manager), który okresowo sprawdza repozytoria.
Autor: University of Maryland
Napisane w języku: Java
System operacyjny i środowisko: Bazuje na środowisku Web i jest niezależna od platformy.
Wymaga Java 1.4 lub nowszego.
Aplikacja: Wersja 1.4, https://wiki.umiacs.umd.edu/adapt/index.php/Ace
Dokumentacja: https://wiki.umiacs.umd.edu/adapt/index.php/Ace:Audit_Manager_User_Guide
Licencja: Do uzgodnienia
Ostatnia aktualizacja programu: 6 maja 2009
-
Archive-It
Archive-It to usługa abonamentowa udostępniona przez Internet Archive, która pozwala instytucjom na budowę i utrzymanie własnych zbiorów cyfrowych. Za pomocą aplikacji internetowych partnerzy mogą zarządzać swoimi zbiorami i katalogami. Archiwalia hostowane są na serwerach Internet Archive i dostępne dla użytku publicznego za pomocą wyszukiwania pełnotekstowego. W tej chwili ponad 65 instytucji korzysta z tej usługi.
Autor: Internet Archive
Napisane w języku: Java
System operacyjny i środowisko: Bazuje na środowisku Web.
Aplikacja: http://www.archive-it.org/
Dokumentacja: http://webteam.archive.org/confluence/display/ARIH/Welcome
Licencja: Opłata
Ostatnia aktualizacja programu: N/D
-
LOCKSS Private Network
LOCKSS to oprogramowanie do powielania i przechowywania danych w rozproszonym środowisku. Baza danych stanowi centralny katalog zapisów, które opisują dane w każdym miejscu. Jest używany przez projekt MetaArchive.
Autor: Emory University
Napisane w języku: N/D. Środowisko Web.
System operacyjny i środowisko: N/D. Środowisko Web.
Aplikacja: http://www.metaarchive.org/conspectus/
Dokumentacja: http://www.metaarchive.org/conspectus/
License: N/D
Ostatnia aktualizacja programu: 11/28/2007
-
ContextMiner
ContextMiner to frameworke zajmujący się analizą i prezentacją danych kontekstowych, wraz z danymi. Aplikacja pomaga wydobyć informacje kontekstowe o danym obiekcie. Przez co możemy lepiej zrozumieć jego strukturę.
Autor: University of North Carolina at Chapel Hill, School of Information and Library Science
Napisane w języku: N/D. Środowisko Web.
System operacyjny i środowisko: N/D. Bazuje na środowisku Web.
Aplikacja: http://www.contextminer.org/index.php
Dokumentacja: http://www.contextminer.org/index.php
Licencja: N/D
Ostatnia aktualizacja programu: 4/6/09
-
Dataverse Network
Dataverse Network to oprogramowanie rozprowadzane na zasadach open-source, system zarządzania cyfrową biblioteką. Wykorzystywany do rozpowszechniania, wymiany i cytowania danych ilościowych.
Autor: Institute for Quantitative Social Science, Harvard University
Napisane w języku: Java, Enterprise Edition (Java EE) 5, w tym Enterprise Java Beans (EJB) 3 i Java Server Faces.
System operacyjny i środowisko: Środowisko Web.
Dokumentacja: http://thedata.org/
Aplikacja: http://dvn.iq.harvard.edu/
Licencja: Gnu Affero General Public License, version 3.
Ostatnia aktualizacja programu: Wersja 1.5, 5/09.
-
Digital Archive
Digital Archive zapewnia bezpieczne środowisko składowania, zarządzania i monitorowania danych cyfrowych. Może się także zintegrować z różnymi systemami obiegu dokumentów. Digital Archive zapewnia minimalizację kosztów ogólnych związanych z bezpiecznym przechowywaniem plików.
Autor: OCLC
Napisane w języku: Java
System operacyjny i środowisko: Linux, MySQL, Apache, Tomcat
Aplikacja: http://oclc.org/digitalarchive
Dokumentacjan: http://www.oclc.org/digitalarchive/support/default.htm
Licencja: Opłata
Ostatnia aktualizacja programu: Regularnie aktualizowany w cyklu rozwojowym co sześć tygodni.
-
DiscoverInfo
DiscoverInfo jest narzędziem do badania zbiorów dokumentów cyfrowych. Program pozwala użytkownikowi na:
- wyszukiwanie pełnotekstowe w całych zbiorach, tworzenie indeksów tekstowych, HTML, XML i PDF.
- pobiera istotne informacje z indeksowanych kolekcji,
- wyszukuje nowe zmiany dokumentach.
Autor: University of North Carolina at Chapel Hill, School of Information and Library Science
Napisane w języku: N/D. Bazuje na środowisku Web.
System operacyjny i środowisko: N/D. Środowisko Web.
Aplikacja: http://idl.ils.unc.edu/~chirag/DIToolkit/
Dokumentacja: http://idl.ils.unc.edu/~chirag/DiscoverInfo/index.html
Licencja: N/D
Ostatnia aktualizacja programu: 2/11/2007
-
GIS Archiving Toolset
Toolset przygotowuje wektorowe i rastrowe dane do archiwizacji. Zapewnia walidację, skanowanie antywirusowe, tworzenie opisu, zarządzanie metadanymi, itd.
Autor: NCSU
Napisane w języku: Python
System operacyjny i środowisko: Został napisany z myślą o funkcjonowaniu na wielu platformach systemowych. Nie był jednak testowany w systemie Linux. Wymaganiem podstawowym jest posiadanie zainstalowanego Python?a. Większość funkcji wymaga połączenia z zewnętrznymi aplikacjami: ClamAV, NOID, 4Suite XML i JHOVE.
Aplikacja: Narzędzie nie jest udostępnione.
Dokumentacja: Nie jest udostępniona.
Licencja: N/D
Ostatnia aktualizacja: 3/5/2008
-
Heritrix
Heritrix jest elastycznym, rozszerzalnym robotem indeksującym, archiwizującym i analizującym materiały dostępne w Internecie.
Autor: Internet Archive
Napisane w języku: Java
System operacyjny i środowisko: Napisane w języku Java. Musi być zapewniony dostęp do Java Runtime Environment. Heritrix nie był testowany w systemie Linux.
Aplikacja: http://crawler.archive.org
Dokumentacja: http://crawler.archive.org/articles/user_manual i http://webteam.archive.org/confluence/display/Heritrix/Home
Licencja: GNU Lesser General Public License 2.1 (http://crawler.archive.org/license.html); w przyszłości migracja do licencji typu Apache License 2.0
Ostatnia aktualizacja: 2/20/2008
-
JSTOR/Harvard Object Validation Environment
JHOVE to rozszerzalny system zaprojektowany w celu zapewnienia automatycznej i skutecznej identyfikacji, a następnie weryfikacji plików cyfrowych, przy minimalnej ingerencji człowieka.
JHOVE obsługuje następujące formaty: AIFF, ASCII, GIF, HTML, JPEG, JPEG 2000, PDF, TIFF, UTF-8, WAVE i XML.
Autor: Harvard University
Napisane w języku: Java 1.4
System operacyjny i środowisko: Ze względu na język Java jest niezależny od platformy systemowej.
Aplikacja: wersja dostępna z poziomu linii poleceń:
http://hul.harvard.edu/jhove/using.html#invocation
Wersja graficzna
http://hul.harvard.edu/jhove/using.html#gui
Dokumentacja: http://hul.harvard.edu/jhove/documentation.html
Licencja: GNU Lesser General Public License (LGPL) (http://www.gnu.org/licenses/lgpl.html)
Ostatnia aktualizacja programu: 12/17/2007
-
NutchWAX
Oprogramowanie do indeksowania plików ARC (zarchiwizowane witryny Web przy użyciu programu Heritrix) i następnie do wyszukiwania pełnotekstowego. NutchWAX oparty jest na licencji open-source, wyszukiwarki internetowej Nutch.
Autor: Internet Archive
Napisane w języku: Java
System operacyjny i środowisko: Niezależny od platformy, testowany wyłącznie w systemie Linux.
Aplikacja: http://archive-access.sourceforge.net/projects/nutchwax/
Dokumentacja: http://archive-access.sourceforge.net/projects/nutchwax/apidocs/overview-summary.html
Licencja: GNU Lesser General Public License 2.1
Ostatnia aktualizacja programu: 1/17/07
-
PAWN
Producer-Archive Workflow Network (PAWN) to system pracy przeznaczony dla osób, które mają małe kolekcje cyfrowych plików, które następnie muszą być przetwarzane w systemach zajmujących się długotrwałym przechowywaniem danych. PAWN nie oferuje długoterminowej archiwizacji i jest wykorzystywany jedynie do zarządzania takimi systemami.
Całość składa się z:
- Client, służący do pobierania danych, zarządzania użytkownikami i organizacją zapisu.
- Management server. Kontrola i zarządzanie serwerem.
- Scheduler. Przydziela miejsca na serwerze i kontroluje konfiguracje serwerów.
- Receiving server. Odbiera dane od klientów, umożliwia zmianę danych w zależności od poświadczeń i przekazuje dane w kierunku zatwierdzonym przez użytkowników.
Autor: University of Maryland
Napisane w języku: Java
System operacyjny i środowisko: Środowisko Web. Wymagana Java 1.5 (Java 5) lub nowsza.
Aplikacja: http://adaptwiki.umiacs.umd.edu/twiki/bin/view/Main/PawnDemoClient
Dokumentacja: http://narawiki.umiacs.umd.edu/twiki/bin/view/Main/PAWN
Licencja: Każdy kto jest zainteresowany aplikacją proszony jest o kontakt na e-mail: joseph@umiacs.umd.edu
Ostatnia aktualizacja programu: 01/2008.
-
TubeKit
TubeKit to zestaw narzędzi do tworzenia robotów dla serwisu YouTube. Pozwala użytkownikom na stworzenie własnych narzędzi, które będą indeksować zawartość serwisu YouTube na podstawie 17 różnych atrybutów. TubeKit pomaga we wszystkich etapach pracy, od stworzenia bazy danych aż do przeglądania i przeszukiwania interfejsów, które zapewniają dostęp do zgromadzonych danych.
Autor: University of North Carolina at Chapel Hill, School of Information and Library Science
Napisane w języku: PHP.
System operacyjny i środowisko: N/D. Środowisko Web.
Aplikacja: http://www.tubekit.org/download.php
Dokumentacja: http://www.tubekit.org/index.php
Licencja: N/D
Ostatnia aktualizacja programu: 10/5/2008
-
Wayback Machine
Wayback Machine to potężny system służący do wyszukiwania archiwizowanych stron za pomocą Heritrix (pliki ARC lub WARC).
Autor: Internet Archive
Napisane w języku: Java
System operacyjny i środowisko: serwer Tomcat
Aplikacja: http://archive-access.sourceforge.net/projects/wayback/
Dokumentacja: http://archive-access.sourceforge.net/projects/wayback/administrator_manual.html
Licencja: GNU Lesser General Public License 2.1 (http://archive-access.sourceforge.net/projects/wayback/license.html); migracja w przyszłości do Apache License 2.0
Ostatnia aktualizacja programu: 2/6/2008
-
Web Archives Workbench
Web Archives Workbench to zestaw narzędzi do przechwytywania zasobów Web. Zarządza zarchiwizowaną treścią z agregowanych danych. Całość składa się z:
-Discovery Tool, pomaga w identyfikacji potencjalnych witryn, które będą indeksowane
-Properties Tool, narzędzie odpowiedzialne za metadane archiwizowanych witryn Web
-Analysis Tool, umożliwia analizę struktury witryny
-Harvest Tool, narzędzie służące do monitorowania postępu indeksowania stron. Informacje kodowane są z wykorzystaniem Dublin Core.
Autor: OCLC
Napisane w języku: Java, JavaScript, JSP
System operacyjny i środowisko: Linux
Aplikacja: http://sourceforge.net/projects/webarchivwkbnch
Dokumentacja: Dostępna na stronie SourceForge
Licencja: Dostępna na stronie SourceForge
Ostatnia aktualizacja programu: 9/12/2007
-
Web Archiving Service
Web Archiving Service (WAS) jest narzędziem Web, które pozwala archiwistom na przechowywanie, analizowanie i zabezpieczanie informacji sieciowych. Pozwala na indeksowanie Internetu, przechowywanie stron, budowanie zbiorów archiwalnych witryn Web.
Autor: California Digital Library
Napisane w języku: Java, Ruby on Rails
System operacyjny i środowisko: Przeglądarka Internetowa z obsługą języka Javascript.
Infrastruktura obejmuje maszyny z systemami Solaris 10 i Linux. Inne narzędzia jakie są używane to: Heritrix, NutchWAX, Open Source Wayback Machine, MySQL, i Storage Resource Broker.
Aplikacja: N/D
Dokumentacja: http://was.cdlib.org
Licensing: N/D
Ostatnia aktualizacja programu: N/D
-
Witam,
Proszę o wpisywanie takich informacji do jednego posta - a nie do kilkunastu bo dotyczy tej samej sprawy. Atomizacja nie bardzo pozwala to ogarnąć.
Pozdrawiam,