Popis projektu

Hlavním cílem projektu je vytvoření České digitální knihovny, která bude agregátorem digitálních knihoven provozovaných v České republice. Bude nabízet jednotné rozhraní pro koncové uživatele a zároveň bude sloužit jako hlavní poskytovatel dat pro mezinárodní projekty, zejména pro projekt evropské digitální knihovny Europeana. Bude také významným zdrojem digitálních dat a jedním z hlavních pilířů potřebných pro zajištění centralizovaných služeb v rámci České republiky definovaných v Koncepci rozvoje knihoven ČR na léta 2011 – 2014.

Výchozím softwarovým řešením pro Českou digitální knihovnu (dále též ČDK) bude systém Kramerius 4, jehož jádrem je repozitář Fedora. Bude nutné zajistit interoperabilitu s různými typy digitálních knihoven a případně i instituciálních repozitářů. Kromě sklízení dat z různých instancí systému Kramerius bude nutné řešit i propojení s dalšími systémy (např. DSpace, Eprints, Digitool) a případně i proprietárními řešeními využívanými v ČR pro zpřístupnění digitálních dokumentů (např. Ústav pro českou literaturu AV ČR). Pro sklízení dokumentů bude využit především komunikační protokol OAI-PMH. Česká digitální knihovna bude fungovat zároveň jako OAI-PMH provider s podporou setu ESE pro projekt Europeana a případně i dalších metadatových setů vyžadovaných významnými nadnárodními projekty (např. World Digital Library).

Jako propojující prvek a zdroj informací o digitálním dokumentu, původním tištěném zdroji, vlastníkovi, identifikátorech a dalších souvisejících údajích slouží Registr digitalizace. Současné řešení registru je založeno na komerčních nástrojích a je problematické ho nasadit v lokálních podmínkách jednotlivých institucí tak, aby mohly bez jakékoli závislosti na jiných institucích sledovat a evidovat vlastní digitalizační workflow. Nové řešení, které bude založeno na volně dostupných softwarových komponentech, umožní provoz samostatných instancí pro evidenci dílčích kroků digitalizačního workflow přímo na jednotlivých digitalizačních pracovištích. To by usnadnilo rozšíření do institucí provozující vlastní digitalizační aktivity. Stávající centrální registr by pak pouze sklízel data z těchto lokálních instalací a zajišťoval by propojení s dalšími knihovními systémy – lokálními katalogy, digitálními knihovnami, systémy pro zpracování a zejména se Souborným katalogem ČR a s Českou digitální knihovnou, které bude hlavním výstupem tohoto projektu. Toto řešení odstraní závislost jednotlivých digitalizačních pracovišť (provozovaných v knihovnách i v dodavatelských společnostech) na jediné instalaci, která v rámci centrálního Registru digitalizace v Národní knihovně umožňuje v současné době také sledovat a evidovat jednotlivé kroky při vytváření digitálního dokumentu. Stávající stav může způsobit ohrožení provozu digitalizačních pracovišť v případě výpadku centrálního serveru, případně při výpadku připojení na tento server. S možností vlastních instalací lze očekávat vyšší využití tohoto řešení na digitalizačních pracovištích, než je tomu v případě jedné centrální instalace. Do centrálního registru se důsledkem toho dostanou detailnější informace o průběhu a dokončení digitalizace, což se projeví i na rychlé aktualizaci dat v České digitální knihovně.

Při řešení projektu bude vzhledem k propojení více knihovních informačních systémů (knihovní katalogy, digitální knihovny, registr) kladen vysoký důraz na využití persistentních identifikátorů. Jedná se zejména o identifikátory: URN:NBN – identifikátory digitálních dokumentů přidělované Národní knihovnou ČR, čČNB – identifikátor České národní bibliografie, RDCZ – identifikátory Registru digitalizace a UUID – identifikátory jednotlivých částí digitálních objektů.

Česká digitální knihovna bude využívat Registr digitalizace jako hlavní zdroj informací o digitálních dokumentech získaných digitalizací dokumentů tištěných. Z Registru budou přebírána metadata a pro zobrazení budou využity perzistentní odkazy na primární dokumenty. Komunikace uživatele včetně zobrazení vybraného digitálního dokumentu bude probíhat přes jednotné rozhraní ČDK. Budou existovat dvě možnosti uložení primárních dokumentů – ve většině případů zůstanou primární digitální dokumenty v původních digitálních knihovnách a v ČDK budou zobrazeny na vyžádání stažením pomocí perzistentního odkazu, druhou možností bude přenesení digitálních dokumentů na lokální úložiště ČDK. Druhý způsob bude využíván v případech, kdy nebude možné zajistit trvalé odkazy na původní zdroj a pokud to bude v souladu s dodržením případných práv k dokumentům. Vzhledem k vysoké míře prolinkování a sdílení dat mezi různými systémy bude jako kontrolní nástroj využíván a v případě potřeby rozvíjen výstup projektu Národní knihovny ČR realizovaný v roce 2010 v rámci programu MK ČR VISK 3 pro zajištění integrity dat napříč informačními systémy knihoven.

Pro potřeby digitalizačních pracovišť bude vyvinut volně dostupný systém pro dlouhodobou archivaci založené na mezinárodně uznávaných standardech. Obdobné řešení v českém prostředí zcela chybí. NK ČR a MZK budou pravděpodobně pro tento účel díky financování z IOP využívat komerční řešení. Ostatní pracoviště však vzhledem k vysokým nákladům potřebují vhodnou alternativu, kterou by jim měl tento projekt poskytnout. Řešení by mělo sloužit zároveň jako systém pro vytváření a editaci metadat a pro správu digitálních dokumentů tak, aby zajistilo také alternativu produkčního systému. Výchozím materiálem pro splnění tohoto cíle bude výstup projektu KNAV připravovaný v rámci programu VISK v roce 2010.