Digitaliseren en Implementeren  van Informatie

 

 

 

Digitaliseren
Het omzetten van documenten naar een voor de computer begrijpbaar digitaal formaat.

 

Implementeren
Verwezenlijken, tot uitvoer brengen / een nieuw systeem invoeren in een organisatie.

 

Erik kan u helpen de omschakeling te maken van Analoog naar Digitaal

 

Analoge werkomgeving - Archiefruimte

Digitale Werkomgeving - Serverruimte met Data

 

Analoge informatie voorziening

 

 

Digitale informatievoorziening

 

Van Analoog naar Digitaal

 

Substitutie

Documentmanagement is een veelgebruikte term die voor een ieder van ons een andere betekenis heeft. Eigenlijk is het niet meer dan een middel om vanaf het moment van documentcreatie, zicht te houden op de levenscyclus van het document. Met het managen van "actieve" documenten kan de alsmaar groeiende informatiestroom beheersbaar blijven.

Eigenlijkis Document Management dus een hele brede term die een heleboel processen and systemen kan omvatten. Document Management is het geheel van procedures en functionaliteiten is die ervoor zorgen dat documenten op een gecontroleerde en beheerde manier worden opgeslagen,  gereviseerd, verrijkt, verwerkt en gepubliceerd.

Wat is substitutie precies? Om antwoord te geven op die vraag gaan we even op de formele toer: substitutie is het vervangen van archiefbescheiden door reproducties. De originele bescheiden worden vervolgens vernietigd. De reproducties nemen dus volledig de plaats in van de oorspronkelijke bescheiden en vallen vervolgens onder de archiefwet. Kortom: de meters dossiers zijn verdwenen. En dat schept, ruimte voor nieuwe mogelijkheden. De regels omtrent substitutie zijn beschreven in de archiefwet van 1995.  

Records Management Applicatie

Records Management Applicatie is software om name digitale archiefbescheiden in op te slaan en in te beheren. Met behulp van een RMA kunnen alle archiefbescheiden eenduidig geordend en beheerd worden en kunnen de digitale archiefstukken in een niet muteerbare vorm worden opgeslagen en ter beschikking worden gesteld. De records die in een RMA worden opgeslagen, worden direct aan de metagegevens gekoppeld.

Alle functies van een RMA, raadplegen, toevoegen en verwijderen van records, kunnen door autorisaties worden gereguleerd. Pas na een autorisatie kan een gebruiker een handeling uitvoeren. De controle over het elektronische document en het beheer daarvan gaat volledig over van de omgeving van de gebruiker naar een RMA, zodra het archiefstuk is geÔdentificeerd en in het RMA is opgenomen.

Daarnaast wordt de archiefordening en de verwijdering van stukken geregeld en de leesbaarheid van de bescheiden onderhouden.  

Metadata

Metadata zijn gegevens die de karakteristieken van bepaalde gegevens beschrijven. Het zijn dus eigenlijk data over data. De metadata bij een bepaald document (de gegevens) kunnen bijvoorbeeld zijn: de auteur, de datum van schrijven, het aantal pagina's en de taal waarin de gegevens zijn opgesteld. Het expliciet opslaan van metadata bij de data waar het betrekking op heeft, heeft als voordeel dat de data makkelijker gevonden kan worden. Zo kan men in een zoekmachine die gebruik maakt van metadata bijvoorbeeld direct zoeken naar documenten geschreven door een bepaalde auteur. Met full text-zoeken, dus zonder gebruik te maken van metadata, is dit moeilijker doordat ieder document waarin de naam van de auteur voorkomt gevonden wordt. Dit kunnen er veel meer zijn dan de documenten die daadwerkelijk door de persoon geschreven zijn.

Meta-informatie
Wanneer de relatie tussen de metadata en de onderliggende gegevens bekend is, mag eigenlijk niet meer van metagegevens worden gesproken; er is dan sprake van meta-informatie. Meta-informatie bevat alle informatie die er toe bijdraagt gegevens tot informatie te verheffen. Anders gezegd: omdat meta-informatie gegevens in een bepaalde context zet, is meta-informatie de factor die gegevens tot informatie verheft.

Onder meta-informatie kan zowel de expliciet beschrijvende als de impliciet aanwezige informatie over de structuur, betekenis, onderlinge relaties, locatie, status, eigenaarschap, enz. van gegevens worden verstaan. Ook alle informatie over de applicaties en processen die de gegevens manipuleren, valt onder de noemer meta-informatie.

Metadata in de praktijk
Een van de taken van hedendaagse bibliothecarissen en archivarissen is het toevoegen van metadata aan documenten. Daarbij wordt gebruikgemaakt van bestaande schema's, waarbij de Dublin Core een bekende standaard is, andere standaarden zijn onder andere MARC-varianten en Encoded Archival Description (EAD).

Scannen

Als documenten worden gescand, wordt er van een fysiek document (tekening, boek etc.) een afbeelding gemaakt. In de praktijk zijn er twee soorten afbeeldingen namelijk rasterafbeeldingen en vectorafbeeldingen. Vectorafbeeldingen zijn opgebouwd uit lijnen en curven, terwijl rasterafbeeldingen zijn opgebouwd uit pixels. Scanners scannen altijd in rasterformaat. De reden om een rasterafbeelding om te zetten in een vectorafbeeldingen, is omdat deze afbeelding vrijelijk verplaatst of gewijzigd kan worden, zonder dat er details verloren gaan. Ze behouden hun scherpe randen wanneer de grootte van de afbeeldingen wordt gewijzigd. Een reden om te kiezen voor vector is dat dit gebruikt kan worden in AutoCAD, bijvoorbeeld oude tekening te vergelijken met moderne bouwtekeningen die tegenwoordig altijd in CAD-programma's worden gemaakt. 

 

            

 

Scanbestandsformaten


Bij de meeste scanners wordt er met name in TIFF-formaat (ook wel TIF) en JEPG-formaat (ook wel JPG) gecand. Zowel TIFF als JPEG kunnen compressie toepassen, maar daar zitten wel verschillen tussen. TIFF en JPEG worden op de meeste Operating Systemen (inclusief Linux en Mac) ondersteund. JPEG omdat het een zeer belangrijke standaard is voor foto's en internet. TIFF omdat het de standaard is voor scannen.

Kwaliteitverlies


Een belangrijk onderscheid is het kwaliteitsverlies. Dit verlies valt minder op bij bijvoorbeeld foto's en tekeningen met veel kleuren, maar valt meer op bij egale vlakken (zoals brieven of bouwtekeningen). Scannen met kwaliteitsverlies houdt in dat je dat stukje kwaliteit voorgoed kwijt bent.

Samengevat zijn de formaten geschikt voor de scandoeleinden Voor zwart/wit: TIFF, Group 4 compressie Voor kleur (vooral met egale vlakken) TIFF, Packbits compressie (indien geen kwaliteitsverlies gewenst is) Voor kleur (vooral foto's en afbeelding met veel kleuren) JPEG.

Overige rasterformaten
Er zijn meer dan honderd bestandsformaten. Er zijn vele gespecialiseerde programma's die dit efficiŽnt kunnen omzetten. Door middel van aantallen controles, verwerkingsverslagen en steekproeven is vast te stellen of dit naar wens verloopt.

Ook hier geldt weer dat er formaten zijn met en zonder kwaliteitsverlies. Een voorbeeld van een bestandsformaat dat ook op vele platformen gebruikt wordt en dat een goede compressie biedt zonder kwaliteitsverlies is PNG. Bovendien kan PNG ook zwart/wit en grijstinten aan.

De reden dat er zoveel formaten zijn, is dat ze voor specifieke doeleinden ontworpen zijn, met specifieke eigenschappen of extra's. De vraag is of die extra's te gebruiken zijn, omdat je voor een deel beperkt wordt door de mogelijkheden van de scanner. Dit zou per situatie uitgezocht moeten worden.

Scanresolutie

Scanners werken met een scanresolutie: het aantal pixels dat per inch wordt gescand. Gangbare resoluties zijn 200 , 300 , 400 en 600 Dots Per Inch (DPI) .

Hoe hoger het aantal  hoe nauwkeuriger de scan. Echter hoe meer DPI, hoe groter de gescande afbeelding. Overigens wordt niet alleen de afbeeldingen groter bij een hogere scanresolutie, maar wordt ook de scan tijd en de OCR-tijd langer ,beiden nemen ook met 400 procent of meer toe. Om te OCR'en geldt eigenlijk dat 300 dpi optimaal is. 200 dpi is te beperkt. Een resolutie van 200 dpi is overigens een grens die we als mens kunnen onderscheiden in een kleurenafbeelding. 200 dpi heeft dan wel als nadeel dat het niet echt te vergroten valt.

Bij het scannen in zwart-wit is het belangrijk om in de goede resolutie in te scannen. Het is mogelijk om in een later stadium met behulp van software de afbeelding te vergroten of verkleinen.

Dia- en microfichescanner en resolutie
Bij een diascanner en microfichescanner speelt er nog een extra uitdaging. Hierbij moet het origineel eerst nog vergroot worden. Het gaat erom dat het uiteindelijke resultaat een bepaalde kwaliteit heeft. Het originele document van de microfichescanner moet dan een resultaat hebben van 300 dpi op het formaat van een A4.

Diascanner en scancycli
Een diascanner heeft een leuke mogelijkheid om de scan 2  of 4 maal uit te voeren. Dit verhoogt de nauwkeurigheid van de scan (dus niet de resolutie, maar vooral de kleurweergave) maar neemt ook twee keer zoveel tijd in beslag.

Optical Character Recognition

OCR betekent Optical character recognition en wordt gebruikt om documenten mee te identificeren. OCR is gericht op tekst zoekmogelijkheden. Dit is vooral nuttig bij willekeurige teksten. Het heeft minder nut als de gedigitaliseerde brieven allemaal standaard zijn.

Om nuttig te zijn, moet ge-OCR'de tekst op een of andere manier aan de locatie in de afbeelding gekoppeld kunnen worden. Als een PDF ge-OCR'd is, dan kan er keurig gezocht worden op woorden en zie je waar ze staan.. Als er voor een oplevering wordt gekozen waarbij de OCR-tekst los van de afbeelding wordt aangeleverd, dan kan er een bestand met OCR-tekst aangeleverd worden waarin tekst en locatie in de image zijn opgenomen. De eindgebruiker zal zelf een mogelijkheid moeten hebben om iets met deze OCR tekst te kunnen doen.

 

 

    

06 - 55 68 0888

e-Mail

0578 - 57 32 26

0578 - 61 79 04

Route & Openingstijden

Linked In

Blogger

YouTube

Twitter

Bibliotheek

 

Copyright © 2008 - 2015