Xerox ontwikkelt slim zoeksysteem
Het kan ook gebeuren dat een belangrijk document is beschadigd of deels verloren is gegaan. Xerox heeft voor deze situaties een zoeksysteem ontwikkeld dat aan een deel van een pagina genoeg heeft om het bijbehorende document op te zoeken en desgewenst meteen af te drukken. In het geval van de omgewaaide papierstapel lijkt het misschien wat overdreven om alles opnieuw uit de printer te laten rollen, maar financieel gezien is dat wel het goedkoopst. Wanneer een medewerker de vellen op de juiste volgorde moet leggen kost dat veel tijd, moeite en vooral geld. Het afdrukken van een pagina A4 kost gemiddeld circa 1 eurocent (afhankelijk van het type printer en het contract dat voor het apparaat is afgesloten) dus vaak is het opnieuw maken van een afdruk goedkoper en sneller. Multifunctioneel Het retrievalsysteem dat Xerox heeft ontwikkeld heeft de naam Copy Finder gekregen. De software die achter het systeem verborgen zit, is afgestemd op de multifunctionele kantoorapparatuur van Xerox. Daarbij gaat het om systemen die zowel kunnen scannen als printen en die zijn aangesloten op een netwerk. Wanneer een document moet worden opgezocht, wordt een enkele pagina of een deel daarvan door de scanner gevoerd. Als extra wordt een optisch leesbaar zoekformulier meegescand. Op dat formulier kan de gebruiker door het zwart maken van hokjes aangeven wat de bedoeling is. Degene die de opdracht geeft kan de zoekactie beperken tot een enkel document, maar dit aantal kan ook worden vergroot. Tevens kan exact worden gezocht of meer ‘fuzzy’. In het laatste geval wordt ook gekeken naar documenten die sterk lijken op het gezochte document. Bij het invoeren van het fragment van het gezochte document wordt een scan gemaakt. Deze dient voor twee zaken, namelijk de vorm en de inhoud van het document. De inhoud wordt verkregen door de scan te onderwerpen aan een OCR-procédé. Is het document eenmaal gevonden, hetzij in eenvoud hetzij als reeks gelijksoortige documenten, dan begint de volgende fase: de opvrager kan een notificatie krijgen van het zoekproces, of de gevonden documenten worden ter plekke afgedrukt op het multifunctionele systeem dat ook de scan heeft gemaakt. Baanbrekend Bij de oprichting van het Xerox Research Center Europe, nu tien jaar geleden, werd aangekondigd dat de wetenschappers aldaar baanbrekend werk zouden doen op het terrein van documentbeheersing. CopyFinder is een resultaat van die inspanningen, evenals de PDC ofwel de Portable Document Camera. Dit is software die een gebruiker de mogelijkheid geeft om met een simpele digitale camera allerhande teksten op te nemen en te gebruiken in documenten. Een digitale camera met een resolutie van 2 megapixels is al voldoende om een tekst op een A4’tje op te nemen. De tekst wordt via OCR uit de foto gehaald, waarna deze verder verwerkt kan worden. Voor deze manier van werken is een speciale OCR-routine ontwikkeld, die ook overweg kan met beelden van lage resolutie. Ter vergelijking: een normale scan van een A4-tje heeft een oplossend vermogen van 9 megapixels of meer. Ook houdt de leessoftware rekening met wisselende helderheid in delen van de opname. Een vouw in de opgenomen tekst zal daarom meestal geen invloed hebben op de tekstherkenning. Een speciale routine dient voor aanpassing van het perspectief van de opname. Als bijvoorbeeld een aan de muur hangend bulletin wordt gefotografeerd zal de camera vrijwel nooit exact parallel aan het prikbord worden gehouden. De opname raakt zo enigszins vertekend, wat door de software kan worden gecorrigeerd. Xerox heeft inmiddels patent gekregen op de techniek die wordt gebruikt voor het opschonen van de opgenomen documenten. De techniek wordt aangeprezen voor mensen die veel onderweg zijn en wel een digitale camera met zich mee sjouwen, maar geen scanner.