Mobieltje wordt documentscanner
Normaliter worden documenten gedigitaliseerd met behulp van een scanner. In zo’n apparaat wordt een vel papier onder gecontroleerde omstandigheden afgetast en omgezet in een bitpatroon. Met behulp van optical character recognition (OCR) kan die bitmap vervolgens worden vertaald naar teksten die door de computer kunnen worden verwerkt. Hier geldt, dat hoe beter de scan is, des te nauwkeuriger ook de omzetting naar machineleesbare tekst is. Professionele scan- en OCR-systemen hebben - mede door toepassing van technieken uit de kunstmatige intelligentie - een zeer hoge kwaliteitsfactor. Foutcorrectie Bij gebruik van een gewone digitale camera als invoerinstrument moeten bijzondere maatregelen worden genomen om de kwaliteit van het opgenomen document te verbeteren. De gebruiker houdt zijn camera vrijwel nooit exact parallel aan het document, zodat vertekeningen optreden, en ook is de belichting meestal niet over het hele vel hetzelfde. Beeldbewerkingssoftware zorgt ervoor dat deze opnamefouten worden gecorrigeerd. Wanneer de resolutie van de opname geringer is, zoals bij een cameratelefoon, is het verbeteren van de opname nog belangrijker. Hiervoor is software geschreven die de opname in een aantal stappen verbetert. Ten eerste wordt mogelijke onscherpte weggewerkt door het beeld te filteren. Daarna wordt alle kleurinformatie uit het beeld verwijderd en worden contrast en helderheid aangepast. De laatste stap behelst een zeer sterke compressie. Het algoritme hiervoor is in eigen huis ontwikkeld en zorgt voor een verliesvrije compressie die tienmaal zo hoog is als bij JPG. Verliesvrij wil zeggen dat het ‘uitgepakte’ beeldbestand er precies eender uitziet als de foto voordat compressie werd toegepast. Bij gewone JPG-compressie treden altijd verliezen op in de details. De sterke compressie is nodig om het document via de telefoon te kunnen verzenden zonder al te veel tijd kwijt te zijn. Nu in de praktijk is bewezen dat deze vorm van scannen mogelijk is, gaan de wetenschappers van Xerox verder werken aan de server-kant van dit soort applicaties. Dat worden systemen die de documenten van gebruikers onderweg kunnen ontvangen en ze verder verwerken. Eventueel kan zo’n systeem ook reageren op commando’s die de gebruiker heeft meegefotografeerd. "We voeren gesprekken met mogelijke partners, maar die verkeren nog in een pril stadium", zegt Mathieu Chuat, die voor Xerox de licenties verkoopt.