RecoStar Full Page Reader wurde entwickelt, um Scan- und digitale Faxdokumente inhaltlich zu erschließen und ihre Informationen für anschließende Suche, Klassifikation und Analyse und Recherche bereitzustellen. Dabei überzeugt RecoStar Full Page Reader durch die schnelle und effiziente Umwandlung der gescannten Dokumente in durchsuchbare PDF (Searchable PDF) oder reinen Text (XML-Format, ASCII-Text). Alle wichtigen Bitmap-Formate werden verarbeitet: FAX, TIFF, JPG, BMP, GIF und PDF. Für die fast fehlerfreien Erkennungsergebnisse bei einer extremen Erfassungsschnelligkeit von bis zu 6.000 Zeichen pro Sekunde sorgt die Zeichenerkennung, die auch im RecoStar Professional integriert ist. So arbeiten im bewährten Multi-Expert-Voting mehrere Erkennungs-Engines parallel, deren Ergebnisse miteinander abgeglichen und mit dem im System vorhandenen Kontextwissen kombiniert werden. Unterstützt wird die Erkennung durch umfangreiche Bildbearbeitungsfunktionen. Sie entfernen z. B. Verschmutzungen, Rauschen, Boxen und Lochungen, wandeln Farbbilder in Grau- oder Binärbilder und rotieren bei Bedarf die Bilder automatisch. Damit gelingt es, auch auf sehr problematischem Beleggut, beispielsweise Durchschlägen oder verschmutzten Dokumenten, eine insgesamt hohe Erkennungsleistung zu erzielen.
RecoStar Full Page Reader kann überall dort eingesetzt werden, wo große oder kleine Dokumentmengen per Scanning produziert und verteilt werden. Eine ideale Zielplattform, mit beträchtlichem Potenzial sowohl bei kleinen und mittelständischen Firmen als auch bei großen Anwenderunternehmen, ist MOSS (Microsoft Office Sharepoint Server). Hier gilt es, die große Zahl an papiergebundenen Geschäftsdokumenten für die Funktionen "Collaboration", "Suche", "Enterprise Content Management", "Business Process Management" und "Business Intelligence" zugänglich zu machen.
Bei der inhaltlichen Bearbeitung wird jede Seite eines Dokuments zunächst auf Textbereiche und Bilder oder Grafiken untersucht. Anschließend werden die Textpassagen in Paragrafen, Zeilen, Worte und Zeichen zerlegt, mit der integrierten optischen Zeichenerkennung gewandelt und mit verschiedenen semantischen Techniken geprüft und verbessert. Als Ergebnis steht der textuelle Inhalt des Dokuments zur weiteren Verarbeitung zur Verfügung.
Die wichtigsten Eigenschaften:
Exzellente Leserate und extrem schnell für Maschinenschriften
Extrahiert den kompletten Dokumententext
Skalierbares Volumen
Erfasst alle Businessdokumente
Offen für alle Zielanwendungen
Optimales Preis-Leistungs-Verhältnis