PDF/A-Export
FineReader Engine 8.1 erlaubt den Export von Dokumenten in das neue PDF/A-Format zur Langzeitarchivierung elektronischer Dokumente. Das Format soll zuverlässigen Datenaustausch in Unternehmen und Behörden sicher stellen und verspricht, der wichtigste Standard für die langfristige Dokumentarchivierung zu werden. Es wird bereits weitgehend von nationalen Archiven, Abteilungen und Agenturen zur Akten- und Vorgangsverwaltung, Archiven von Staatsministerien und anderen einflussreichen Organisationen anerkannt.
„ABBYY fühlt sich verpflichtet, seine Technologien kontinuierlich weiterzuentwickeln und neueste Standards zu unterstützen“, konstatiert Alexander Rylov, Chief Product Manager von ABBYY. „Mit ABBYYs exzellenter Expertise in Linguistik und künstlicher Intelligenz und der Ergänzung der FineReader Engine um das PDF/A-Format unterstreicht ABBYY erneut seine führende Stellung. ABBYY verfügt nun über das leistungsstärkste und umfangreichste SDK zur Dokumentumwandlung und Data Capture auf dem Markt.“
OCR in den Sprachen Thai und Hebräisch
Dank neu integrierter Linguistik- und OCR-Technologien verarbeitet die Version 8.1der ABBYY FineReader Engine auch Dokumente in den Sprachen Thai und Hebräisch. Die thailändische Sprache (Thai) wird von über 70 Millionen Menschen weltweit gesprochen und ist eine der schwierigsten für OCR. Sie verfügt über 80 Schriftzeichen, darunter Konsonanten, Vokale, diakritische Zeichen sowie Ziffern. Thailändische Wörter können auf bis zu vier Ebenen geschrieben werden, wobei Vokale hinter, über, unter und um Konsonanten herum angeordnet sein können, während diakritische Zeichen über und unter den Hauptschriftzeichen stehen können. Zudem sind einzelne Wörter nicht durch Leerzeichen voneinander getrennt. ABBYYs Technologie erkennt einzelne Buchstaben, trennt zusammenhängende Textpassagen voneinander. Die Software bietet so zuverlässige Texterkennung mit bis zu 50 Prozent genaueren Erkennungsergebnissen als Thai-OCR anderer Anbieter.
Hebräisch wird weltweit von neun Millionen Menschen gesprochen und stellt besondere Anforderungen an OCR, weil hebräische Schriftzeichen von rechts nach links, Zahlen hingegen in der umgekehrten Reihenfolge geschrieben werden (heutzutage werden meistens die in Europa üblichen arabischen Ziffern benutzt). Darüber hinaus werden in hebräischen Texten oft englische Wörter gebraucht, oder auch Wörter anderer Sprachen, die von links nach rechts geschrieben werden. Die in ABBYY FineReader Engine integrierte bidirektionale Erkennung wendet zur Verarbeitung hebräischer Texte simultane OCR in beide Richtungen innerhalb eines einzelnen Dokuments an.
„Hierbei geht es um mehr, als nur zwei neue OCR-Sprachen“, bemerkt Alexander Rylov. „ABBYY ist stolz, eine höhere Ebene in der Entwicklung von Texterkennungstechnologien erreicht zu haben und kann nun die größten Hürden bei der Texterkennung überwinden, so wie beispielsweise die Verarbeitung der Sprachen Thai und Hebräisch.“
Weitere Neuerungen
ABBYY FineReader Engine verfügt zudem über folgende neue Funktionen:
- Erweiterter CJK-Export zu PDF und RTF: Erweiterte Exportmöglichkeiten für Dokumente in den Sprachen Chinesisch, Japanisch, Koreanisch (CJK) zu PDF und RTF mit Beibehaltung vertikalen Textes und komplexer Layouts.
- Feinabstimmung des Verhältnisses zwischen Umwandlungsgenauigkeit und
-geschwindigkeit: Entwickler können aus unterschiedlichen Modi zur Einstellung des für ihre Bedürfnisse optimalen Verhältnisses zwischen Umwandlungsgenauigkeit und -geschwindigkeit wählen.
- Balanced Mode bei der Texterkennung: Neben dem Thorough Mode und dem Fast Mode bietet der neue Balanced Mode eine ideale Balance zwischen Erkennungsgeschwindigkeit und -genauigkeit. Diese vordefinierten Verarbeitungsmodi erlauben Entwicklern eine schnelle Auswahl des optimalen Verhältnisses zwischen Qualität und Geschwindigkeit, passend zu den Anforderungen ihres jeweiligen Projektes.
- Erkennung von EAN-13 Barcodes sowie der Schrift MICR CMC-7: Der EAN-13 Barcode ist der Standard-Barcode im Verlagswesen zur Kodierung von ISBN-Nummern auf Büchern. CMC-7 wird im Bankwesen verwendet und bietet höchste Genauigkeit bei der Erkennung von Bankschecks und Überweisungsscheinen.
Verfügbarkeit und Preisgestaltung
ABBYY FineReader Engine kann über ABBYYs weltweites Netz an Reseller-Partnern bezogen werden. Die Engine wird über eine flexible, modulare Lizenzpolitik vertrieben. Entwickler können die für ihr Projekt beste Kombination aus Funktionalitäten und Preisoptionen auswählen. Der Preis variiert je nach Anzahl der zu verarbeitenden Seiten.
Für Testzwecke steht eine spezielle, zeitlimitierte Testversion zur Verfügung. Informationen über Lizenzmodelle, Preise sowie weitere technische Informationen sind bei den regionalen ABBYY-Niederlassungen erhältlich.