Kontakt
QR-Code für die aktuelle URL

Story Box-ID: 91498

ABBYY Europe GmbH Friedenstr. 22b 81671 München, Deutschland http://www.abbyy.de
Ansprechpartner:in Marcus Birke 089/800908-26
Logo der Firma ABBYY Europe GmbH
ABBYY Europe GmbH

ABBYY FineReader Engine 8.1 umfassendstes OCR Software Development Kit auf dem Markt

SDK unterstützt mehr Sprachen als jede andere Lösung, darunter Thai und Hebräisch

(PresseBox) (München, )
ABBYY, weltweit führender Hersteller von Technologien für Dokumenterkennung, Data Capture und angewandte Linguistik, präsentiert die neueste Version seines ABBYY FineReader Engine Software Development Kits (SDK). Die Version 8.1 ist die erste Software auf dem Markt, die optische Zeichenerkennung (Optical Character Recognition: OCR) von Dokumenten aus dem thailändischen, europäischen, hebräischen, chinesischen/japanischen/koreanischen, kyrillischen, griechischen und armenischen Sprachraum in einem einzigen SDK vereint. Die neue Version bietet darüber hinaus neue Funktionen wie den Export zu PDF/A, das Archivierungsformat der Zukunft. Das SDK bietet unterschiedliche Modi für die - je nach Einsatz - beste Balance zwischen Geschwindigkeit und Genauigkeit bei OCR und PDF-Umwandlung. Es bietet Entwicklern eine größere Auswahl an Optionen und höhere Flexibilität als jedes andere SDK.

PDF/A-Export

FineReader Engine 8.1 erlaubt den Export von Dokumenten in das neue PDF/A-Format zur Langzeitarchivierung elektronischer Dokumente. Das Format soll zuverlässigen Datenaustausch in Unternehmen und Behörden sicher stellen und verspricht, der wichtigste Standard für die langfristige Dokumentarchivierung zu werden. Es wird bereits weitgehend von nationalen Archiven, Abteilungen und Agenturen zur Akten- und Vorgangsverwaltung, Archiven von Staatsministerien und anderen einflussreichen Organisationen anerkannt.

„ABBYY fühlt sich verpflichtet, seine Technologien kontinuierlich weiterzuentwickeln und neueste Standards zu unterstützen“, konstatiert Alexander Rylov, Chief Product Manager von ABBYY. „Mit ABBYYs exzellenter Expertise in Linguistik und künstlicher Intelligenz und der Ergänzung der FineReader Engine um das PDF/A-Format unterstreicht ABBYY erneut seine führende Stellung. ABBYY verfügt nun über das leistungsstärkste und umfangreichste SDK zur Dokumentumwandlung und Data Capture auf dem Markt.“

OCR in den Sprachen Thai und Hebräisch

Dank neu integrierter Linguistik- und OCR-Technologien verarbeitet die Version 8.1der ABBYY FineReader Engine auch Dokumente in den Sprachen Thai und Hebräisch. Die thailändische Sprache (Thai) wird von über 70 Millionen Menschen weltweit gesprochen und ist eine der schwierigsten für OCR. Sie verfügt über 80 Schriftzeichen, darunter Konsonanten, Vokale, diakritische Zeichen sowie Ziffern. Thailändische Wörter können auf bis zu vier Ebenen geschrieben werden, wobei Vokale hinter, über, unter und um Konsonanten herum angeordnet sein können, während diakritische Zeichen über und unter den Hauptschriftzeichen stehen können. Zudem sind einzelne Wörter nicht durch Leerzeichen voneinander getrennt. ABBYYs Technologie erkennt einzelne Buchstaben, trennt zusammenhängende Textpassagen voneinander. Die Software bietet so zuverlässige Texterkennung mit bis zu 50 Prozent genaueren Erkennungsergebnissen als Thai-OCR anderer Anbieter.

Hebräisch wird weltweit von neun Millionen Menschen gesprochen und stellt besondere Anforderungen an OCR, weil hebräische Schriftzeichen von rechts nach links, Zahlen hingegen in der umgekehrten Reihenfolge geschrieben werden (heutzutage werden meistens die in Europa üblichen arabischen Ziffern benutzt). Darüber hinaus werden in hebräischen Texten oft englische Wörter gebraucht, oder auch Wörter anderer Sprachen, die von links nach rechts geschrieben werden. Die in ABBYY FineReader Engine integrierte bidirektionale Erkennung wendet zur Verarbeitung hebräischer Texte simultane OCR in beide Richtungen innerhalb eines einzelnen Dokuments an.

„Hierbei geht es um mehr, als nur zwei neue OCR-Sprachen“, bemerkt Alexander Rylov. „ABBYY ist stolz, eine höhere Ebene in der Entwicklung von Texterkennungstechnologien erreicht zu haben und kann nun die größten Hürden bei der Texterkennung überwinden, so wie beispielsweise die Verarbeitung der Sprachen Thai und Hebräisch.“

Weitere Neuerungen

ABBYY FineReader Engine verfügt zudem über folgende neue Funktionen:

- Erweiterter CJK-Export zu PDF und RTF: Erweiterte Exportmöglichkeiten für Dokumente in den Sprachen Chinesisch, Japanisch, Koreanisch (CJK) zu PDF und RTF mit Beibehaltung vertikalen Textes und komplexer Layouts.

- Feinabstimmung des Verhältnisses zwischen Umwandlungsgenauigkeit und
-geschwindigkeit: Entwickler können aus unterschiedlichen Modi zur Einstellung des für ihre Bedürfnisse optimalen Verhältnisses zwischen Umwandlungsgenauigkeit und -geschwindigkeit wählen.

- Balanced Mode bei der Texterkennung: Neben dem Thorough Mode und dem Fast Mode bietet der neue Balanced Mode eine ideale Balance zwischen Erkennungsgeschwindigkeit und -genauigkeit. Diese vordefinierten Verarbeitungsmodi erlauben Entwicklern eine schnelle Auswahl des optimalen Verhältnisses zwischen Qualität und Geschwindigkeit, passend zu den Anforderungen ihres jeweiligen Projektes.

- Erkennung von EAN-13 Barcodes sowie der Schrift MICR CMC-7: Der EAN-13 Barcode ist der Standard-Barcode im Verlagswesen zur Kodierung von ISBN-Nummern auf Büchern. CMC-7 wird im Bankwesen verwendet und bietet höchste Genauigkeit bei der Erkennung von Bankschecks und Überweisungsscheinen.

Verfügbarkeit und Preisgestaltung

ABBYY FineReader Engine kann über ABBYYs weltweites Netz an Reseller-Partnern bezogen werden. Die Engine wird über eine flexible, modulare Lizenzpolitik vertrieben. Entwickler können die für ihr Projekt beste Kombination aus Funktionalitäten und Preisoptionen auswählen. Der Preis variiert je nach Anzahl der zu verarbeitenden Seiten.

Für Testzwecke steht eine spezielle, zeitlimitierte Testversion zur Verfügung. Informationen über Lizenzmodelle, Preise sowie weitere technische Informationen sind bei den regionalen ABBYY-Niederlassungen erhältlich.

ABBYY Europe GmbH

ABBYY Europe ist ein Mitglied der ABBYY Gruppe und veröffentlicht und vertreibt ABBYY-Produkte in Westeuropa. ABBYY (ABBYY Software House) entwickelt linguistische Software und Software für Künstliche Intelligenz, darunter eine komplette Produktlinie für OCR und Texterkennungsprogramme und Lösungen. Das Produkt-Portfolio von ABBYY bietet: FineReader OCR Systeme - eine Produktfamilie für Endkunden und SDKs zur Erkennung von gedruckten Texten, Tabellen und Formularen; FormReader - ein ICR Programm zur Erkennung und Verarbeitung von Formularen, die per Hand ausgefüllt wurden; ABBYY Retrieval & Morphology Engine - Tools für Entwickler zur Integration von Volltextsuche und linguistischen Funktionen in externe Applikationen. Zu den Lizenznehmern der Erkennungs-Technologien von ABBYY zählen Siemens Nixdorf, Samsung Electronics, C-Technologies, Sumitomo Electric Systems, Banctec, BenQ, Documentum, EPSON, Freedom Scientific, Hewlett-Packard, Kurzweil, Kofax, Microtek, NewSoft, Notable Solutions, Panasonic, Stellent, Toshiba, Verity, Neurascript, Saperion und SWT. Die Zentrale der ABBYY Gruppe befindet sich in Moskau, Niederlassungen gibt es in der Ukraine (ABBYY Ukraine), den USA (ABBYY USA, Fremont, CA), Großbritannien (ABBYY UK, Bishops Stortford, England) und Deutschland (ABBYY Europe, München). Weitere Informationen über ABBYY finden sich im Web unter www.abbyy.com oder direkt bei ABBYY Europe GmbH, Anglerstraße 6, 80339 München, E-Mail: sales_eu@abbyy.com.

ABBYY, das ABBYY Logo, FineReader, FormReader und FlexiCapture sind entweder registrierte Warenzeichen oder Warenzeichen von ABBYY Software Ltd. Andere hier erwähnte Produktnamen sind Warenzeichen und/oder registrierte Warenzeichen der entsprechenden Inhaber. Adobe und Adobe PDF Library sind entweder registrierte Warenzeichen oder Warenzeichen von Adobe Systems Incorporated in den Vereinigten Staaten und/oder anderen Ländern. Die Marke FreeBSD ist ein registriertes Warenzeichen von The FreeBSD Foundation und wird von ABBYY mit Erlaubnis von The FreeBSD Foundation verwendet. Intel ist ein registriertes Warenzeichen von Intel Corporation oder seinen Tochterfirmen in den Vereinigten Staaten und anderen Ländern. Linux ist ein registriertes Warenzeichen von Linus Torvalds in den Vereinigten Staaten und anderen Ländern. Mac OS und das Mac Logo sind Warenzeichen von Apple Computer Incorporated in den Vereinigten Staaten und anderen Ländern. Bei der hier vorliegenden Pressemitteilung handelt es sich um eine unabhängige Publikation, die von Apple Computer Incorporated weder autorisiert, gesponsert oder in irgendeiner anderen Weise genehmigt wurde. Fedora ist ein Warenzeichen von Red Hat Incorporated. RED HAT ist ein registriertes Warenzeichen von Red Hat Incorporated und seinen Tochterfirmen in den Vereinigten Staaten und anderen Ländern. Captiva und Documentum sind registrierte Warenzeichen von EMC Corporation in den Vereinigten Staaten. SUSE ist ein registriertes Warenzeichen von Novell Incorporated in den Vereinigten Staaten und anderen Ländern.

Für die oben stehenden Stories, das angezeigte Event bzw. das Stellenangebot sowie für das angezeigte Bild- und Tonmaterial ist allein der jeweils angegebene Herausgeber (siehe Firmeninfo bei Klick auf Bild/Titel oder Firmeninfo rechte Spalte) verantwortlich. Dieser ist in der Regel auch Urheber der Texte sowie der angehängten Bild-, Ton- und Informationsmaterialien. Die Nutzung von hier veröffentlichten Informationen zur Eigeninformation und redaktionellen Weiterverarbeitung ist in der Regel kostenfrei. Bitte klären Sie vor einer Weiterverwendung urheberrechtliche Fragen mit dem angegebenen Herausgeber. Bei Veröffentlichung senden Sie bitte ein Belegexemplar an service@pressebox.de.
Wichtiger Hinweis:

Eine systematische Speicherung dieser Daten sowie die Verwendung auch von Teilen dieses Datenbankwerks sind nur mit schriftlicher Genehmigung durch die unn | UNITED NEWS NETWORK GmbH gestattet.

unn | UNITED NEWS NETWORK GmbH 2002–2024, Alle Rechte vorbehalten

Für die oben stehenden Stories, das angezeigte Event bzw. das Stellenangebot sowie für das angezeigte Bild- und Tonmaterial ist allein der jeweils angegebene Herausgeber (siehe Firmeninfo bei Klick auf Bild/Titel oder Firmeninfo rechte Spalte) verantwortlich. Dieser ist in der Regel auch Urheber der Texte sowie der angehängten Bild-, Ton- und Informationsmaterialien. Die Nutzung von hier veröffentlichten Informationen zur Eigeninformation und redaktionellen Weiterverarbeitung ist in der Regel kostenfrei. Bitte klären Sie vor einer Weiterverwendung urheberrechtliche Fragen mit dem angegebenen Herausgeber. Bei Veröffentlichung senden Sie bitte ein Belegexemplar an service@pressebox.de.