Navigation

HINWEIS: Sie betrachten einen archivierten Inhalt. Bitte besuchen Sie auch unseren aktuellen Auftritt unter www.incobs.de

Bereichsmenü: Produkt-Infos


Test: Texterkennung für Handys 2009
TextScout

1. Das Wichtigste auf einen Blick

Nokia Mobiltelefon mit dem Elumo-Logo auf dem Display

TextScout

  • Erhebungsdatum: 10/2009
  • Produktversion: 1.10
  • Anbieter: elumo GmbH
  • Das Produkt: Für verschiedene Handys mit Symbian- Betriebssystem nutzbar. Die fotografierten Texte werden über Internet in einem zentralen Server verarbeitet. Notwendig ist also ein Internetvertrag für das Handy.
  • Bedienung: Korrektes Fotografieren der Vorlage wird durch Richttöne gut unterstützt.
  • Texterkennung: DIN A 4 nur schwer mit einem Foto erfassbar. Auch einfache Vorlagen (12-Punkt Arialschrift) werden nicht immer fehlerfrei wiedergegeben, bei verschiedenen Aufnahmen wurde unterschiedliche Genauigkeit erzielt.

2. Ergebnisse im Detail

Produktbeschreibung und Anschlussmöglichkeiten

Beim TextScout handelt es sich um eine Software, die auf verschiedenen Nokia Handys - im Test auf dem Nokia N82 - mit integrierter 5-Megapixel-Digitalkamera, installiert werden kann. Dies wird in der Regel vom Nutzer mit Hilfe einer Anleitung selbst durchgeführt. Gegen Gebühr installiert der Anbieter die Software. Die Textverarbeitung erfolgt nicht auf dem Telefon, sondern die Daten werden über eine Internetverbindung zu einem zentralen Server geschickt und dort verarbeitet. Das bedeutet, der Nutzer sollte über einen günstigen Internettarif für sein Mobiltelefon verfügen.

Das Telefon wird über das Anbringen eines sogenannten Polarisator-Filters vor der Kameralinse für den Einsatz mit dem TextScout vorbereitet. Das Telefon bietet die Möglichkeit, einen Kopfhörer für das Abhören von Dokumenten anzuschließen. Zudem verfügt es über eine Mini-USB-Schnittstelle zur Datenübertragung auf einen Computer und ist Bluetooth-fähig. Der TextScout ist kompatibel mit den bekannten Handy-Screenreadern Talks und Mobile Speak, die die Bedienung der Geräte sprachlich unterstützen.

Bedienung

Der TextScout wird mit der Handy-Tastatur bedient, also mit entsprechend kleinen und gleich geformten Tasten. Davon abgesehen ist die Bedienung recht eingängig. Es gibt eine Taste für eine direkte Hilfe, und alle wichtigen Grundfunktionen sind mit nur einer Taste auszulösen. Sowohl während der Bildaufnahme als auch während der Textverarbeitung gibt es für die Nutzer Rückmeldungen über den Erfolg der Fotoaufnahme und den Status der Verarbeitung.

Die Ausrichtung der Kamera über der Textvorlage erfolgt freihändig mit einer Ausrichthilfe, die durch höher werdende Töne anzeigt, wann die Position gut ist und dann das Foto automatisch auslöst. Diese Funktion hat im Test einwandfrei funktioniert und erleichtert die Bedienung. Es erfolgt nach der Aufnahme eine Rückmeldung, ob Text oben oder unten abgeschnitten wurde. Dies funktioniert allerdings nur, wenn die Absätze nur zum Teil aufgenommen werden. Text, der sauber abgeschnitten ist, kann nicht registriert werden.

Sprache

Mit „Klaus“ und „Sarah“ stehen standardmäßig zwei natürlich klingende Sprachausgaben zur Verfügung. Getestet wurde mit Sara, die teilweise leicht undeutlich klingt (verschluckt Silben). Die Tonhöhe kann nicht eingestellt werden, aber die Sprechgeschwindigkeit. Die Software erlaubt standardmäßig keinen Sprachwechsel auf die englische Sprache, dieser ist aber möglich, wenn die Nutzer sich gegen Gebühr eine andere Sprache installieren lassen.

Navigation

Der TextScout bietet die Navigationsmodi zeichenweise, wortweise, satzweise, absatzweise. Es wird aber weder die letzte Textstelle gespeichert noch sind elektronische Lesezeichen zu setzen.

Lesen

Die Normalvorlage mit 12-Punkt-Arialschrift wird nicht immer fehlerfrei wiedergegeben. In unserem Test kam es vor, dass mehrere Aufnahmen notwendig waren, bis ein relativ fehlerfreies Ergebnis erzielt wurde – auch bei Absätzen, die bereits bei den ersten Versuchen fotografisch erfasst worden waren. Englische Lehnwörter werden in etwa korrekt ausgesprochen, Abkürzungen werden aber oft ganz weggelassen, die Datumsansage erfolgt nicht immer sinnvoll. Die Software bietet nicht die Möglichkeit, die Aussprache einzelner Wörter über ein individuelles Benutzerhandbuch festzulegen. Das Vorlesen von E-Mail- und Internetadressen klappte, ebenso die Wiedergabe willkürlicher Zahlen- und Buchstabenkombinationen. Längere Zahlenangaben werden sinnvoll vorgelesen, allerdings kam es bei der Wiedergabe von Preisen zu einer unkorrekten Verlängerung der Zahlenangaben, weil das Euro-Zeichen als „6“ interpretiert und angehängt wurde.

Im Vergleich zur Normalvorlage traten bei schwächerem Kontrast (Tageszeitung) nicht mehr Fehler auf. Während die mehrspaltige Anordnung einer Tageszeitung erkannt wird, sorgt die nicht abschaltbare Spaltenerkennung bei der Wiedergabe von Tabellen für Probleme bei der Informationsdarstellung. Hier ist es schwierig, die Information zu interpretieren, wenn die Spalten von oben nach unten heruntergelesen werden. Helle Schrift auf dunklem Grund wurde korrekt wiedergegeben, bei farbiger Darstellung kommt es bei roter Schrift zu mehr Fehlern im Vortrag. Ein etwa 7 Punkt großer Text in einer Infobox wurde nur mit vielen Fehlern wiedergegeben, ebenso Text in der Mitte eines Buches, im sogenannten Buchfalz. Auch Unterstreichungen sorgen für ein häufigeres Auftreten von Fehlern.

Für Sehbehinderte wird der aufgenommene Text in neun verschiedenen Stufen vergrößert auf dem Telefondisplay wiedergegeben. Dabei ist sowohl Hoch- als auch Querformat nutzbar sowie verschiedene Farbkontraste: neben schwarz/weiß auch rot/gelb, gelb/blau, lila/grün, grün/weiß und alle Kombinationen auch invers.

OCR-Software

Der TextScout ist eine eigene Entwicklung der Firma elumo. Die Textverarbeitung kann nur erfolgen, wenn für das Telefon eine Internetverbindung besteht, da die Daten auf einem zentralen Server verarbeitet werden. Es kann zwischen den Erkennungsmodi Automatik/schneller Modus/kleine Schrift/Produktverpackungen gewechselt werden. Das Anlegen verschiedener Benutzerprofile ist nicht möglich. Die Blattlage wird automatisch erkannt, aber nicht angesagt.

Der TextScout bietet eine sprachgestützte Dateiverwaltung. Mehrere Seiten können nicht zu einem Dokument zusammengefasst werden. Texte werden automatisch im TXT- oder RTF-Format abgespeichert. Diese Funktion kann aber auch abgeschaltet werden. Die Dateien können über das Internet auf einen Computer exportiert werden.

Fazit

Der TextScout liest Standardfließtext in 12-Punkt-Arialschrift nicht immer zuverlässig vor, sondern erzielt bei verschiedenen Aufnahmen unterschiedliche Genauigkeit. Datum und Abkürzungen werden teilweise nicht korrekt wiedergegeben, ebenso wie unterstrichene Textzeilen. Problematisch erscheint auch kleiner gedruckter Text, trotz eines entsprechenden Modus. Weiße Schrift auf dunklem Grund wird erkannt, farbiger Text weitgehend. Bei schwachen Kontrasten von Zeitungsartikeln treten nicht mehr Fehler als in der Normalvorlage auf. Die Darstellung längerer Zahlen erfolgt grundsätzlich sinnvoll, allerdings werden Preisangaben aufgrund einer Fehlinterpretation des Euro-Zeichens verfälscht. Die Bedienung per Handy-Tastatur könnte für Anfänger möglicherweise schwierig sein. Das freihändige Ausrichten der Kamera wird durch die Ausrichthilfe jedoch entscheidend erleichtert. Alle Grundfunktionen werden mit nur einer Taste ausgelöst.

Wer mit der Nutzung von Mobiltelefonen keine Probleme hat, für den kann der TextScout als mobile Ergänzung zu einem Vorlesesystem mit Scanner sinnvoll sein.


3. Die Ergebnistabelle

Sie können folgende Testabschnitte anspringen:

elumo Textscout 1.10 (kombiniert mit Nokia N 82)

(Dieses Produkt mit anderen vergleichen)

Produktangaben

Anbieterelumo GmbH
Kameraauflösung 5 Megapixel
Datenverarbeitung Datenverarbeitung erfolgt auf externem Internetserver
Mögliche Mobiltelefone Nokia 6220 Classic, Nokia 6700 Slide, Nokia 6720 Classic, Nokia N 79, Nokia N 82, Nokia N 85, Nokia N 86 8MP, Nokia N 95, Nokia N 95 8GB, Nokia N 96. Nokia N 97
Screenreadern kobinierbar Talks, MobileSpeak
Besondere Stärken gute Ausrichtungshilfe

Bedienung

sprachgestützte Benutzeroberfläche ja
direkte Hilfe ohne Menü ja
Hilfstexte abschaltbar ja
Orientierungstöne während der Textvearbeitung ja, es erfolgen verschiedene Ansagen zur erfolgreichen Aufnahme des Fotos, zum Sendestatus
Grundfunktionen über einmalige Tastenbetätigung ja
Doppelbelegung von Tasten nein
Unterstützung bei der Ausrichtung akustische Ausrichtungshilfe in Form von Signaltönen
Anleitung Online-Hilfe und elektronische Fassung
Einweisung gehört zum Lieferumfang nein, nur Installation

Sprachausgabe

Verfügbare Sprachausgaben Klaus und Sara
Stimmenauswahl - Vorlesen ja
Stimmenauswahl - Menü Klaus und Sara
Konkatenative Stimme (natürlich klingend) ja
Synthetische Stimme nein, nur über Screenreader
männlich / weiblich ja
Vorlesegeschwindigkeit einstellbar ja
Tonhöhe einstellbar ja
Höhen und Tiefen getrennt regelbar nein
Sprachwechsel nein, optional möglich
Besonderheiten Sara spricht eher undeutlich, verschluckt Silben

Navigation

Seitenweise nein
Blockweise ja
Satzweise ja
Zeilenweise nein
Wortweise ja
Zeichenweise ja
Lesezeichen für letzte Textstelle nein
beliebig setzbare Lesezeichen nein
Besonderheiten

OCR-Software

Produktbezeichnung eigene Entwicklung, Version 1.10
automatische Lageerkennung ja
Blattlage wird angesagt nein
Spaltenerkennung ja
Spaltenerkennung beim Vorlesen an- / ausschaltbar nein
beim Vorlesen neue Seiten fotografieren nein
sprachgesteuerte Dokumentenverwaltung ja, gespeicherte Ergebnisse werden automatisch mit Nummer und Datum versehen
Zusammenfügen mehrerer Seiten nein
ganze Seiten nachträglich löschbar ja
Im- / Export von Texten ja, über das Internet
Formate für Im- und Export von Texten txt- und rtf-Format
Satzzeichen werden mitgelesen nein
Sonderzeichenschatz modifizierbar nein
Aussprache für eigenen Wortschatz modifizierbar nein
Speichern von Benutzerprofilen nein
Anmerkungen über das Mobiltelefon können die Daten auf einen PC übertragen werden

Praktische Erprobung

schwierige Daten
Datum teilweise
Abkürzungen nein
englische Lehnwörter ja
Euro-Zeichen nein, wird als 6 interpretiert
e-mail Adresse nein
lange Zahlen ja
Zeile mit Unterstrich erkannt teilweise, oft fehlerhaft
Diskrete Daten (z.B. Bezeichnungen für Geräte) ja
Anmerkungen 12-Punkt bedrucktes A4-Format ist nur schwer mit einem Bild zu erfassen, immer wieder waren Zeilen abgeschnitten. Problematisch ist die Wiedergabe längerer Zahlen dann, wenn es sich um Euro-Beträge handelt, da das Zeichen oft als 6 die Zahl verlängert. Häufiger werden Textbestandteile, vor allem Abkürzungen, in der Wiedergabe ganz weggelassen.
schwierige Vorlagen
schwacher Kontrast ja
dickes Buch (Buchfalz) ja
Dokument mit Tabelle nein, Spalten werden strikt von oben nach unten vorgelesen
mehrspaltige Darstellung - Text ja
Infobox teilweise, viele Fehler
Hinweis auf Bild im Text nein
mehrfarbige Vorlage ja, roter Text fehlerhafter als schwarzer
weiße Schrift auf dunklem Grund ja
Handschrift nein
praktische Handhabung
Vorlage schräg aufgelegt nein, ab ca. 8 Grad Schieflage viele Fehler in der Wiedergabe
A4 quer aufgelegt nein
Dauer: Textseite scannen bis Vorlesen (Sek.) schneller Modus: ca. 32 Sekunden, Automatik: ca. 45 Sekunden, Modus für kleine Schrft: 40 Sekunden, Modus für Produktverpackungen: ca. 105 Sekunden
Dauer: Bereitschaft des Gerätes nach Anschalten (Sek.) abhängig von der verfügbaren Internetverbindung
Anmerkungen Die Aufnahmen werden mit der Kamera des eingesetzten Mobiltelefons gemacht. Es erfordert dabei einige Übung, die Kamera korrekt über der Vorlage auszurichten. Als Hilfe gibt es eine Ausrichthilfe.

Installation und Inbetriebnahme

Installationsanleitung vorhanden ja
Anschlüsse unterscheidbar ja

Auf dieser Seite kommen 8 Begriffe vor, die in unserem Wörterbuch erläutert werden: Installation, konkatenativ, OCR Software, Scanner, Screenreader, Sprachausgabe, TXT und Vorlesesysteme.


nach oben

Letzte Änderung: 01.09.2010 | © 2006 - 2013 DIAS GmbH | Impressum | Barrierefrei?