Forum bei Thomas Mann
Autor
Thema: Die Volltextsuche CORPUS
 
Wulf Rehder
Such-Hilfen
Erstellt am 24.04.2009 01:58
Das auf dieser Seite thomasmann.de unter ‚Volltextsuche der gesammelten Werke’ zur Verfuegung gestellte Hilfsmittel ist sehr nuetzlich. Allerdings hat die Suche einige Macken, die sich vielleicht im Laufe der Zeit hineingeschlichen haben. Hier sind einige Hinweise zur Beachtung:

1. Auf der HELP Seite wird angezeigt, dass ein deutsches es-zet (rundes s) durch sz transkribiert wird. Das stimmt nicht; die Transkription geschieht, wie man es gewohnt ist, durch ss. Zum Beispiel findet man Spass, aber nicht Spasz.

2. Auf der HELP Seite wird gesagt, dass Umlaute wie ö in Töchter mit oe umgeschrieben werden. Das ist richtig; nur ist das „daughters“, nicht „daughter“, fuer Toechter.

3. Der gespeicherte Text verschiebt Satzzeichen um eine Stelle nach rechts, so dass eine Eingabe wie „strengste, heiterste und froemmste“ nicht gefunden wird, waehrend „strengste , heiterste und frömmste“ unter ‚Reden und Aufsaetze (1)’ auftaucht, wie’s auch sein sollte. Was sich hier beim Komma zeigt, passiert auch beim Punkt (.) und Semikolon (;), Ausrufezeichen (!), Fragezeichen (?), ebenso wie bei Anfuehrungszeichen. So findet die Suchmaschine nicht die Ausrufe der Maria Kuckuck aus ‚Felix Krull’:

"Hole! Heho! Ahe!" rief sie mit maechtigem Jubel.

Gefunden wir hingegen dieser Eintrag:

" Hole ! Heho ! Ahe ! " rief sie mit maechtigem Jubel .

4. Die eMail Adresse „corpus@corpus.en.kyushu-u.ac.jp“ fuer CORPUS funktioniert nicht. Feedback ist also nicht moeglich.
 
Conny Langton
Fehler bei CORPUS
Erstellt am 15.05.2009 10:24
Das sind sehr nuetzliche Hinweise. Hier ist ein weiteres Problem: Einige der Namen und Substantive beginnen mit Kleinbuchstaben, z.B. findet man bei den Buddenbrooks tony, thomas, buddenbrooks, fraeulein, hanno. Deshalb ist es besser, unter "Letter case" den Knopf "Ignored" zu waehlen.

Es gibt noch weitere Kleinigkeiten, so z.B. "kaineswegs" fuer "keineswegs".

Es waere prima, wenn irgendwann der Volltext der GKFA zur Verfuegung staende.