Einzelnen Beitrag anzeigen
Alt 27.08.2011, 01:14   #10
Lord Skarak
Gast
 
Beiträge: n/a
Standard

So, ich hab das Dingelchen jetzt eingehend untersucht. Als ich nämlich einige meiner Texte da eingab, bekam ich in über 50 Prozent der Fälle das Ergebnis "Heinrich Heine" (Ja, ich habe gezählt). Sowas kann irgendwie zumindest nicht völlig "random" sein dacht ich mir, also hab ich das Teil einem Härtetest unterzogen. Ich gab insgesamt 53 Gedichte von Schiller ein. Die Zuordnungen seitens des Programmes liste ich hier auf:

Zitat:
Zitat von meiner kleinen "Studie"

Alle Texte von Schiller, die Zuordnungen wie folgt:

19x Schiller (könnte man als "Treffer" werten): Amalia, An die Freude, An die FreuNNNNNde, Der Handschuh, Graf Eberhard der Greiner, Einer jungen Freundin ins Stammbuch, Deutsche Treue, Pompeji und Herculanum, Die Schlacht, Pegasus im Joche, Der Ring des Polykrates, Die Kraniche des Ibykus, Der Jüngling am Bache, die Bürgschaft, Shakespeares Schatten, Dem Erbprinzen von Weimar, Der Antritt des Neuen Jahrhunderts, Das Siegesfest, Der Alpenjäger,

14x Goethe: An Demoiselle Slevoigt, An den Frühling, An Emma, Das Glück der Weisheit, Die deutsche Muse, Die Sänger der Vorwelt, Der spielende Knabe, Macht des Weibes, An Goethe, Sängers Abschied, Die Weltweisen, die Antiken zu Paris, Das Spiel des Lebens, Dithyrambe,

12x Heine: Der Abend, Das Glück, Triumph der Liebe, Thekla, Nenie, die Geschlechter, der Taucher, Hero und Leander, Kassandra, Das Eleusische Fest, Klage der Ceres, DAS LIED VON DER GLOCKE,

4x Nietzsche: An einen Moralisten, Poesie des Lebens, Die Gunst des
Augenblicks, Wilhelm Tell,

3x Hölderlin: Der Genius, die Götter Griechenlands, die Künstler,

1x Lessing: Die berühmte Frau,

Alle Texte hier zu finden: http://www.wissen-im-netz.info/liter...chte/index.htm
Auf den ersten Blick mag's ja gar nicht so übel aussehen, dass der Text die meisten Zuordnungen tatsächlich an Schiller vornimmt. Das Programm hat aber entsprechend seinen Datenbanken möglicherweise eine Art "Heimvorteil" wenn es um Schiller selbst geht. Die Datenbank könnte mit vielen Texten die tatsächlich von Schiller stammen gefüttert sein. Falls dies der Fall sein sollte wäre es gar nicht verwunderlich wenn insbesondere bei allbekannten Klassikern wie "Ring des Polykrates", "Der Handschuh", "Ode an die Freude" und "die Bürgschaft" ein Treffer in Richtung Schiller erfolgt. Und tatsächlich scheint es so, als würde das Programm vor allem die Bekannten Texte richtig zuordnen (Bis auf's Lied von der Glocke zu meinem Erstaunen). So gesehen wäre das Ergebnis doch eine ziemliche Niete, weil wir von 53 Texten Schillers dann 34 hätten, die das Programm offensichtlich nicht in seinen Datenbanken hat und infolgedessen auch anders zuordnet. Angenommen also, der Algorithmus checkt zuerst ab, ob der Text 1:1 in seiner Datenbank ist und versucht dann - falls dies nicht der Fall sein sollte - eine Zuordnung über allgemeinere Daten: dann hätte der Algorithmus in unserem Fall 34 mal versagt, was ich keine allzu tolle Leistung fände (mal gesetzt den Fall, dass die meisten der 19 Treffer über besagten direkten Datenabgleich zustande gekommen wären, was nicht allzu unwahrscheinlich wäre, denn es sollte auch nicht weiter schwer sein eine Datenbank mit annähernd ALLEM aufzutreiben was Schiller jemals geschrieben hat).
Sollten sich in der Datenbank allerdings NICHT Texte der berühmten Autoren im Ganzen befinden, so halte ich die 19-fache Zuordnung dagegen für eine sehr gute Leistung. In diesem Falle wäre dann eigentlich angedeutet oder nahegelegt, dass Autoren wie Schiller tatsächlich über messbare oder zumindest statistisch relevante stilistische Eigenheiten verfügen. Nun gibt es diese Vergleichsbox aber ja nun nicht, um zu ermitteln welcher Text von welchem Autoren stammt, sondern um einen Vergleich X-beliebiger Schreiber anzustellen. Es wäre also eine direkte Prüfung auf 1:1-Überschneidungen überhaupt nicht sinnvoll und dass jemand direkt einen Text Schillers eingibt ist im Sinne des Zwecks den das Programm ausführen solle eher eine "exception". So würde ich also zunächst annehmen, der 1:1-Vergleich findet überhaupt nicht statt (es sei denn der Autor des Programmes hat ihn eingebaut, damit das Programm in bestimmten Situationen etwas besser dasteht als es sollte).
Das Nächste ist, dass das Teil dazu neigt, Schiller sehr häufig Goethe oder Heine zuzuordnen. Wie jeder weiß, klingen die auch teilweise ziemlich "verwechselbar". Goethe, Hölderlin, Heine (und Nietzsche grad noch so am Rande) sind zeitlich ziemlich genau dort angesiedelt wo auch Schiller herkommt. Jetzt muss man sagen, dass es für ein Programm doch schon eine gewisse Leistung ist, wenn es einen beliebigen Text in einen zeitlichen Zusammenhang der Literaturgeschichte einordnen kann. Angenommen man stattet das Programm mit irgendeinem Algorithmus aus, der den Durchschnitt der jeweils kleinsten und größten Geburts- und Sterbedaten aller infrage kommender Autoren errechnet (in unserem Falle wären das Goethe und Nietzsche für die früheste und späteste Geburt und Schiller und Nietzsche für das früheste und späteste Sterben (Ergebnisse: 1796,5 und 1852,5 )), so würde das Programm auf Basis dieser Daten schon jetzt eine Einschätzung mit einer Abweichung von nur 50 Jahren geben, wenn man es fragte, welcher Zeitepoche der "Stil" des Textes in etwa zuzuordnen wäre. Das zumindest ist besser als mancher Mensch es wahrscheinlich könnte. Also ich kann nicht umhin schon eine gewisse Leistung in dem Teil zu erkennen. Wenn man diese Präzision etwas verbessern würde und die Datenbank gleichzeitig mit Autoren aus breiteren Zeitbereichen füttern könnte, dann würde schon was gehen... Die Leistung die das Programm erbringt finde ich trotz allem beachtlich - insbesondere wenn bedacht wird, dass es sich ja nur um eine Maschine handelt die Informationen nur logisch ordnen kann (nicht nach Gefühl wie der Mensch (auch wenn ich sowieso der Meinung bin, dass Intuitionen und Gefühle häufig sehr logische Gründe haben)).

Was aber einfach pure Göttlichkeit ist: Lasst mal Folgendes von dem Teil analysieren:

Zitat:
Infantilismus Infantilismus Infantilismus Infantilismus Infantilismus Infantilismus Infantilismus Infantilismus Infantilismus Infantilismus Infantilismus Infantilismus Infantilismus Infantilismus Infantilismus Infantilismus Infantilismus Infantilismus Infantilismus Infantilismus Infantilismus Infantilismus Infantilismus
Es ist unfassbar, das Teil gibt dann ungelogen als Ergebnis SIGMUND FREUD aus... xDxDxD
(Die Datenbank enthält also auch solche Leute, einmal stieß ich auf Karl Marx. Das heißt, auch eine Zuordnung der Literaturgattung wäre unter Umständen schon im Ansatz möglich mit dem dort ausgearbeiteten Algorithmus. Auch gab es bei den Schillertexten nur die Namen von "Lyrikern" aus. Das ist ein weiterer Grund für mich zu sagen: so schlecht ist es auch wieder nicht (Auch wenn der Autorenpool wahrscheinlich doch ziemlich begrenzt ist bisher)).

Ich frage mich gerade nur eins: WIESO ZUM TEUFEL MACH ICH SOWAS EIGENTLICH????? Wahrscheinlich weil es ermüdend ist, und genau das Richtige gegen gewisse Einschlafprobleme. In diesem Sinne wünsche ich allen Beteiligten eine gute Nacht (und würde mich indessen schon sehr wundern, wenn das hier tatsächlich noch einer lesen sollte innerhalb der kommenden sechs bis acht Stunden wo der Wunsch einer guten Nacht noch Sinn machen würde. So muss ich mich also auch zum Gutenachtwunsch fragen: WIESO MACH ICH SOWAS EIGENTLICH???? Bevor die Sache jetzt aber völlig rekursiv wird und ich mich frage wieso ich DAS HIER eigentlich mache usw. breche ich ab. Hier. Und kein Wort später. Genau HIER. AB DA. JETZT. SOFORT. NOCH IN DIESER SILBE, VERSTEHT IHR MICH????). Bis demnächst!

Liebe Grüße,
Skarak

Geändert von Lord Skarak (27.08.2011 um 01:28 Uhr)
  Mit Zitat antworten