Stopwörter aus Text entfernen

Startseite Foren Deutsches LiveCode-Forum Stopwörter aus Text entfernen

Schlagwörter: 

Dieses Thema enthält 3 Antworten und 2 Teilnehmer. Es wurde zuletzt aktualisiert von  Herby vor 1 Woche, 1 Tag.

  • Autor
    Beiträge
  • #14822

    Torsten
    Teilnehmer

    Hi,
    ich habe eine Liste von Stopwörtern, die ich aus einem Text entfernen möchte. Bisher gehe ich klassisch vor:

    repeat for each word i in tStopwortliste
        replace i with empty in tText 
    end repeat

    Frage: geht es auch schneller? Ich habe sehr gute Erfahrungen mit Arrays gemacht, weil die extrem schnell sind, z.B. beim Erstellen vor Wortlisten/Statistiken und auch dem Filtern von Stopwörtern aus der Wortliste per "difference".
    Aber bei den Array-Keys ist ja die Reihenfolge nicht vorherbestimmbar und es kann keine doppeklten Keys geben.

    Hat jemand eine andere Idee, das Abarbeiten wie oben ist relativ langsam.

    Beste Grüße
    Torsten

  • #14834

    Herby
    Teilnehmer

    Hallo Torsten,

    ich muss gleich einmal fragen was Stopwörter sind und für was du sie verwendest ?

    Danke Herby

  • #14871

    Torsten
    Teilnehmer

    Hi Herby,

    wenn man Texte analysieren will, z.B. um herauszufinden, welche Themen angesprochen werden, dann sind bestimmte Worte überflüssig, weil sie keine inhaltliche Bedeutung haben, wie z.B. der, die, das etc. Google indiziert auch nicht alle Wörter als Suchwörter, sondern schliesst die sogenannten Stopwörter aus der Suche aus.

    Will man also einen Text auf die wesentlichen Wörter reduzieren, muss man zunächst die Stopwörter entfernen.

    BG
    Torsten

  • #14887

    Herby
    Teilnehmer

    Nett, aber dafür bin ich noch zu klein.
    Danke für die Info.
    Herby

Du musst angemeldet sein, um auf dieses Thema antworten zu können.