Antwort auf: Anzeige von "purem" Text von Webseiten

Startseite Foren Deutsches LiveCode-Forum Anzeige von "purem" Text von Webseiten Antwort auf: Anzeige von "purem" Text von Webseiten

#5684
hauke
Administrator

    Hier ein kleines Puzzleteil, das ich mal verwendet habe, um den eigentlichen Text aus HTML-Dateien rauszukriegen. Allerdings werden hier keine scripts und styles entfernt, sondern nur alle HTML-Tags und Formatierungsangaben:

    
    function replacetags tx
       return replaceText(tx,"<[^<]+>",empty)
    end replacetags		

    Sehr simpel, aber macht den Basisjob. Du müsstest aber noch “manuell” parsen, um den Hauptteil der Seite zu separieren.

    Grüße

    Hauke