Startseite › Foren › Deutsches LiveCode-Forum › Anzeige von "purem" Text von Webseiten › Antwort auf: Anzeige von "purem" Text von Webseiten
Mai 25, 2018 um 17:28 Uhr
#5684
Hier ein kleines Puzzleteil, das ich mal verwendet habe, um den eigentlichen Text aus HTML-Dateien rauszukriegen. Allerdings werden hier keine scripts und styles entfernt, sondern nur alle HTML-Tags und Formatierungsangaben:
function replacetags tx
return replaceText(tx,"<[^<]+>",empty)
end replacetags
Sehr simpel, aber macht den Basisjob. Du müsstest aber noch “manuell” parsen, um den Hauptteil der Seite zu separieren.
Grüße
Hauke