Startseite › Foren › Deutsches LiveCode-Forum › MatchText, RegEx und HTML › Antwort auf: MatchText, RegEx und HTML
Hallo Klaus,
ich habe mich missverständlich ausgedrückt: ich habe eine HTML-Seite auf der der ganze Code steht, wie z.B. http://www.zeit.de/politik/ausland/2017-08/syrien-un-sicherheitsrat-carla-del-ponte-ruecktritt-baschar-al-assad
In diesem Text steht auch der Link zur Homepage der Autorin in Zeile 174:
<meta property=“article:author“ content=“http://xml.zeit.de/autoren/B/Andrea_Backhaus/index“>
Jetzt suche ich einen eleganten Weg aus dem kompletten HTML-Text das Muster: <meta property=“article:author“ content=“LINK“> so zu extrahieren, das ich nur den LINK bekomme.
Ein Weg ist:
put field "htmlData" into tHtml
set the itemdelimiter to ("<meta property=" & quote & "article:author" & quote & " content=" & quote)
put item 2 of tHtml into tExtraction
set the itemdelimiter to (quote & ">")
put item 1 of tExtraction into field "Extraction"
Das Ganze werde ich dann wohl einfach als Stack-Handler machen, bei dem die Parameter der HTML-Text, der Tag-Start und das Tag-Ende sind. Ist vielleich auch schneller als eine komplexe RegEx?