Antwort auf: MatchText, RegEx und HTML

Startseite Foren Deutsches LiveCode-Forum MatchText, RegEx und HTML Antwort auf: MatchText, RegEx und HTML

#1527
Torsten
Teilnehmer

    Hallo Klaus,

    ich habe mich missverständlich ausgedrückt: ich habe eine HTML-Seite auf der der ganze Code steht, wie z.B. http://www.zeit.de/politik/ausland/2017-08/syrien-un-sicherheitsrat-carla-del-ponte-ruecktritt-baschar-al-assad

    In diesem Text steht auch der Link zur Homepage der Autorin in Zeile 174:
    <meta property=“article:author“ content=“http://xml.zeit.de/autoren/B/Andrea_Backhaus/index“&gt;

    Jetzt suche ich einen eleganten Weg aus dem kompletten HTML-Text das Muster: <meta property=“article:author“ content=“LINK“> so zu extrahieren, das ich nur den LINK bekomme.

    Ein Weg ist:

    
    put field "htmlData" into tHtml
    set the itemdelimiter to ("<meta property=" & quote & "article:author" & quote & " content=" & quote)
    put item 2 of tHtml into tExtraction
    set the itemdelimiter to (quote & ">")
    put item 1 of tExtraction into field "Extraction"
    

    Das Ganze werde ich dann wohl einfach als Stack-Handler machen, bei dem die Parameter der HTML-Text, der Tag-Start und das Tag-Ende sind. Ist vielleich auch schneller als eine komplexe RegEx?