Regex passt einfach nicht

R

Reimer

Aktives Mitglied
Thread Starter
Dabei seit
01.06.2007
Beiträge
327
Reaktionspunkte
3
Hallo, ich habe Probleme mit den Zeilenumbrüchen in meinem Regex.
Ich will sämtlichen Inhalt von 'Sample text' bis zum '</p>' filtern.

Der reguläre Ausdruck ist nach Überlegungen ziemlich einfach, trotzdem hänge ich da fest.

Code:
... Irgendein Text ... Sample text:</strong>            <p>John J. Murphy doesn't talk much about World War II, but when he does, the POIGNANT MEMORIES of his service come rushing back.<br />
<br />
(The New Haven Register)<br />
<br />
---<br />
The perfume from the great clusters of yellow daffodils and violets floated up from the flower sellers' baskets below; the fresh, warm air seemed to bring him POIGNANT MEMORIES of crocus-starred lawns, of trim beds of hyacinths, of the song of birds, of the perfume of drooping lilac.<br />
<br />
- The Malefactor, by British novelist E. Phillips Oppenheim</p> ... Hier kommt noch mehr Inhalt ...

Kann ich sowas angeben wie "alle Symbole bis auf die Zeichenkette </p>", als Regex ausgedrückt: [^(<\/p>)]* ?
 
Zuletzt bearbeitet:
Ich weiß nicht recht, aber solange du deinen Ansatz nicht postest, bin ich nicht gewillt dir zu helfen
 
Hab ich doch nachträglich (und sogar vor deinem Beitrag) gemacht ;)
 
Kann ich sowas angeben wie "alle Symbole bis auf die Zeichenkette </p>", als Regex ausgedrückt: [^(<\/p>)]* ?
Ich habe schon lange kein Regex mehr gemacht, doch das da ist quatscht :)
^ : Anfang der Zeile
[] : zB: [abc] -> Regex findet a,b,c ...
* : Dieser Quantifier ist das gleiche wie {0,}, also "keinmal oder mehr"

Also in klaren Worten ist [^(<\/p>)]* nonsens soweit ich das sehe. Ich hab dein text mal kopiert in TextMate... mein Problem sind die linebreaks, ich habe kein plan mehr wie man die gescheit mit einbaut, da sie nicht zu . gehören. :( Müsste ich als suchen, da ich persönlich einfach immer in Perl alle linebreaks entferne und somit alles in einer Zeile steht. dann ist es nämlich relativ einfach und sowas würde reichen:
Code:
<p>(.*)<\/p>
und den inhalt findest du ja dann in einer Variable.
 
^hat mehrere Bedeutungen. In einer "Klasse" stellt dieses Symbol der Ausschluss der in der Klasse festgelegten Zeichen dar.
Code:
Muff[^abc]
Das bedeutet zum Beispiel "Muff gefolgt von einem Zeichen, welches nicht a, b oder c ist.".

Nun, ich arbeite grad dieses Tutorial komplett durch. Danach bin ich um einiges gescheiter zumal ich versuchte eine Gruppe in einer Klasse zu verwenden, was so nicht funktioniert.
 
Zurück
Oben Unten