Tag: regex

Finde Regex zum Löschen von Duplikaten

Ich möchte die Regex finden, die folgendes Matching macht (Beachten Sie, dass es einen linebreakt gibt!) InputString: "a0Ew0" "a0Ew0" "a0Ew0s" "a0Ew0s" Ausgabe: "a0Ew0" "a0Ew0s"

Python re.split und Anhängen zusammenpassende Gruppe auf rechts oder links des Splits

Aus diesem Beispiel: >>> re.split('(\W)', 'foo/bar spam\neggs') ['foo', '/', 'bar', ' ', 'spam', '\n', 'eggs'] Gibt es einen direkten Weg, um die Capture-Gruppe mit dem rechten oder linken Teil der Split zu assoziieren? ZB mit der gleichen Regex / Capture-Gruppe, aber nachgeben: ['foo', '/bar', ' spam', '\neggs'] Oder wahlweise ['foo/', 'bar ', 'spam\n', 'eggs'] Ich […]

Python Regex Interpunktion Erkennung

Ich bin von diesem stumped. Ich lerne gerade reguläre Ausdrücke und kann nicht herausfinden, warum dies keine Satzzeichen zurückstellt. Hier ist ein Stück der Textdatei, das die Regex analysiert: APRIL / NNP ist / VBZ der / DT grausamste / JJ Monat / NN, /, Zucht / VBG Flieder / NNP aus / RB von […]

Regulärer Ausdruck, der mit flüssigem Code übereinstimmt

Ich baue eine Website mit Jekyll Ich möchte automatisch entfernen Flüssigkeit Code (und nur Flüssigkeitscode) aus einer bestimmten HTML-Datei. Ich mache es in Python mit regulären Ausdrücken, und so weit habe ich diese: \{.*?\}|\{\{.*?\}\} Da bin ich nicht zu vertraut mit Flüssigkeit (und .html), könnte jemand bestätigen, dass dies für mein Ziel genügen wird? Hier […]

Regex, um spezielle Listeneinträge anzupassen

Ich habe seltsame Liste von Artikeln und Listen wie diese mit | Als Trennzeichen und [[ ]] als Klammer. Es sieht aus wie das: | item1 | item2 | item3 | Ulist1[[ | item4 | item5 | Ulist2[[ | item6 | item7 ]] | item8 ]] | item9 | list3[[ | item10 | item11 | […]

Python Regex: Finde Worte und Emoticons

Ich möchte Spiele zwischen einem Tweet und einer Liste von Streichern mit Wörtern, Phrasen und Emoticons finden. Hier ist mein Code: words = [':)','and i','sleeping','… :)','! <3','facebook'] regex = re.compile(r'\b%s\b|(:\(|:\))+' % '\\b|\\b'.join(words), flags=re.IGNORECASE) Ich bekomme diesen Fehler: error: unbalanced parenthesis Anscheinend ist etwas falsch mit dem Code und es kann nicht mit Emoticons übereinstimmen. Irgendeine […]

Regex Stemmer Code Erklärung

Kann jemand bitte erklären, was macht dieser Code? def stemmer(word): [(stem,end)] = re.findall('^(.*ss|.*?)(s)?$',word) return stem

Python: Verwenden Sie den regulären Ausdruck, um etwas zu entfernen

Ich habe eine String, die so aussieht ABC(a =2,b=3,c=5,d=5,e=Something) Ich möchte das Ergebnis sein ABC(a =2,b=3,c=5) Was ist der beste Weg, dies zu tun? Ich ziehe es vor, regelmäßigen Ausdruck in Python zu verwenden. Tut mir leid, etwas geändert, der Rohstring wurde geändert ABC(a =2,b=3,c=5,dddd=5,eeee=Something)

Python regex – Ersetzen Sie einfache Anführungszeichen und Klammern

Ich würde gerne Mengen mit Namen dann eine eckige Klammer und ein einziges Zitat mit dem Inhalt im Inneren ersetzen. Also, von diesem: RSQ(name['BAKD DK'], name['A DKJ']) Dazu: RSQ(BAKD DK, A DKJ)

Passende Nummer String Paare

Ich habe folgende Sample-String: R10666: 273141 C1 + 273141 C2 + 273141 C3 + 273141 C4 + 273141 C5 – 273141 C6 Ich möchte: [('273141','C1'), …, ('- 273141', 'C6')] Die Zahlen können Gleitkommazahlen mit exponentieller Notation sein, dh – 2.5e-7 . Mein aktueller Regex sieht so aus: re.findall(r'([+-]? \d+(\.\d*)?|\.\d+([eE][+-]?\d+)?)( [a-zA-Z0-9_]+)', split) Aber es macht nicht […]

Python ist die beste Programmiersprache der Welt.