Tag: regex

Extrahieren von Temperaturgraden (Celsius oder Fahrenheit) aus String

Ich benutze (char.*?char2) , um Unterabschnitte zu extrahieren, die mit char1 und die mit char2 aus einer Zeichenfolge endet. Jetzt möchte ich Temperaturinformationen zB (40 ° C, -30 ° C, 80 ° F) aus einer Saite extrahieren. In diesem Fall sollte mein Regex-Ausdruck den Anfangszeichen mit beliebigen Ziffernzeichen definieren, indem er die Wahrscheinlichkeit von + […]

Regex-Erfassungsgruppe innerhalb der Nicht-Capture-Gruppe

In Python, wie erfassen Sie eine Gruppe innerhalb einer Nicht-Capture-Gruppe? Setzen Sie in eine andere Art und Weise, wie wiederholen Sie ein Nicht-Capture-Sub-Muster, das eine Capturing-Gruppe enthält? Ein Beispiel hierfür wäre, alle Paketnamen auf einem Importstring zu erfassen. ZB die Saite: Importiere pandas, os, sys Würde 'Pandas', 'os' und 'sys' zurückgeben. Das folgende Muster erfasst […]

Entfernen Sie alle Repliken einer Zeichenfolge mehr als x Zeichen lang (regex?)

Ich bin mir nicht sicher, dass Regex der beste Ansatz dafür ist, aber es scheint ziemlich gut geeignet zu sein. Im Wesentlichen bin ich derzeit analysieren einige pdfs mit pdfminer, und der Nachteil ist, dass diese pdf's sind exportiert Powerpoint Folien, was bedeutet, dass alle Animationen zeigen sich als ziemlich lange Kopien von Strings. Im […]

Wollen Sie String mit Regex extrahieren

Ich habe String wie folgt [[English language|English]] . Ich habe versucht, Text aus String zu extrahieren. Aber kein Glück Ich möchte nur den Text ignorieren [[English language| .Output sollte English . Ein anderes Beispiel: [[Stack Exchange|Question]] Ausgabe sollte nur Question Wenn es keine | [[Stack Exchange]] Dann sollte Ausgang nur Stack Exchange . Ich bin […]

Wie erstelle ich neue Spalten, um die Daten der Duplicate ID Spalte zu speichern?

Ich habe diese dataframe: ID key 0 1 A 1 1 B 2 2 C 3 3 D 4 3 E 5 3 E Ich möchte zusätzliche key erstellen – wie nötig – um die Daten in der key zu speichern, wenn es doppelte IDs Dies ist ein Ausschnitt der Ausgabe: ID key key2 0 […]

Python-String-Split mit Regex

Ich muss eine Zeile wie diese analysieren: foo, bar > 1.0, baz = 2.0 foo bar > 1.0 baz = 2.0 foo, bar, baz foo bar baz Für jedes Element kann es $ string (> | <| <= |> = | =) $ num oder nur $ string, separator ',' ist optional zwischen den Elementen. […]

Ersetzen von speziellen Mustern in einer Zeichenfolge, Lesen aus einer Datei

Ich versuche, spezielle Muster in String durch Tabs zu ersetzen. Dieser String (wenn ich ihn nennen kann) ist ein Ergebnis vom Lesen einer Datei, die Akzente hat (ich bin portugiesisch, also UTF-8 oder LATIN-1 ist die Codierungssprache). Also stell dir meine Eingabe vor: Aubrecht, Christoph; Özceylan, Aubrecht Dilek; Klerx, Joachim; Freire, Sérgio (2013) “Future-oriented activities […]

Wie gehst du String in Worte und Sonderzeichen in Python?

Ich möchte einen String in Worte [a-zA-Z] und jedes spezielle Zeichen, das es außer @ und # Symbole enthalten kann, [a-zA-Z] message = "I am to be @split, into #words, And any other thing that is not word, mostly special character(.,>)" Erwartetes Ergebnis: ['I', 'am', 'to', 'be', '@split', ',', 'into', '#words', ',', 'And', 'any', 'other', […]

RegEx Python funktioniert nicht [doppelt]

Diese Frage hat hier schon eine Antwort: Was ist der Unterschied zwischen Pythons re.search und re.match? 6 antworten Mein Reg-Ex-Muster funktioniert nicht, warum? string = "../../example/tobematched/nonimportant.html" pattern = "example\/([az]+)\/" test = re.match(pattern, string) # None Http://www.regexr.com/39mpu

Wie kann ich in Python eine Liste verweisen?

Ich habe eine Liste von Strings, von denen ich alle Elemente entfernen muss, die mit einem Teilstring aus einer anderen Liste übereinstimmen. Ich versuche, dies mit Listen, verschachtelten Schleifen und Regex zu tun. Die Ausgabe aus dem folgenden Snippet produziert ["We not not", "need no", "education"] statt der gewünschten ["education"]. Ich bin neu in Python […]

Python ist die beste Programmiersprache der Welt.