Tag: regex

Python-Regex-Modul Fuzzy-Match: Substitutionszählung nicht wie erwartet

Die Python-Modul-Regex erlaubt Fuzzy-Matching Sie können die zulässige Anzahl von Substitutionen, s, Einfügungen, i, Löschungen, d und Gesamtfehler angeben, e, erlaubt The fuzzy_counts 'option' returns a tuple (0,0,0), where: match.fuzzy_counts[0] = the counts for 's', match.fuzzy_counts[1] = counts for 'i' and match.fuzzy_counts[2] = counts for 'd' Die Deletionen und Insertionen werden wie erwartet gezählt, aber […]

Regexp läuft automatisch auf Funktionseingang?

Also, ich habe eine Weile gesucht und konnte nichts finden, also habe ich mich entschlossen, mich an die Experten zu wenden, um mir zu helfen, zu klären, was los ist. Ich lerne Python und lerne über regelmäßige Ausdrücke, ich komme auf ein interessantes Stück Syntax, das ich nicht ganz herausfinden kann. In diesem Beispiel wird […]

Python 2 re.sub Ausgabe

Ich habe diese eine Funktion, die Sub-String-Matches mit dem Match mit HTML-Tags umgeben ersetzt. Diese Funktion verbraucht String in Englisch und Griechisch meist. Die Funktion: def highlight_text(st, kwlist, start_tag=None, end_tag=None): if start_tag is None: start_tag = '<span class="nom">' if end_tag is None: end_tag = '</span>' for kw in kwlist: st = re.sub(r'\b' + kw + […]

Pandas – filtern und regex den Index von DataFrame durchsuchen

Ich habe ein DataFrame, in dem die Spalten MultiIndex sind und der Index eine Liste von Namen ist, dh index=['Andrew', 'Bob', 'Calvin',…] . Ich möchte eine Funktion erstellen, um alle Zeilen des Dataframs zurückzugeben, die den Namen 'Bob' verwenden oder vielleicht mit dem Buchstaben 'A' beginnen oder mit Kleinbuchstaben beginnen. Wie kann man das machen? […]

Python-Funktion, um String zwischen zwei Markern zu finden

Ich schaue, um eine String-Funktion zu bauen, um den String-Inhalt zwischen zwei Markern zu extrahieren. Es gibt eine Extraktionsliste zurück def extract(raw_string, start_marker, end_marker): … function … return extraction_list Ich weiß, das kann mit regex getan werden, aber ist das schnell? Das wird in meinem Prozess millionenfach genannt. Was ist der schnellste Weg, dies zu […]

Machen Sie Regex Match dotfiles genau

Also habe ich die Grenze meiner Regex-Fähigkeiten mit diesem getroffen. Ich habe hier eine Python-Regex, um einen Dateipfad oder eine Datei uri mit benannten Capture-Gruppen für die verschiedenen Teile zu passen. Es scheint, Arbeitsdatei zu sein, außer auf dotfiles. MATCH_PATH = re.compile( r"^(?P<uri>file://)?" + # optional file uri r"(?P<path>(?:/?[AZ]{1}:)?" + # start of path capture, […]

Algorithmus, um natürlichen Text in Mail zu entsprechen

Ich muss natürliche, kohärente Texte / Sätze in E-Mails von Listen, Signaturen, Grüßen und so weiter vor der Weiterverarbeitung trennen. Beispiel: Hallo Tom, Letzten Montag wir haben bla bla, lore Lorem ipsum dolor sitzen amet, consectetur adipisici elit, sed eiusmod zeit incidunt ut labore et dolore magna aliqua. List item 2 List item 3 List […]

Probleme mit datetime.strptime ()

Ich habe eine Excel-Kalkulationstabelle. Ich versuche, eine Zeile aus dem Excel-Blatt zu erfassen, das ein Datum enthält, dann analysiere das Datum mit datetime.strptime() . Hier ist das Bit des Excel-Blattes, mit dem ich arbeite: Und meinen relevanten Code: pattern = re.compile(r'Listing(.+)', re.IGNORECASE) a = pattern.findall(str(df)) print("a:", a) new_a = str(a) datetime_object = datetime.strptime(new_a, '%b %w […]

Python-Regex, um ein Zeichen früher in der Zeichenfolge zu vermeiden

Ich würde gerne eine Regex verwenden, um eine genaue Zeichenfolge zu finden, aber nicht, wenn es Teil eines Kommentars ist, wie von // . So zum Beispiel in der Zeichenfolge: Hallo Apfel Äpfel // Essen Sie einen Apfel Es sollte mit dem ersten Apfel übereinstimmen, aber nicht der zweite oder dritte. Also, ich denke, die […]

Token-Capture-Sequenzen Python funktioniert nicht richtig

Ich tippe mein Python-Grepper-Skript aus. Es dauert mehrere Suchmuster und funktioniert gut mit regulären Ausdrücken und Klartext. Für diesen Test hat meine input.txt die folgenden zwei Zeilen: foo blah is a bar foo blah is bar Wenn ich laufe: cat input.txt | ./pgreper.py "foo %{0} is a %{1}" Ich sollte: Foo Blah ist eine Bar, […]

Python ist die beste Programmiersprache der Welt.