Tag: pandas

Python-Pandas: Zeigt den Index der Zeilen, welche Spalte mit einem bestimmten Wert übereinstimmt

Bei einem DataFrame mit einer Spalte "BoolCol" wollen wir die Indizes des DataFrame finden, in denen die Werte für "BoolCol" == True liegen Ich habe derzeit den iterierenden Weg, es zu tun, was perfekt funktioniert: for i in range(100,3000): if df.iloc[i]['BoolCol']== True: print i,df.iloc[i]['BoolCol'] Aber das ist nicht der richtige Weg des Pandas. Nach einigen […]

Neuronale Netzwerk-LSTM-Eingangsform aus Dataframe

Ich versuche, ein LSTM mit Keras zu implementieren. Ich weiß, dass LSTM in Keras einen 3D-Tensor mit Form (nb_samples, timesteps, input_dim) als Eingabe benötigt. Allerdings bin ich nicht ganz sicher, wie die Eingabe in meinem Fall aussehen sollte, da ich nur einen Stichprobe von T Beobachtungen für jeden Eingang habe, nicht mehrere Samples, dh (nb_samples=1, […]

Parse Termine, wenn YYYYMMDD und HH sind in separaten Spalten mit Pandas in Python

Ich habe eine einfache Frage im Zusammenhang mit csv-Dateien und Parsing datetime. Ich habe eine csv-Datei, die so aussieht: YYYYMMDD, HH, X 20110101, 1, 10 20110101, 2, 20 20110101, 3, 30 Ich möchte es mit Pandas (read_csv) lesen und es in einem Dataframe haben, das von der datetime indiziert wird. Bisher habe ich versucht, folgendes […]

Naming zurückgegeben Spalten in Pandas aggregate Funktion?

Ich habe Probleme mit der Funktionalität von Pandas. Ich habe die Dokumentation gelesen, aber ich kann nicht sehen, wie man aggregierte Funktionen auf mehrere Spalten anwendet und benutzerdefinierte Namen für diese Spalten hat. Dies ist sehr nahe, aber die zurückgegebene Datenstruktur hat die Spaltenüberschriften verschachtelt: data.groupby("Country").agg( {"column1": {"foo": sum()}, "column2": {"mean": np.mean, "std": np.std}}) (Dh […]

Python-Pandas Wie wählt man Zeilen mit einem oder mehreren Nullen aus einem DataFrame aus, ohne Spalten explizit aufzulisten?

Ich habe ein Dataframe mit ~ 300K Zeilen und ~ 40 Spalten. Ich möchte herausfinden, ob irgendwelche Zeilen Nullwerte enthalten – und diese 'null'-Zeilen in ein separates Dataframe setzen, damit ich sie leicht erforschen könnte. Ich kann eine Maske explizit erstellen: mask=False for col in df.columns: mask = mask | df[col].isnull() dfnulls = df[mask] Oder […]

Python-Pandas: Überprüfen Sie, ob ein Wert NaN in DataFrame ist

In python pandas, was ist der beste Weg zu überprüfen, ob ein DataFrame hat eine (oder mehrere) NaN-Werte? Ich kenne die Funktion pd.isnan , aber das gibt einen DataFrame von Booleans für jedes Element zurück. Dieser Beitrag hier richtig nicht nur meine Frage beantworten.

Wie konvertiere man Pandas-Index in einem Dataframe in eine Spalte?

Dies scheint ziemlich offensichtlich, aber ich kann nicht scheinen, um herauszufinden, wie konvertiere ich einen Index von Datenrahmen in eine Spalte? Beispielsweise: df= gi ptt_loc 0 384444683 593 1 384444684 594 2 384444686 596 Nach, df= index1 gi ptt_loc 0 0 384444683 593 1 1 384444684 594 2 2 384444686 596

So verschieben Sie eine Spalte in Pandas DataFrame

Ich möchte eine Spalte in einem Pandas DataFrame , aber ich habe nicht in der Lage, eine Methode zu finden, um es aus der Dokumentation zu machen, ohne das gesamte DF neu zu schreiben. Weiß jemand, wie man das macht? DataFrame: ## x1 x2 ##0 206 214 ##1 226 234 ##2 245 253 ##3 265 […]

Python-Pandas: Konvertieren von Zeilen als Spaltenüberschriften

Ich habe folgendes dataframe: Year Country medal no of medals 1896 Afghanistan Gold 5 1896 Afghanistan Silver 4 1896 Afghanistan Bronze 3 1896 Algeria Gold 1 1896 Algeria Silver 2 1896 Algeria Bronze 3 Ich will es so. Year Country Gold Silver Bronze 1896 Afghanistan 5 4 3 1896 Algeria 1 2 3 Stack / […]

Ersetzen von leeren Werten (Leerraum) mit NaN in Pandas

Ich möchte alle Werte in einem Pandas-Dataframe finden, die Whitespace (beliebige Menge) enthalten und diese Werte durch NaNs ersetzen. Irgendwelche Ideen, wie dies verbessert werden kann? Grundsätzlich möchte ich das drehen: ABC 2000-01-01 -0.532681 foo 0 2000-01-02 1.490752 bar 1 2000-01-03 -1.387326 foo 2 2000-01-04 0.814772 baz 2000-01-05 -0.222552 4 2000-01-06 -1.176781 qux Das mögen: […]

Python ist die beste Programmiersprache der Welt.