Tag: pandas

Split pandas dataframe String Eintrag zu separaten Zeilen

Ich habe ein pandas dataframe in dem eine Spalte von Text-Strings kommagetrennte Werte enthält. Ich möchte jedes CSV-Feld aufteilen und eine neue Zeile pro Eintrag erstellen (davon ausgehen, dass CSV sauber sind und nur auf ',' aufgeteilt werden müssen). Zum Beispiel sollte a b : In [7]: a Out[7]: var1 var2 0 a,b,c 1 1 […]

Fehler bei der CORR-Funktion in Pandas

Ich hatte eine CSV-Datei von 2 Aktienkursen Daten, die ich einige native Python-Codierung, um 2 einzelne Listen von Preisen (in Dezimalstellen) von 2 Lagerzähler zu erstellen. Ich habe dann umgewandelt sie in 2 Pandas Dataframe, verwendet die .pct_change () -Funktion dann angewendet die a.corr (b) -Funktion in einem Versuch, die Korrelation zu bekommen. Das ist […]

Wie bekomme ich Zeilen, Spaltenindizes aller Nicht-NaN-Items im Pandas-Dataframe

Wie lerne ich über ein Dataframe wie das folgende und gib die Nicht-NaN-Wert-Standorte als Tupel zurück. Dh df: 0 1 2 0 NaN NaN 1 1 1 NaN NaN 2 NaN 2 NaN Ich würde eine Ausgabe von [(0, 1), (2, 0), (1, 2)] erhalten. Wäre der beste Weg, um eine verschachtelte Schleife zu machen? […]

Akzeptieren von Top-Zeilen in Pandas-Dataframe basierend auf Gruppierung

Im Zusammenhang mit der Frage hier: Reordering Pandas Dataframe basierend auf mehrere Spalte und Summe einer Spalte Wie kann ich die Top 2 Länder in diesem Dataframe akzeptieren, wenn ich die sort : In diesem Fall werden die Top 2 Länder Australien und Afghanistan sein Country_FAO type mean_area sort 5 Australia car 12141000.0 18910501.0 4 […]

Beschriftete Datentypen Python

Ich berechne geodätische Abstände zwischen einem Punkt und mehreren Liniensegmenten. Jedes Liniensegment hat eine eindeutige Identifikationsnummer. Ich möchte Distanzen von meinen Distanzen zurückgeben, so dass sie beide intrinsisch zusammengebunden sind. Ich möchte auch die Funktionalität beibehalten, wie bei der Sortierung der Distanzen, und indexiere sie entweder mit dem Etikett oder der Position und bekomme sowohl […]

Bokeh: Diagramm von pandas dataframe wird nicht auf Trigger aktualisiert

Ich habe ein Pandas-Dataframe, dessen Spalten ich als Zeilen in einer Handlung mit einem Bokeh-Server zeigen möchte. Außerdem möchte ich gern einen Schieberegler haben, um eine der Linien gegen den anderen zu verschieben. Mein Problem ist die Update-Funktionalität, wenn sich der Slider-Wert ändert. Ich habe den Code aus den Schiebereglern ausprobiert – das Beispiel von […]

Pandas – Data Series – TypeError: Index muss DatetimeIndex sein

C ist eine Datenreihe mit Form von (10000000,) mit Dtypen von dtype (<M8 [ns]). Ich möchte eine Datenmenge erstellen, die nur eine Stunde von C. enthält. c.between_time('22:00:00','23:00:00') Dies ist der Fehler, den ich bekomme TypeError: Index must be DatetimeIndex Wie soll ich das beheben?

Löschen von NaN-Zeilen, bestimmte Spalten in bestimmten Excel-Dateien mit Glob / Merge

Ich möchte NaN-Zeilen in der endgültigen Datei in einem für Loop-Laden in Excel-Dateien zu löschen, und fallen alle Unternehmen, E-Mails, erstellt doppelte Spalten aus allen, aber die endgültige geladen in Excel-Datei. Hier ist meine for-Schleife (und nachfolgende Verschmelzung in eine einzelne DF), derzeit: for f in glob.glob("./gowall-users-export-*.xlsx"): df = pd.read_excel(f) all_users_sheets_hosts.append(df) j = re.search('(\d+)', f) […]

Verschieben von Fensterprognosen mit Python

Ich bin auf der Suche, um einige Code, der out-of-sample Prognose der HAR-RV-Modell zu schaffen. Das Modell selbst wird als das folgende formuliert, und die Betas werden durch HAC-OLS oder Newey-West geschätzt. Wo wöchentlich und monatlich sind 5 und 22 tägliche Mittelwerte der täglichen RV, aber wenn Sie interessiert sind, lesen Sie mehr darüber hier […]

Pandas: index._join_level auf nicht-eindeutigen index ist nicht implementiert

Ich versuche, die Antwort an Pandas anzupassen : Schwenken auf Rang zu realen Daten. Die angebotene Lösung ausführen: pd.pivot(df['id'], df.groupby('id'), df['loc']) .rename_axis(None) .rename_axis(None, axis=1) Auf meine Daten führt zu dem Fehler Index._join_level auf nicht-eindeutigen Index ist nicht implementiert Wenn ich die Stapelspur betrachte, sehe ich, dass das Problem stammt /data/qps/dm-conda/lib/python3.4/site-packages/pandas/core/reshape.py in pivot(self, index, columns, values) […]

Python ist die beste Programmiersprache der Welt.