Tag: pandas

Wie importiere ich csv's mit "gelegentlichen" Zitaten (R und / oder Pandas)?

Ich lief heute über ein neues Problem. Ich entdeckte einige Daten, mit denen ich arbeite, das sieht so aus (in einer csv Datei): Male,White,All Combined,1989,30-31,31,"59,546","18,141","328,235" Male,White,Felony – Drug,1989,30-31,31,"3,861","1,176","328,235" Male,White,Felony – Other,1989,30-31,31,"2,626",800,"328,235" Male,White,Felony – Property,1989,30-31,31,"3,468","1,057","328,235" Male,White,Felony – Violent/Sex,1989,30-31,31,"3,150",960,"328,235" Male,White,Misdemeanor,1989,30-31,31,"46,441","14,149","328,235" Male,White,Status,1989,30-31,31,0,0,"328,235" Es ist schwer, das Problem zu sehen, also lass mich die zweite bis letzte Spalte hervorheben: […]

Ersetzen Sie Zeilen in einem Pandas df mit Zeilen aus einem anderen df

Ich habe 2 Pandas dfs, A und B. Beide haben 10 Spalten und den Index 'ID'. Wenn die IDs von A und B übereinstimmen, möchte ich die Zeilen von B durch die Zeilen von A ersetzen. Ich habe versucht, pd.update zu verwenden, aber noch keinen Erfolg. Jede Hilfe geschätzt.

Anwenden der Funktion auf Pandas dataframe nach Spalte

Ich habe eine Funktion, die ich auf bestimmte Spalten eines Pandas-Dataframs anwenden möchte. Also, anstatt explizit die Spalten anzugeben, möchte ich die Spalten, die ich will, dynamisch auswählen und dann die Funktion zB anrufen So implementiere ich wie: for column in dataframe: if column.name != 'manager': apply function():

Erstellen von Perioden für Multiquarter Timespan in Pandas

Viele Unternehmen geben vierteljährliche Finanzdaten frei, die sich gut an eine Pandas-Periode abbilden: p = Period('2012Q1', freq='Q-DEC') Die in den Anmeldungen als "Drei Monate zum 31. März 2012" bezeichnet werden. Allerdings werden einige Finanzdaten in der Form veröffentlicht: "Neun Monate zum 30. September 2005". Wie würde ich ein Periodenobjekt für die "Neun Monate zum 30. […]

Zweck der 'ax' Schlüsselwort in pandas scatter_matrix Funktion

Ich bin verwirrt durch die Bedeutung des ' ax ' Schlüsselwortes in der Pandas scatter_matrix Funktion: Pd.scatter_matrix (frame, alpha = 0.5, figsize = Keine, ax = Keine , grid = False, diagonal = 'hist', marker = '.', Density_kwds = {}, hist_kwds = {}, ** kwds) Der einzige Hinweis, der im docstring für das ax Schlüsselwort […]

Konnte keine Zeichenfolge zum Float-Fehler konvertieren.

Ich möchte Werte auf die X- und Y-Achse hinweisen. Ich möchte keine Daten in die Grafik setzen, nur die Axis 'mit Time und DID (wie unten gesehen) Hier ist mein Code: import pandas as pd import matplotlib.pyplot as plt from matplotlib import style style.use('ggplot') df = pd.read_csv('Test_Sheet_1.csv') Time = df.ix[8:, 1] DID = df.ix[1, 6:13] […]

Wie man eine pandas dataframe Spalte in ein datetime Objekt macht, das gerade das Datum zeigt, um korrekt zu sortieren

Wenn ich auf month_date in dataframe (df) sortiere, das enthält [2014-06-01, 2014-07-01, 2014-08-01,2014-09-01,2014-10-01] Ich bekomme folgendes: result = df.sort(['month_date'], ascending=True) Das Ergebnis ist jedoch (in dieser Reihenfolge): 10, 6, 7, 8, 9, Während ich 6, 7, 8, 9, 10 erwartete Vielleicht liegt das daran, dass ich nicht angegeben habe, dass die month_date-Spalte ein datetime-Objekt sein […]

Ipython pandas TypeError: read_csv () bekam ein unerwartetes Keyword-Argument 'delim-whitespace' '

Beim Versuchen des ipython.org Notizbuches "EINFÜHRUNG ZUM PYTHON FÜR DATENMINING" Der folgende Code: data = pd.read_csv("http://archive.ics.uci.edu/ml/machine-learning-databases/auto-mpg/auto-mpg.data-original", delim_whitespace = True, header=None, names = ['mpg', 'cylinders', 'displacement', 'horsepower', 'weight', 'acceleration', 'model', 'origin', 'car_name']) Ergibt den folgenden Fehler: TypeError: read_csv() got an unexpected keyword argument 'delim-whitespace' Leider ist die Dataset-Datei selbst nicht wirklich csv, und ich weiß nicht, […]

Erstellen einer Matrix aus Pandas dataframe, um Verbundenheit anzuzeigen – 2

Dies ist eine Folgefrage zum Erstellen einer Matrix aus Pandas dataframe, um Verbundenheit anzuzeigen . Der Unterschied liegt in der Matrix. Ich habe meine Daten in diesem Format in einem Pandas Dataframe: Customer_ID Location_ID Alpha A Alpha B Alpha C Beta A Beta B Beta D Ich möchte die Mobilitätsmuster der Kunden studieren. Mein Ziel […]

Warum kann ich nicht innerhalb einer Pandas-Funktion wechseln?

Ich versuche, eine Funktion zu bauen, die .shift () verwendet, aber es gibt mir einen Fehler. Bedenken Sie: In [40]: data={'level1':[20,19,20,21,25,29,30,31,30,29,31], 'level2': [10,10,20,20,20,10,10,20,20,10,10]} index= pd.date_range('12/1/2014', periods=11) frame=DataFrame(data, index=index) frame Out[40]: level1 level2 2014-12-01 20 10 2014-12-02 19 10 2014-12-03 20 20 2014-12-04 21 20 2014-12-05 25 20 2014-12-06 29 10 2014-12-07 30 10 2014-12-08 31 […]

Python ist die beste Programmiersprache der Welt.