Tag: pandas

Arbeiten mit JSON in JSON mit Python / Pandas verschachtelt

Ich versuche, JSON-Daten mit Python zu laden, aber es sieht so aus: { "instrument" : "EUR_USD", "granularity" : "D", "candles" : [ { "time" : "2014-07-02T04:00:00.000000Z", // time in RFC3339 format "openMid" : 1.36803, "highMid" : 1.368125, "lowMid" : 1.364275, "closeMid" : 1.365315, "volume" : 28242, "complete" : true }, { "time" : "2014-07-03T04:00:00.000000Z", // […]

Dynamisch an einen Pandas Dataframe anhängen

Ich habe mit Pandas gespielt, um HTTP-Logs in Pandas für die Analyse zu bekommen, da es eine gute Quelle von großen Datenmengen ist und mir erlauben wird, Pandas zu lernen. Ich bekomme die Logs in einer Zeile zu einer Zeit gestreamt und kann daher nicht aus CSV importieren und muss diese in einen Pandas DataFrame […]

Lesen von csv aus Pandas mit Quotechar und Trennzeichen für einen Spaltenwert

Hier ist der Inhalt einer csv-Datei 'test.csv', ich versuche es über Pandas zu lesen read_csv () "col1", "col2", "col3", "col4" "v1", "v2", "v3", "v4" "v21", "v22", "v23", "this, "creating, what to do? " problems" Dies ist der Befehl, den ich benutze – messages = pd.read_csv('test.csv', sep=',', skipinitialspace=True) Aber ich bekomme die folgende Fehler – CParserError: […]

Anhängen von HDFStore fehlschlägt, kann die vorhandene Tabellenstruktur nicht übereinstimmen

Wenn du versuchst, ein dataframe an hdf5 in kleinen chunks über pd.HDFStore('mystore.h5', mode='a').append(my_frame, chunk) zu senden pd.HDFStore('mystore.h5', mode='a').append(my_frame, chunk) . Die Stücke sind alle gleich in Bezug auf Spalten und Typen (sie kommen aus dem gleichen Dataframe) Aber es funktioniert für eine Menge von Chunks dann Bomben auf halbem Weg durch. ValueError: cannot match existing […]

Transponieren einer Spalte in Python-Pandas mit dem einfachsten Index möglich

Ich habe folgende Daten ( data_current ): import pandas as pd import numpy as np data_current=pd.DataFrame({'medicine':['green tea','fried tomatoes','meditation','meditation'],'disease':['acne','hypertension', 'cancer','lupus']}) data_current Was ich tun möchte, ist, eine der Säulen zu transponieren, so dass ich anstelle von mehreren Reihen mit derselben Medizin und verschiedenen Krankheiten eine Reihe für jede Medizin mit mehreren Säulen für Krankheiten habe. Es […]

Verschieben von Zeilenwerten zwischen Spalten auf der Grundlage anderer Spaltenwerte in einem Pandas DataFrame

Ich habe einen Pandas-Datenrahmen mit einer Liste von Organismus-Namen und ihren Antibiotika-Empfindlichkeiten. Ich möchte alle Organismen in einer Spalte, in der DataFrame unten, auf der Grundlage der folgenden Regeln zu konsolidieren. Wenn ORG1 == A, nichts tun; Wenn ORG1! = A und ORG2 == A, bewegen Sie die ORG2-Werte in die ORG1-Spalte Wenn ORG1! = […]

Wie berechne ich ein rollende Mittel mit benutzerdefinierten Gewichten in Pandas?

Die Pandas-Dokumentation http://pandas.pydata.org/pandas-docs/stable/computation.html hat ein Beispiel für die Berechnung von gleitenden Durchschnitten: ser = pd.Series(np.random.randn(10), index=pd.date_range('1/1/2000', periods=10)) pd.rolling_window(ser, 5, 'boxcar') Die zweite Zeile berechnet einen rollenden Durchschnitt mit einem Fenster von 5 und gleichen Gewichten auf jede der fünf Beobachtungen. Die Docs verweisen auf die Möglichkeit, benutzerdefinierte Gewichte zu verwenden ("Beim Übergeben eines win_type anstelle […]

TypeError: nicht unterstützter Operand Typ (s) für -: 'str' und 'str' in python 3.x Anaconda

Ich versuche, einige Instanzen pro Stunde Zeit in einem großen Datensatz zu zählen. Der Code unten scheint zu funktionieren gut auf Python 2.7 aber ich musste es auf 3.x neuesten Version von Python mit allen aktualisierten Pakete auf Anaconda aktualisieren. Wenn ich versuche, das Programm auszuführen, str ich folgendes str Fehler Code: import pandas as […]

Paarweise Korrelation von Pandas DataFrame Spalten mit benutzerdefinierter Funktion

Pandas paarweise Korrelation auf einem DataFrame kommt praktisch in vielen Fällen. Allerdings möchte ich in meinem konkreten Fall eine von Pandas nicht zur Verfügung gestellte Methode verwenden (etwas anderes als (pearson, kendall oder spearman), um zwei Spalten zu korrelieren. Ist es möglich, in diesem Fall explizit die Korrelationsfunktion zu definieren? Die Sonnencreme möchte ich so […]

Pandas Get_dummies für verschachtelte Tabellen

Ich bin auf der Suche, um pandas get_dummy () Funktionalität zu verwenden, um einen (ziemlich umfangreichen) Satz von kategorischen Variablen zu codieren. Allerdings befinden sich die Daten derzeit im verschachtelten Tabellenformat. Bedeutung, dass jede Zeile eine andere Variable Instanz zum Beispiel darstellt Instance, Cat_Col 1, John 1, Smith 2, Jane 3, Joe Jetzt kann ich […]

Python ist die beste Programmiersprache der Welt.