Tag: pandas

Pandas: concat data frame mit unterschiedlichem Spaltennamen

Angenommen, ich habe diesen Datenrahmen id xy 0 a hello 0 b test 1 c hi 2 a hi 3 d bar Ich möchte x und y in eine einzige Spalte so konkurrieren, wie sie ihre Ionen hält id x 0 a 0 b 1 c 2 a 3 d 0 hello 0 test 1 […]

Transponieren Sie Spalten in Python / Pandas

Ich versuche, ein Dataframe mit 5 Variablen neu zu ordnen Data columns (total 7 columns): Nane 3966 non-null values Value1 3966 non-null values Value2 3966 non-null values Value3 3966 non-null values Value4 3966 non-null values Value5 3966 non-null values Period 3966 non-null values Ich hätte gern die Spalten und die anderen als Zeilen. Damit Name […]

Pandas, Excel-Import und MultiIndex

Ich bin neu in Pandas und versuche derzeit, einige Analysen von Excel-Daten im folgenden Schema zu machen: Mein Ziel ist eine Visualisierung mit den Index-Labels XYZ , CDE , EFG , HU auf der x-Achse und den entsprechenden Perc Werten von Yes , ProbYes , X , ProbNo , No gestapelt auf der y-Achse. Zurzeit […]

Hübsches Drucken von Zeilen in einem String in einem Pandas DataFrame

Ich habe einen Pandas DataFrame, in dem eine der Spalten String-Elemente enthält, und diese String-Elemente enthalten neue Zeilen, die ich buchstäblich drucken möchte. Aber sie erscheinen einfach als \n in der Ausgabe. Das heißt, ich möchte das drucken: pos bidder 0 1 1 2 2 3 <- alice <- bob 3 4 Aber das bekomme […]

Pandas: merge_asof () Summe mehrere Zeilen / nicht duplizieren

Ich arbeite mit zwei Datensätzen, die unterschiedliche Termine mit jedem verbunden sind. Ich möchte sie zusammenführen, aber weil die Daten nicht exakte Übereinstimmungen sind, glaube ich, dass merge_asof() der beste Weg ist, um zu gehen. Allerdings passieren zwei Dinge mit einem merge_asof() , die nicht ideal sind: Zahlen werden dupliziert. Zahlen sind verloren. Der folgende […]

Konvertieren von Wörterbuch zu Dataframe mit Tupel als Schlüssel

Ich habe so ein Wörterbuch df_dict = {(7, 'hello'): {1}, (1, 'fox'): {2}} Ich möchte es in ein Dataframe verwandeln, wo der erste Teil des Tupels der Zeilenkopf ist und der zweite Teil des Tupels der Spaltenkopf ist. Ich habe das versucht: doc_df = pd.DataFrame(df_dict, index=[df_dict.keys()[0]], columns = [df_dict.keys()[1]]) Aber ich habe den Fehler TypeError: […]

CSV-Datei mit Pandas lesen: komplexe Trennzeichen

Ich habe eine csv-Datei, die ich mit python panda lesen möchte. Der Kopf und die Zeilen sieht wie folgt aus: A ^B^C^D^E ^F ^G ^H^I^J^K^L^M^N Klar, es ist klar, dass Trennzeichen ist, manchmal gibt es einige seltsame Räume. Wie kann ich diese Datei perfekt lesen? Ich benutze den folgenden Befehl, um die CSV-Datei zu lesen: […]

Wie man markierte Werte von Spalten in ein Pandas Dataframe passt (einige Spaltenwerte fehlen)?

Die folgenden sind zwei Zeilen aus meinem unbeschrifteten Dataset, eine kleine Teilmenge: random1 147 sub1 95 34 dewdfa3 15000 -1238 SBAASBAQSBARSBATSBAUSBAXBELAAX AAA:COL:UVTWUVWDUWDUWDWW BBB:COL:F CCC:COL:GTATGTCA DDD:COL:K20 EEE:COL:54T GGG:COL:-30.5 HHH:COL:000.1 III:COL:2 JJJ:COL:0 random2 123 sub1 996 12 kwnc239 10027 144 LBPRLBPSLBRDLBSDLBSLLBWB AAA:COL:UWTTUTUVVUWWUUU BBB:COL:F DDD:COL:CACGTCGG EEE:COL:K19 FFF:COL:HCC16 GGG:COL:873 III:COL:-77 JJJ:COL:0 KKK:COL:0 LLL:COL:1 MMM:COL:212 Die ersten neun Spalten sind […]

Ist es möglich, eine Folge von Pandas-Befehlen über mehrere Zeilen aufzuteilen?

Ich habe eine lange Reihe von Pandas-Kettenbefehlen, zum Beispiel: df.groupby[['x','y']].apply(lambda x: (np.max(x['z'])-np.min(x['z']))).sort_values(ascending=False) Und ich möchte es in der Lage sein, es über mehrere Zeilen zu präsentieren, aber immer noch als ein Liner (ohne das Ergebnis zu einem temporären Objekt zu speichern oder das Lambda als Funktion zu definieren) Ein Beispiel dafür, wie ich es gerne […]

Wie stelle ich in Pandas die erste Spalte und Zeile als Index?

Wenn ich in einem CSV lese, kann ich sagen, pd.read_csv('my.csv', index_col=3) und setzt die dritte Spalte als Index. Wie kann ich das auch tun, wenn ich ein Pandas-Dataframe habe? Und wie kann ich sagen, die erste Zeile auch als Index zu verwenden? Die erste Spalte und die Zeile sind Strings, Rest der Matrix ist ganzzahlig.

Python ist die beste Programmiersprache der Welt.