Tag: pandas

Verknüpfen / Zusammenführen von Dataframes durch vordefinierte Spalten

Ich habe folgende Liste der Dataframes: import pandas as pd rep1 = pd.DataFrame.from_items([('Probe', ['x', 'y', 'z']), ('Gene', ['foo', 'bar', 'qux']), ('RP1',[1.00,23.22,11.12])], orient='columns') rep2 = pd.DataFrame.from_items([('Probe', ['x', 'y', 'z']), ('Gene', ['foo', 'bar', 'qux']), ('RP2',[11.33,31.25,22.12])], orient='columns') rep3 = pd.DataFrame.from_items([('Probe', ['x', 'y', 'z']), ('Gene', ['foo', 'bar', 'qux'])], orient='columns') tmp = [] tmp.append(rep1) tmp.append(rep2) tmp.append(rep3) # In actuality the […]

Python-Pandas, wie man DatetimeIndex trennt und fehlende Daten nur in einem bestimmten Intervall füllt

2012-10-08 07:12:22 0.0 0 0 2315.6 0 0.0 0 2012-10-08 09:14:00 2306.4 20 326586240 2306.4 472 2306.8 4 2012-10-08 09:15:00 2306.8 34 249805440 2306.8 361 2308.0 26 2012-10-08 09:15:01 2308.0 1 53309040 2307.4 77 2308.6 9 2012-10-08 09:15:01.500000 2308.2 1 124630140 2307.0 180 2308.4 1 2012-10-08 09:15:02 2307.0 5 85846260 2308.2 124 2308.0 9 2012-10-08 […]

Zusammenfassung Berechnungen auf einem Pandas Dataframe

Ich habe einen DF, der wie der Boden aussieht (Auszug, es gibt 4 Regionen und die Termine erweitern jedes Quartal) Ich möchte eine df (nach Region) mit nur den Unterschied zwischen dem neuesten Datum und dem Quartal vor und dem Jahr vor (das gleiche Quartal) An diesem Punkt sind beide Regionen und Quradate Indizes. Also […]

Aufbau eines hierarchisch indizierten DataFrame aus vorhandenen DataFrames

Ich habe zwei Dataframes mit den gleichen Spalten und Indizes. Ich möchte sie zu einem dritten Dataframe mit einem hierarchischen Index kombinieren, den aktuellen Index beibehalten und eine Sekunde hinzufügen, die identifiziert, woher jedes DataFrame kam. Das habe ich versucht df_a = pd.DataFrame(randn(3, 2), columns=["x", "y"], index=range(3)) df_b = pd.DataFrame(randn(3, 2), columns=["x", "y"], index=range(3)) tuples […]

Wie man eine Dataframe-Spalte in mehrere Spalten aufteilt

Nach vielen Stößen fange ich an, meine R-Skripte zu Python zu migrieren. Die meisten meiner Arbeiten in R beteiligten Datenrahmen, und ich verwende das DataFrame Objekt aus dem Pandas-Paket. In meinem Skript muss ich in einer CSV-Datei lesen und die Daten in ein DataFrame Objekt DataFrame . Als nächstes muss ich die Hex-Werte in eine […]

So geben Sie min_itemsize für eine Indexspalte an

Ich bin nicht in der Lage, die Mindestgröße für den Index in einem to_hdf Append-Vorgang anzugeben. Min_itemsize funktioniert für die Datenspalten, also wie kann ich es für die Indexspalte arbeiten? Dieser Code: from pandas import * df = DataFrame(['1','2'],index=['a','b']) df.index.name = 'symbol' df.to_hdf("store.h5",'df',append = True,format='table',min_itemsize = { 'symbol' : 10} ) Erzeugt diese Fehlermeldung: ValueError: […]

Panda-Säule als Index für numpy Array

Wie kann ich eine Panda-Reihe als Index für ein numpy Array verwenden? Sage ich habe >>> grid = arange(10,20) >>> df = pd.DataFrame([0,1,1,5], columns=['i']) ich möchte zu tun >>> df['j'] = grid[df['i']] IndexError: unsupported iterator index Was ist ein kurzer und sauberer Weg, um diesen Vorgang tatsächlich durchzuführen? Aktualisieren Um genau zu sein, möchte ich […]

Pandas, Name der Spalte nach einer Gruppe nach Funktion

Ich habe eine einfache Pandas Dataframe namens buy_cat_df: email cat 0 email1@gmail.com Mobiles & Tablets 1 email2@gmail.com Mobiles & Tablets 2 email1@gmail.com Mobiles & Tablets 3 email3@gmail.com Mobiles & Tablets 4 email3@gmail.com Home & Living 5 email1@gmail.com Home & Living Ich gruppiere mich mit der "E-Mail" und setze "Katze" in eine Liste wie folgt: test […]

Wie konvertiert man eine geparste Json-Datei in den Pandas-Datenrahmen?

Ich habe eine Json-Datei mit nicht gültigen Zeilen. Ich habe es mit diesem Code gelesen import json import pandas as pd data = [] with open('json file ') as f: for line in f: data.append(json.loads(line)) Tut mir leid wegen der hässlich aussehenden Code, ich benutze die mobile Stack Exchange App. Was ich tun möchte, ist, […]

Alternative Methode zur Vermeidung von Schleife in pandas dataframe

Ich habe folgendes dataframe: table2 = pd.DataFrame({ 'Product Type': ['A', 'B', 'C', 'D'], 'State_1_Value': [10, 11, 12, 13], 'State_2_Value': [20, 21, 22, 23], 'State_3_Value': [30, 31, 32, 33], 'State_4_Value': [40, 41, 42, 43], 'State_5_Value': [50, 51, 52, 53], 'State_6_Value': [60, 61, 62, 63], 'Lower_Bound': [-1, 1, .5, 5], 'Upper_Bound': [1, 2, .625, 15], 'sim_1': [0, […]

Python ist die beste Programmiersprache der Welt.