Tag: pandas

Pandas, die multicolumnindex an dataframe anwenden

Die Situation ist, dass ich ein paar Dateien mit time_series Daten für verschiedene Aktien mit mehreren Feldern haben. Jede Datei enthält time, open, high, low, close, volume Das Ziel ist, das alles in ein Dataframe der Form zu bringen field open high … security hk_1 hk_2 hk_3 … hk_1 hk_2 hk_3 … … time t_1 […]

So fügen Sie eine Spalte zu einem DataFrame hinzu, basierend auf einer Multi-Index-Map

Ich habe ein Dataframe df wie folgt: # df.head(10) TYPE AB 0 0 5 25 1 1 7 23 2 5 10 43 3 1 5 37 4 2 4 61 5 3 1 17 6 0 8 39 7 2 4 59 8 4 2 6 9 0 3 31 Und ich habe eine […]

Index in Pandas DataFrame neu zuordnen

Ich bin ziemlich sicher, dass dies ein Duplikat ist, aber ich nehme an, ich habe ein Pandas DataFrame und ich habe die Zeilen auf der Grundlage der Werte einer Spalte sortiert. Ursprünglich waren die Indizes die ganzen Zahlen 0, 1, …, n-1 aber jetzt sind sie nicht in Ordnung. Wie kann ich diese Indizes neu […]

Python pandas resample hinzugefügt Termine nicht in den ursprünglichen Daten vorhanden

Ich verwende Pandas, um Intraday-Daten zu konvertieren, die in data_m gespeichert data_m , zu täglichen Daten. Aus irgendeinem Grund resample die Zeilen für Tage hinzugefügt, die in den Intraday-Daten nicht vorhanden waren. Zum Beispiel ist 1/8/2000 nicht in den Intraday-Daten, aber die täglichen Daten enthalten eine Zeile für dieses Datum mit NaN als Wert. DatetimeIndex […]

Äußere Verschmelzung von zwei Datenrahmen in pandas

Wie kann ich zwei Datenrahmen in Pandas zusammenstellen? Angenommen, wir haben diese beiden Datenrahmen: import pandas as pd s1 = pd.DataFrame({ 'time':[1234567000,1234567005,1234567009], 'X1':[96.32,96.01,96.05] },columns=['time','X1']) # to keep columns order s2 = pd.DataFrame({ 'time':[1234567001,1234567005], 'X2':[23.88,23.96] },columns=['time','X2']) # to keep columns order Sie konnten mit pandas.DataFrame.merge ( s3 = pd.merge(s1,s2,how='outer') ) oder mit pandas.merge ( s3=s1.merge(s2,how='outer') ), […]

Pandas CSV mit Stringbegrenzern über Regex lesen

Ich versuche, eine seltsam formatierte Textdatei in einen Pandas DataFrame zu importieren. Zwei Beispiellinien sind unten: LOADED LANE 1 MAT. TYPE= 2 LEFFECT= 1 SPAN= 200. SPACE= 10. BETA= 3.474 LOADEFFECT 5075. LMAX= 3643. COV= .13 LOADED LANE 1 MAT. TYPE= 3 LEFFECT= 1 SPAN= 200. SPACE= 10. BETA= 3.515 LOADEFFECT10009. LMAX= 9732. COV= .08 […]

Kann ich in Pandas variable Spaltenbreiten setzen?

Ich habe mehrere Spalten mit langen Zeichenfolgen in einem Pandas-Datenrahmen, aber bin nur daran interessiert, einen von ihnen zu untersuchen. Gibt es eine Möglichkeit, etwas in der Linie von pd.set_option('max_colwidth', 60) aber nur für eine einzelne Spalte zu verwenden , anstatt die Breite aller Spalten in meinem df zu erweitern?

Warum wurde der Blank in der ersten Zeile verpasst, wenn pandas.to_string?

Der Code wie folgt zeigte: a=pd.DataFrame({'element':['C','H','H','H'], 'x':[-2.55,-2.19,-2.19,-3.62], 'y':[ 0.6328,-0.3759, 1.1372, 0.6328], 'z':[ 0.00, 0.00,-0.87, 0.00]}) a element xyz 0 C -2.55 0.6328 0.00 1 H -2.19 -0.3759 0.00 2 H -2.19 1.1372 -0.87 3 H -3.62 0.6328 0.00 b=a.to_string(formatters={'element': ' {:20s}'.format,'x': ' {:.8f}'.format,'y': ' {:.8f}'.format, 'z': ' {:.8f}'.format}, header=False,index=False)) Die Ausgabe ist: print(b) C -2.55000000 […]

Ipython Pandas: Wie kann ich verschiedene Zeilen einer Spalte mit Levenshtein Abstand metrisch vergleichen?

Ich habe einen Tisch wie folgt: id name 1 gfh 2 bob 3 boby 4 hgf etc. Ich frage mich, wie kann ich Levenshtein metric verwenden, um verschiedene Zeilen meiner 'name' Spalte zu vergleichen? Ich weiß schon, dass ich das benutzen kann, um Spalten zu vergleichen: L.distance('Hello, Word!', 'Hallo, World!') Aber wie wäre es mit […]

Pandas-Abfrage wirft Fehler, wenn der Spaltenname mit einer Zahl beginnt

Ich versuche, eine Abfrage auf dem folgenden Dataframe durchzuführen: data = {'ab': [1,2,3], 'c1': [1,2,3], 'd': [1,2,3], 'e_f': [1,2,3]} df = pd.DataFrame(data) for cl in df.columns: print len(df.query('%s==2' %cl)) Das geht gut Wenn jedoch ein Spaltenname mit einer Zahl beginnt, dann wird ein Syntaxfehler ausgegeben. data = {'ab': [1,2,3], 'c1': [1,2,3], '1d': [1,2,3], 'e_f': [1,2,3]} […]

Python ist die beste Programmiersprache der Welt.