Tag: numpy

Effiziente Bestimmung, ob große sortierte numpy Array hat nur eindeutige Werte

Ich habe eine sehr große numpy Array und ich möchte es sortieren und testen, ob es einzigartig ist. Ich bin mir der Funktion numpy.unique bewusst, aber es sortiert das Array noch einmal, um es zu erreichen. Der Grund, warum ich das Array a priori sortiere, ist, weil die zurückgegebenen Schlüssel aus der argsort Funktion verwendet […]

Wie erstelle ich eine Scipy Sparse Matrix aus einem Pandas Dataframe?

Ich bin auf der Suche nach einem besseren Weg, um eine scipy spärliche Matrix aus einem Pandas-Dataframe zu erstellen. Hier ist der Pseudocode für das, was ich derzeit habe row = []; column = []; values = [] for each row of the dataframe for each column of the row add the row_id to row […]

Entfernen Sie nicht numerische Werte aus einer Serie

Ich habe eine Pandas-Serie mit mehreren verschiedenen Datentypen. Ich möchte alle Elemente herausfiltern, die nicht numerisch sind. Die daraus resultierende Serie sollte nur Schwimmer oder Ints enthalten. Gibt es eine einfache Möglichkeit, die Serie zu filtern? Die meisten Lösungen fand ich nur mit DataFrames gearbeitet.

Wie wähle man den Wert aus dem Array aus, das dem Wert im Array mit der Vektorisierung am nächsten liegt?

Ich habe eine Reihe von Werten, die ich durch eine Reihe von Entscheidungen ersetzen möchte, basierend darauf, welche Wahl linear am nächsten ist. Der Fang ist die Größe der Entscheidungen zur Laufzeit definiert. import numpy as np a = np.array([[0, 0, 0], [4, 4, 4], [9, 9, 9]]) choices = np.array([1, 5, 10]) Wenn Entscheidungen […]

Effiziente Möglichkeit, Elemente in einer Pandas-Gruppe bedingungslos zu füllen (evtl. durch Anwenden einer Funktion)

Ich habe ein Problem mit der Leistung, wenn ich versuche, eine Funktion auf ein groupby-Objekt anzuwenden, das aus einem Dataframe mit etwa 150.000 Zeilen abgeleitet wird. Zur Vereinfachung arbeiten wir an dem Dummy-Dataframe arrays = [['bar', 'bar','bar', 'baz', 'baz', 'foo', 'foo', 'foo', 'qux', 'qux'], ['one', 'one','two', 'one', 'two', 'one', 'two', 'two', 'one', 'two']] tuples = […]

Python-Pandas-Rolling-Funktion mit zwei Argumenten

Die Anfänger-Liebe für die Pythonschlange ist ein harter Versuch … Ich muss eine Funktion in einem Rollfenster einer festen Länge berechnen (lasst uns sagen: 5). Die Funktion benötigt zwei Parameter. Ich weiß mir wohl die Antwort , die fast identisch ist, aber ich bekomme Fehler. Mein Code ist einfach: import numpy as np import pandas […]

Ist es möglich, numpy Array mit Sympy-Symbolen zu indizieren?

Helle Ich möchte eine Summation auf einem numpy Array wie folgt machen import numpy as np import sympy as sy import cv2 i, j = sy.symbols('i j', Integer=True) #next read some grayscale image to create a numpy array of pixels a = cv2.imread(filename) b = sy.summation(sy.summation(a[i][j], (i,0,1)), (j,0,1)) #double summation Aber ich bin mit einem […]

Numpy Array von Objektattributen

Diese Frage hat hier schon eine Antwort: Erhalten von Attributen aus Arrays von Objekten in NumPy 2 Antworten Ich habe ein mehrdimensionales Array von Objekten, so etwas wie: a = np.array([obj1,obj2,obj3]) Die Objekte sind Instanzen einer Klasse, die mehrere Attribute hat. Sagen wir, einer von ihnen ist Höhen und einer von ihnen ist Längen. Um […]

Verwenden Sie scipy.signal.spectral.lombscargle für die Zeitliche Entdeckung

Der neue Scipy v0.11 bietet ein Paket für die Spektralanalyse. Leider ist die Dokumentation spärlich und es gibt nicht viele Beispiele. Als Baby-Beispiel versuche ich, Periode Entdeckung einer Sinuswelle zu tun. Leider prognostiziert es eine Periode von 1 anstatt der erwarteten 2pi . Irgendwelche Ideen? # imports the numerical array and scientific computing packages import […]

Schnelle Abfrage in formatierten Daten

In meinem Programm muss ich durch Metadaten abfragen. Ich lese Daten in numpy Record Array A aus csv-like Textdatei ** ohne doppelte Zeilen **. var1|var2|var3|var4|var5|var6 'a1'|'b1'|'c1'|1.2|2.2|3.4 'a1'|'b1'|'c4'|3.2|6.2|3.2 'a2'|''|'c1'|1.4|5.7|3.8 'a2'|'b1'|'c2'|1.2|2.2|3.4 'a3'|''|'c2'|1.2|2.2|3.4 'a1'|'b2'|'c4'|7.2|6.2|3.2 … Es gibt Millionen von Zeilen und die Abfrage in verschachtelten Schleifen kann bis zu Milliarden Mal (meist passend die ersten 3 Spalten), so […]

Python ist die beste Programmiersprache der Welt.