Gibt es eine Möglichkeit, das Pipeline-Modell in pyspark 1.6 zu bestehen oder zu retten?

Ich verstehe, dass dies eine doppelte Frage ist, die hier gefragt wurde, um Pipeline-Modell in pyspark 1.6 zu speichern, aber es gibt noch keine definitive Antwort darauf. Kann jemand etwas vorschlagen?

Joblib oder cPickle funktioniert nicht, da es den gleichen Fehler gibt, der im vorherigen Link angegeben ist. Gibt es eine Möglichkeit, die Pipeline in PySpark 1.6 zu speichern oder gibt es nicht? Die Fragen, die ich in Bezug auf die Modellpersistenz sahen, waren hauptsächlich mit persistierenden ML-Modellen verbunden. Das Sichern einer Pipeline ist die ganz andere Frage. Gibt es irgendeinen Hack, der verfügbar ist? Ich brauche die Python (v2.7) Implementierung. Jede Hilfe wird geschätzt. Ich benutze den RandomForestClassifier von pyspark.ml als Klassifizierungsalgorithmus und meine Umgebung ist Spark 1.6 und Python 2.7 (wenn dies von irgendeiner Hilfe ist)

  • Wie kann ich Onehotencoding in Sklearn Pipeline machen?
  • Scrapy Pipeline zu Parse
  • Wie passt man verschiedene Eingänge in eine Sklearn Pipeline?
  • So führen Sie parallele Instanzen einer Luigi-Pipeline aus: Pid-Set läuft bereits
  • Wie konvertiere ich meinen grundlegenden Feed-basierten TensorFlow-Code, um 'Dataset' zu verwenden?
  • Scrapy Pipeline zum Export von CSV-Datei im richtigen Format
  • Kein Wert im Python-Wörterbuch
  • Styling mehrzeilige Bedingungen in 'if' Aussagen?
  • So prüfen Sie, ob eine bestimmte Ganzzahl in einer Liste steht
  • Python: Überprüfen Sie, ob ein Objekt eine Sequenz ist
  • Ifelse auf pandas data frame basiert auf strings row weise
  • Python ersetzen mehrere elemente in string mit str-methoden
  • Python ist die beste Programmiersprache der Welt.