Gibt es eine Möglichkeit, das Pipeline-Modell in pyspark 1.6 zu bestehen oder zu retten?

Ich verstehe, dass dies eine doppelte Frage ist, die hier gefragt wurde, um Pipeline-Modell in pyspark 1.6 zu speichern, aber es gibt noch keine definitive Antwort darauf. Kann jemand etwas vorschlagen?

Joblib oder cPickle funktioniert nicht, da es den gleichen Fehler gibt, der im vorherigen Link angegeben ist. Gibt es eine Möglichkeit, die Pipeline in PySpark 1.6 zu speichern oder gibt es nicht? Die Fragen, die ich in Bezug auf die Modellpersistenz sahen, waren hauptsächlich mit persistierenden ML-Modellen verbunden. Das Sichern einer Pipeline ist die ganz andere Frage. Gibt es irgendeinen Hack, der verfügbar ist? Ich brauche die Python (v2.7) Implementierung. Jede Hilfe wird geschätzt. Ich benutze den RandomForestClassifier von pyspark.ml als Klassifizierungsalgorithmus und meine Umgebung ist Spark 1.6 und Python 2.7 (wenn dies von irgendeiner Hilfe ist)

  • So greifen Sie auf die Scrapy-Einstellungen aus dem Pipeline-Menü zu
  • Streaming-Wrapper um Programm, das auf mehrere Ausgabedateien schreibt
  • FeatureUnion in scikit klearn und inkompatible Zeilenabmessung
  • Wie erstelle ich eine Iterator-Pipeline in Python?
  • Wie kann ich Onehotencoding in Sklearn Pipeline machen?
  • Wie man die Parameter der benutzerdefinierten Kernel-Funktion mit Pipeline in scikit-lernen liest
  • Python Dictionary vs If Statement Geschwindigkeit
  • Python - Wenn nicht Aussage mit 0.0
  • Python Tic Tac Toe Spiel
  • Wie funktioniert "und" und "oder", wenn in einer Aussage kombiniert?
  • Besser, um etwas zu versuchen und die Ausnahme zu fangen oder zu testen, ob es möglich ist, eine Ausnahme zu vermeiden?
  • Styling mehrzeilige Bedingungen in 'if' Aussagen?
  • Python ist die beste Programmiersprache der Welt.