Mit hebräisch auf python

Ich habe ein Problem, hebräische Wörter zu drucken. Ich benutze das Zählermodul, um die Anzahl der Wörter in meinem gegebenen Text zu zählen (was hebräisch ist). Der Zähler zählt in der Tat die Worte und identifiziert die Sprache, weil ich benutze # -*- coding: utf-8 -*-

Das Problem ist, wenn ich meine Zähler drucken, bekomme ich seltsame Symbole. (Ich benutze Eclipse) Hier ist der Code und die Drucke:

  • Wie lese ich eine 6 GB csv Datei mit Pandas
  • Warum kostet meine Klasse so viel Gedächtnis?
  • Holen Sie sich insgesamt physischen Speicher in Python
  • Python-Subprocess.Popen-Fehler bei OSError: [Errno 12] Kann nach Ablauf der Zeitspanne keinen Speicher zuordnen
  • Wenn Dill-Datei zu groß für RAM ist, gibt es einen anderen Weg, den es geladen werden kann
  • Wie kann ich das von einem Pandas-Dataframe verwendete Speicher freigeben?
  •  # -*- coding: utf-8 -*- import string from collections import Counter class classifier: def __init__(self,filename): self.myFile = open(filename) self.cnt = Counter() def generateList(self): exclude = set(string.punctuation) for lines in self.myFile: for word in lines.split(): if word not in exclude: nWord = "" for letter in word: if letter in exclude: letter = "" nWord += letter else: nWord += letter self.cnt[nWord]+=1 print self.cnt 

    Drucke:

     Counter({'\xd7\x97\xd7\x94': 465, '\xd7\x96\xd7\x95': 432, '\xd7\xa1\xd7\x92\xd7\x95\xd7\xa8': 421, '\xd7\x94\xd7\x92\xd7\x91': 413}) 

    Irgendeine Idee, wie man die Wörter auf die richtige Weise ausdruckt?

  • Python: Wie lese und analysiere ich eine unicode utf-8 Textdatei?
  • Kleine sprache in python
  • Pandas read_fwf lädt nicht den gesamten Inhalt der Datei
  • Schreiben von Grammatikregeln für kontextsensitive Elemente mit Pyparsing
  • So finden Sie Termine im Satz mit NLP, RegEx in Python
  • Python-Methode zum Extrahieren von Inhalten (ohne Navigation) aus einer HTML-Seite
  • One Solution collect form web for “Mit hebräisch auf python”

    Die "seltsamen Symbole", die du bekommst, ist Pythons Art, Unicode-Strings zu repräsentieren.

    Sie müssen sie zum Beispiel dekodieren:

    >>> drucken '\ xd7 \ x97 \ xd7 \ x94'.decode (' UTF8 ')
    חה

    Python ist die beste Programmiersprache der Welt.