Mit hebräisch auf python

Ich habe ein Problem, hebräische Wörter zu drucken. Ich benutze das Zählermodul, um die Anzahl der Wörter in meinem gegebenen Text zu zählen (was hebräisch ist). Der Zähler zählt in der Tat die Worte und identifiziert die Sprache, weil ich benutze # -*- coding: utf-8 -*-

Das Problem ist, wenn ich meine Zähler drucken, bekomme ich seltsame Symbole. (Ich benutze Eclipse) Hier ist der Code und die Drucke:

  • Wie kann ich das von einem Pandas-Dataframe verwendete Speicher freigeben?
  • Python MemoryError in Scipy Radial Basis Funktion (scipy.interpolate.rbf)
  • Optimieren Sie die Parsing-Datei mit json-Objekten in pandas dataframe
  • Gleiche Prozessdetails wie Task-Manager in Windows
  • Wie kann man die Haufengröße begrenzen?
  • Wie bekomme ich die maximale Speicherauslastung eines Programms mit psutil in Python
  •  # -*- coding: utf-8 -*- import string from collections import Counter class classifier: def __init__(self,filename): self.myFile = open(filename) self.cnt = Counter() def generateList(self): exclude = set(string.punctuation) for lines in self.myFile: for word in lines.split(): if word not in exclude: nWord = "" for letter in word: if letter in exclude: letter = "" nWord += letter else: nWord += letter self.cnt[nWord]+=1 print self.cnt 

    Drucke:

     Counter({'\xd7\x97\xd7\x94': 465, '\xd7\x96\xd7\x95': 432, '\xd7\xa1\xd7\x92\xd7\x95\xd7\xa8': 421, '\xd7\x94\xd7\x92\xd7\x91': 413}) 

    Irgendeine Idee, wie man die Wörter auf die richtige Weise ausdruckt?

  • Vollständig sammelbares Wörterbuch / Thesaurus
  • Irgendein Pythonmodul für kundenspezifischen BNF-Parser?
  • Wie druckt man die Anzahl der Anlässe einiger Strings in derselben CSV-Datei mit Python?
  • Semantisches Parsing mit NLTK
  • Python re.split lookahead muster
  • Parsing-Datei mit Curley-Bremsungen
  • One Solution collect form web for “Mit hebräisch auf python”

    Die "seltsamen Symbole", die du bekommst, ist Pythons Art, Unicode-Strings zu repräsentieren.

    Sie müssen sie zum Beispiel dekodieren:

    >>> drucken '\ xd7 \ x97 \ xd7 \ x94'.decode (' UTF8 ')
    חה

    Python ist die beste Programmiersprache der Welt.