Mit hebräisch auf python

Ich habe ein Problem, hebräische Wörter zu drucken. Ich benutze das Zählermodul, um die Anzahl der Wörter in meinem gegebenen Text zu zählen (was hebräisch ist). Der Zähler zählt in der Tat die Worte und identifiziert die Sprache, weil ich benutze # -*- coding: utf-8 -*-

Das Problem ist, wenn ich meine Zähler drucken, bekomme ich seltsame Symbole. (Ich benutze Eclipse) Hier ist der Code und die Drucke:

  • Python MemoryError in Scipy Radial Basis Funktion (scipy.interpolate.rbf)
  • Pandas-Speicherfehler nach einem bestimmten Skiprows-Parameter
  • Holen Sie sich insgesamt physischen Speicher in Python
  • Wie kann man die Haufengröße begrenzen?
  • Wie kann ich das von einem Pandas-Dataframe verwendete Speicher freigeben?
  • Gleiche Prozessdetails wie Task-Manager in Windows
  •  # -*- coding: utf-8 -*- import string from collections import Counter class classifier: def __init__(self,filename): self.myFile = open(filename) self.cnt = Counter() def generateList(self): exclude = set(string.punctuation) for lines in self.myFile: for word in lines.split(): if word not in exclude: nWord = "" for letter in word: if letter in exclude: letter = "" nWord += letter else: nWord += letter self.cnt[nWord]+=1 print self.cnt 

    Drucke:

     Counter({'\xd7\x97\xd7\x94': 465, '\xd7\x96\xd7\x95': 432, '\xd7\xa1\xd7\x92\xd7\x95\xd7\xa8': 421, '\xd7\x94\xd7\x92\xd7\x91': 413}) 

    Irgendeine Idee, wie man die Wörter auf die richtige Weise ausdruckt?

  • Python fordert die Anmeldeseite vor dem Analysieren von Daten an
  • Pulsieren von URI-Parameter und Keyword-Wertepaaren
  • String zu OrderedDict Konvertierung in Python
  • __decorated__ für pythondekorateure
  • Vollständig sammelbares Wörterbuch / Thesaurus
  • Welches Werkzeug zu verwenden, um Programmiersprachen in Python zu analysieren?
  • One Solution collect form web for “Mit hebräisch auf python”

    Die "seltsamen Symbole", die du bekommst, ist Pythons Art, Unicode-Strings zu repräsentieren.

    Sie müssen sie zum Beispiel dekodieren:

    >>> drucken '\ xd7 \ x97 \ xd7 \ x94'.decode (' UTF8 ')
    חה

    Python ist die beste Programmiersprache der Welt.