diff --git a/spacy/lang/kmr/lex_attrs.py b/spacy/lang/kmr/lex_attrs.py index 6b80204104d..3be9b52442e 100644 --- a/spacy/lang/kmr/lex_attrs.py +++ b/spacy/lang/kmr/lex_attrs.py @@ -12,15 +12,24 @@ "heşt", "neh", "deh", - "yazde", - "dazde", + "yanzde", + "danzde", "sêzde", "çarde", - "pazde", - "şazde", + "panzde", + "şanzde", "hevde", "hejde", "nozde", + "yanzdeh", + "danzdeh", + "sêzdeh", + "çardeh", + "panzdeh", + "şanzdeh", + "hevdeh", + "hejdeh", + "nozdeh", "bîst", "sî", "çil", diff --git a/spacy/lang/kmr/stop_words.py b/spacy/lang/kmr/stop_words.py index aee33c2b748..f9e55ff3db8 100644 --- a/spacy/lang/kmr/stop_words.py +++ b/spacy/lang/kmr/stop_words.py @@ -1,44 +1,75 @@ STOP_WORDS = set( """ -û -li +a +an +ber +belê bi -di +bo +çawa +çend +çi +çima +çiqas da de -ji -ku +di +divê +e +ê +em +ên +ev ew +ewqas ez -tu -em +gelek +hemû +her +hê +hin +hîn hûn -ew -ev -min -te -wî -wê -me -we -wan -vê -vî -va -çi -kî +hwd +in +jê +ji +jî kê -çawa -çima +kêm kengî -li ku -çend -çiqas -her -hin -gelek -hemû kes +kî +ku +lê +lêbelê +li +me +min +mîna +ne +pir +ra +re +ser +te +tenê tişt +tu +û +va +ve +vê +vî +wan +we +wê +weke +wekî +wî +ya +yan +ye +yên """.split() )