@@ -46,6 +46,7 @@ def test_normalize(self):
4646 self .assertEqual (normalize ('കൺമണി' ), 'കൺമണി' )
4747 self .assertEqual (normalize ('ഹാർഡ്വെയർ' ), 'ഹാർഡ്വെയർ' )
4848 self .assertEqual (normalize ('സോഫ്റ്റ്വെയർ' ), 'സോഫ്റ്റ്വെയർ' ) #soft_ware written with an zwj, before _ware gets removed.
49+ self .assertEqual (normalize ('ആല-' , remove_punctuations = False ), 'ആല-' ) #ZWNJ, if followed by punctuation is removed
4950 self .assertEqual (normalize ('ആറ്റ്ലി' ), 'ആറ്റ്ലി' )
5051 self .assertEqual (normalize ('ഇൻസ്റ്റിറ്റ്യൂട്ട്' ), 'ഇൻസ്റ്റിറ്റ്യൂട്ട്' )
5152 self .assertEqual (normalize ('കാല്പനികം' ), 'കാൽപനികം' )
@@ -56,13 +57,13 @@ def test_normalize(self):
5657 self .assertEqual (normalize ('നമ്പറുള്പ്പെടെ' ), 'നമ്പറുൾപ്പെടെ' )
5758 self .assertEqual (normalize ('വള്ളിച്ചെടി' ), 'വള്ളിച്ചെടി' )
5859 self .assertEqual (normalize ('കാറ്ഡ്' ), 'കാർഡ്' )
59- self .assertEqual (normalize ('കാറ്' ), 'കാറ്' )
60+ self .assertEqual (normalize ('കാറ്- ' ), 'കാറ്' )
6061 self .assertEqual (normalize ('കാറ് ' ), 'കാറ് ' )
6162 self .assertEqual (normalize ('പൂമ്പാററ' ), 'പൂമ്പാറ്റ' )
6263 self .assertEqual (normalize ('കാറ്റ്' ), 'കാറ്റ്' )
6364 self .assertEqual (normalize ('ദു:ഖത്തിന്റെ–' ), 'ദുഃഖത്തിന്റെ' )
64- self .assertEqual (normalize ('ദു:ഖത്തിന്റെ' , remove_punctuations = False ),
65- 'ദുഃഖത്തിന്റെ' )
65+ self .assertEqual (normalize ('ദു:ഖത്തിന്റെ- ' , remove_punctuations = False ),
66+ 'ദുഃഖത്തിന്റെ- ' )
6667 self .assertEqual (normalize (' ൊന്നിലോ' ), ' ഒന്നിലോ' )
6768 self .assertEqual (normalize ('ൌന്നത്യം' ), 'ഔന്നത്യം' )
6869 self .assertEqual (normalize ('പാൻറ്' ), 'പാന്റ്' )
@@ -71,8 +72,11 @@ def test_normalize(self):
7172 self .assertEqual (normalize ('അമ്മ’' ), 'അമ്മ' )
7273 self .assertEqual (normalize ('അമ്മ’' , remove_punctuations = False ), "അമ്മ'" )
7374 self .assertEqual (normalize ('ഇ–മെയിൽ' , remove_punctuations = False ), "ഇ-മെയിൽ" )
74-
75-
75+ self .assertEqual (normalize ('ഇ–മെയിൽ' ), "ഇമെയിൽ" )
76+ self .assertEqual (normalize ('ബീജിംഗ്' ), "ബീജിങ്ങ്" )
77+ self .assertEqual (normalize ('പിംഗ് ' ), "പിങ്ങ് " )
78+ self .assertEqual (normalize ('ദി കിംഗ്.' , remove_punctuations = False ), "ദി കിങ്ങ്." )
79+ self .assertEqual (normalize ('ദി കിംഗ്!' , remove_punctuations = True ), "ദി കിങ്ങ്" )
7680
7781 def test_multiline_string (self ):
7882 expected = """കുഞ്ചൻ നമ്പ്യാർ
0 commit comments