Skip to content

Commit a87bded

Browse files
authored
Merge branch 'main' into staging/hi_itn_v2
Signed-off-by: Mariana <47233618+mgrafu@users.noreply.github.com>
2 parents cf70806 + 0153962 commit a87bded

42 files changed

Lines changed: 1260 additions & 366 deletions

Some content is hidden

Large Commits have some content hidden by default. Use the searchbox below for content that may be hidden.
Lines changed: 13 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,13 @@
1+
# Copyright (c) 2026, NVIDIA CORPORATION. All rights reserved.
2+
#
3+
# Licensed under the Apache License, Version 2.0 (the "License");
4+
# you may not use this file except in compliance with the License.
5+
# You may obtain a copy of the License at
6+
#
7+
# http://www.apache.org/licenses/LICENSE-2.0
8+
#
9+
# Unless required by applicable law or agreed to in writing, software
10+
# distributed under the License is distributed on an "AS IS" BASIS,
11+
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
12+
# See the License for the specific language governing permissions and
13+
# limitations under the License.
Lines changed: 36 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,36 @@
1+
अमरावती
2+
ईटानगर
3+
दिसपुर
4+
पटना
5+
रायपुर
6+
पणजी
7+
गांधीनगर
8+
चंडीगढ़
9+
शिमला
10+
रांची
11+
बेंगलुरु
12+
तिरुवनंतपुरम
13+
भोपाल
14+
मुंबई
15+
इम्फाल
16+
शिलांग
17+
आइजोल
18+
कोहिमा
19+
भुवनेश्वर
20+
जयपुर
21+
गंगटोक
22+
चेन्नई
23+
हैदराबाद
24+
अगरतला
25+
लखनऊ
26+
देहरादून
27+
कोलकाता
28+
पोर्ट ब्लेयर
29+
दमन
30+
नई दिल्ली
31+
श्रीनगर
32+
जम्मू
33+
लेह
34+
कारगिल
35+
कवरत्ती
36+
पुडुचेरी
Lines changed: 48 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,48 @@
1+
हाउस
2+
प्लॉट
3+
बूथ
4+
अपार्टमेंट
5+
फ्लैट
6+
यूनिट
7+
टावर
8+
कॉम्प्लेक्स
9+
मंजिल
10+
फ्लोर
11+
ब्लॉक
12+
सेक्टर
13+
फेज
14+
रोड
15+
सड़क
16+
मार्ग
17+
स्ट्रीट
18+
गली
19+
राजमार्ग
20+
ड्राइव
21+
डिस्ट्रिक्ट
22+
बाईपास
23+
हाइवे
24+
पार्कवे
25+
कॉलोनी
26+
नगर
27+
पार्क
28+
एस्टेट
29+
बोलवार्ड
30+
मार्केट
31+
सेंटर
32+
पिन
33+
गांव
34+
पास
35+
ब्रिगेड
36+
नियर
37+
स्क्वेर
38+
मॉल
39+
टॉवर
40+
इंस्टीट्यूट
41+
पिलर
42+
मेट्रो
43+
एवेन्यू
44+
वेस्ट
45+
सामने
46+
पीछे
47+
वीया
48+
आर डी
Lines changed: 2 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,2 @@
1+
street स्ट्रीट
2+
southern सदर्न
Lines changed: 26 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,26 @@
1+
A
2+
B बी
3+
C सी
4+
D डी
5+
E
6+
F एफ
7+
G जी
8+
H एच
9+
I आई
10+
J जे
11+
K के
12+
L एल
13+
M एम
14+
N एन
15+
O
16+
P पी
17+
Q क्यू
18+
R आर
19+
S एस
20+
T टी
21+
U यू
22+
V वी
23+
W डब्ल्यू
24+
X एक्स
25+
Y वाई
26+
Z ज़ेड
Lines changed: 2 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,2 @@
1+
- हाइफ़न
2+
/ बटा
Lines changed: 36 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,36 @@
1+
आंध्र प्रदेश
2+
अरुणाचल प्रदेश
3+
असम
4+
बिहार
5+
छत्तीसगढ़
6+
गोवा
7+
गुजरात
8+
हरियाणा
9+
हिमाचल प्रदेश
10+
झारखंड
11+
कर्नाटक
12+
केरल
13+
मध्य प्रदेश
14+
महाराष्ट्र
15+
मणिपुर
16+
मेघालय
17+
मिज़ोरम
18+
नागालैंड
19+
ओडिशा
20+
पंजाब
21+
राजस्थान
22+
सिक्किम
23+
तमिलनाडु
24+
तेलंगाना
25+
त्रिपुरा
26+
उत्तर प्रदेश
27+
उत्तराखंड
28+
पश्चिम बंगाल
29+
अंडमान और निकोबार द्वीप समूह
30+
चंडीगढ़
31+
दादरा और नगर हवेली और दमन और दीव
32+
दिल्ली
33+
जम्मू और कश्मीर
34+
लद्दाख
35+
लक्षद्वीप
36+
पुडुचेरी

nemo_text_processing/text_normalization/hi/data/date/days.tsv

Lines changed: 31 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -29,3 +29,34 @@
2929
२९ उनतीस
3030
३० तीस
3131
३१ इकतीस
32+
01 एक
33+
02 दो
34+
03 तीन
35+
04 चार
36+
05 पाँच
37+
06 छः
38+
07 सात
39+
08 आठ
40+
09 नौ
41+
10 दस
42+
11 ग्यारह
43+
12 बारह
44+
13 तेरह
45+
14 चौदह
46+
15 पंद्रह
47+
16 सोलह
48+
17 सत्रह
49+
18 अठारह
50+
19 उन्नीस
51+
20 बीस
52+
21 इक्कीस
53+
22 बाईस
54+
23 तेईस
55+
24 चौबीस
56+
25 पच्चीस
57+
26 छब्बीस
58+
27 सत्ताईस
59+
28 अट्ठाईस
60+
29 उनतीस
61+
30 तीस
62+
31 इकतीस

nemo_text_processing/text_normalization/hi/data/date/months.tsv

Lines changed: 12 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -10,3 +10,15 @@
1010
१० अक्टूबर
1111
११ नवंबर
1212
१२ दिसंबर
13+
01 जनवरी
14+
02 फ़रवरी
15+
03 मार्च
16+
04 अप्रैल
17+
05 मई
18+
06 जून
19+
07 जुलाई
20+
08 अगस्त
21+
09 सितंबर
22+
10 अक्टूबर
23+
11 नवंबर
24+
12 दिसंबर

nemo_text_processing/text_normalization/hi/data/measure/quarterly_units_map.tsv

Lines changed: 0 additions & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -8,4 +8,3 @@ hp हॉर्सपॉवर
88
d दिन
99
month महीना
1010
months महीने
11-

0 commit comments

Comments
 (0)