Skip to content

capitalized or non-capitalized lemmas in Spanish #1229

@AngledLuffa

Description

@AngledLuffa

Example:

(base) [john@localhost UD_Spanish-AnCora]$ grep "       Año     " *
es_ancora-ud-test.conllu:1      Año     año     NOUN    ncms000 Gender=Masc|Number=Sing 12      obj     12:obj  Entity=(CESSCASTA2000122317865c38--1|SpaceAfter=No
es_ancora-ud-train.conllu:10    Año     Año     PROPN   np0000a _       0       root    0:root  MWE=Año_del_Gato|MWEPOS=PROPN|ArgTem=arg2:atr
es_ancora-ud-train.conllu:17    Año     Año     PROPN   np0000a _       10      conj    10:conj MWE=Año_del_Conejo|MWEPOS=PROPN
es_ancora-ud-train.conllu:25    Año     Año     PROPN   np0000a _       10      conj    10:conj MWE=Año_del_Buitre|MWEPOS=PROPN
es_ancora-ud-train.conllu:22    Año     Año     PROPN   np00000 _       18      nmod    18:nmod MWE=Año_Internacional_del_Voluntariado_2001|MWEPOS=PROPN|ArgTem=arg1:pat
es_ancora-ud-train.conllu:15    Año     Año     PROPN   np00000 _       13      nmod    13:nmod MWE=Año_Nuevo|MWEPOS=PROPN|ArgTem=argM:tmp|Entity=(NOCOREF:Spec.other-other-1-gstype:spec
es_ancora-ud-train.conllu:23    Año     Año     PROPN   np00000 _       21      nmod    21:nmod MWE=Año_Nuevo|MWEPOS=PROPN|ArgTem=argM:tmp|Entity=(NOCOREF:Spec.other-other-1-gstype:spec
es_ancora-ud-train.conllu:64    Año     Año     PROPN   _       _       62      flat    62:flat Entity=CESSCASTP1999070188c7)|SpaceAfter=No
es_ancora-ud-train.conllu:19    Año     Año     PROPN   np00000 _       17      nmod    17:nmod MWE=Año_Nuevo|MWEPOS=PROPN|Entity=(NOCOREF:Spec.other-other-1-gstype:spec
es_ancora-ud-train.conllu:5     Año     Año     PROPN   np00000 _       2       obj     2:obj   MWE=Año_Nuevo|MWEPOS=PROPN|ArgTem=arg1:pat|Entity=(NOCOREF:Spec.other-other-1-gstype:spec
(base) [john@localhost UD_Spanish-AnCora]$ grep "       Año     " ../UD_Spanish-GSD/*
../UD_Spanish-GSD/es_gsd-ud-dev.conllu:8        Año     año     NOUN    _       _       6       nmod    _       _
../UD_Spanish-GSD/es_gsd-ud-dev.conllu:5        Año     año     NOUN    _       Gender=Masc|Number=Sing 2       nmod    _       _
../UD_Spanish-GSD/es_gsd-ud-train.conllu:2      Año     año     NOUN    _       Gender=Masc|Number=Sing 5       nmod    _       _
../UD_Spanish-GSD/es_gsd-ud-train.conllu:10     Año     año     PROPN   _       Gender=Masc|Number=Sing 7       nmod    _       SpaceAfter=No
../UD_Spanish-GSD/es_gsd-ud-train.conllu:21     Año     año     NOUN    _       Gender=Masc|Number=Sing 18      nmod    _       _
../UD_Spanish-GSD/es_gsd-ud-train.conllu:28     Año     año     NOUN    _       Gender=Masc|Number=Sing 25      nmod    _       SpaceAfter=No
../UD_Spanish-GSD/es_gsd-ud-train.conllu:23     Año     año     NOUN    _       _       21      nmod    _       _
../UD_Spanish-GSD/es_gsd-ud-train.conllu:26     Año     año     NOUN    _       _       23      nmod    _       _
../UD_Spanish-GSD/es_gsd-ud-train.conllu:12     Año     año     NOUN    _       _       10      nmod    _       _
../UD_Spanish-GSD/es_gsd-ud-train.conllu:31     Año     año     PROPN   _       Gender=Masc|Number=Sing 29      obj     _       _

Metadata

Metadata

Assignees

No one assigned

    Type

    No type
    No fields configured for issues without a type.

    Projects

    No projects

    Milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions