| Die DCAT-AP.de SHACL-Validation wird aktuell mit Blick auf die DCAT-AP.de 3.0 Spezifikation weiterentwickelt. Wenn Sie Fehler entdecken, dann freuen wir uns über Ihr Feedback! |
Basiert auf dem Profil DCAT-AP 3.0 - Übersetzungen und Einschränkungen und ergänzt es um folgende Aspekte:
- Deprecated-Meldungen für Eigenschaften und Codelisten (
dcat-ap-de-deprecated.ttl) - Deutsche Eigenschaften und Änderungn (
dcat-ap-spec-german-additions.ttl) - Verwendung der verlangten kontrollierten Vokabulare (
dcat-ap-de-imports.ttlunddcat-ap-de-controlledvocabularies.ttl).
Die SEMIC stellt ihren eigenen DCAT-AP-Validator zur Verfügung, der zuverlässig funktioniert.
Dieses Validierungsprofil basiert auf de SEMIC Datei (https://github.com/SEMICeu/DCAT-AP/blob/master/releases/3.0.0/shacl/dcat-ap-SHACL.ttl) erweitert um die Datei dcat-ap-SHACL-DE.ttl. Die deutschen Erweiterungen verändern die Validierung wie folgt:
- Hinzufügen deutschsprachiger Fehlermeldungen
- Deaktivierung von Shapes, die eine nicht sinnvolle Range prüfen
Betroffen sind die Klassen dcterms:Frequency, dcterms:LicenseDocument, dcterms:LinguisticSystem, dcterms:MediaType, dcterms:MediaTypeOrExtent, dcterms:ProvenanceStatement, dcterms:RightsStatement, dcterms:Standard, eli:LegalResource, foaf:Document, locn:Geometry, odrl:Policy, prov:Activity, prov:Attribution, rdfs:Resource, skos:Concept, skos:ConceptScheme und spdx:ChecksumAlgorithm.
Die SEMIC stellt ihren eigenen DCAT-AP-Validator zur Verfügung, der zuverlässig funktioniert.
Der deutsche Validator verwendet die verpflichtenden Regeln der SEMIC und reichert sie mit deutschen Fehlernachrichten an. Dazu werden folgende Dateien verwendet:
- https://github.com/init-dcat-ap-de/DCAT-AP/blob/2.1.1-draft/releases/2.1.1/dcat-ap_2.1.1_shacl_shapes.ttl
- https://github.com/GovDataOfficial/DCAT-AP.de-SHACL-Validation/blob/master/validator/resources/v2.0/shapes/dcat-ap-spec-german-messages.ttl
Die folgende Datei fügt zu den DCAT-AP-SHACL-Shapes deutsche Regeln hinzu, so dass DCAT-AP.de 2.0 geprüft wird. Dafür werden zum Teil auch widersprüchliche DCAT-AP-SHACL-Shapes deaktiviert:
Weitere externe Quellen, wie Ontologien, deren Kontext relevant sind oder kontrollierte Vokabulare, werden durch diese Datei importiert:
- Verwendung aller Pflichteigenschaften
- Min- und Max-Kardinalitäten
- Verwendung (getypter) Literals, wenn zutreffend
- Verwendung von URIs, wenn als Ziel eine Klasse erwartet wird
- Verwendung von URIs, wenn als Ziel eine beliebige Webadresse erwartet wird
- Verwendung der korrekten kontrollierten Vokabulare
- Warnung bei der Verwendung von
deprecated-Eigenschaften
Ob das Objekt einer Eigenschaft die von DCAT-AP(.de) vorgegebene Klasse hat, wird geprüft, wenn der Aufbau des Objekts für den Anwendungsfall "Anlieferung an ein Metadatenportal" entscheidend ist.
Dies betrifft die DCAT-AP-Kernklassen und Eigenschaften dcat:catalog, dcat:dataset, dcat:service, dcat:record und dcat:distribution sowie die Eigenschaften, die auf z.B. foaf:Agent, dct:PeriodOfTime oder dct:Location verweisen.
Für die Eigenschaften adms:sample, dct:source, dct:hasVersion, dct:isVersionOf, dct:hasPart und dct:isPartOf wird davon ausgegangen, dass deren Objekte nicht im Kern der Validierung stehen. Daher wird lediglich gewarnt, wenn sie nicht die korrekte Klasse haben.
- Kategorie (da kontrolliertes Vokabular genutzt werden muss)
- Kategorienschema (da kontrolliertes Vokabular genutzt werden muss)
- Lizenzdokument (da kontrolliertes Vokabular genutzt werden muss)
Dieses Profil prüft alles, was DCAT-AP.de SHACL-Validation prüft. Zusätzlich:
K01: dcat:contactPoint: Kontaktinformationen MÜSSEN mindestens Angaben zur Email (vcard:hasEmail) oder einen Link zum Kontaktformular oder Chatbot (vcard:hasURL) enthalten.K12&13: dcat:Dataset:dcatde:contributorIDMUSS verwendet werden und DARF nur genau einmal eine IRI aus http://dcat-ap.de/def/contributors/ verwenden.K36: dcat:Dataset:dct:publisherMUSS verwendet werden.K30: dcat:Dataset:dcat:theme: Zur Steigerung der Metadatenqualität wird die Angabe von Kategorien empfohlen.K31: dcat:Distribution:dct:licenseMUSS eine IRI aus http://dcat-ap.de/def/licenses/ verwenden.K32: dcat:Distribution:dct:formatMUSS eine IRI aus dem EU Vokabular 'File Type' verwenden.
dcat:Dataset:dcat:distribution: Es wird empfohlen, dass jedes Dataset über eine Distribution verfügt.dcat:Dataset:dcat:keyword: Zur Steigerung der Metadatenqualität wird die Angabe von Schlagworten empfohlen.dcat:Dataset:dcat:landingPage: Zur Steigerung der Metadatenqualität wird die Angabe der ursprünglichen Webseite empfohlen.dcat:Dataset:dct:issued: Zur Steigerung der Metadatenqualität wird die Angabe des Veröffentlichungsdatums empfohlen.dcat:Distribution:dct:title: Es wird empfohlen, dass jede Distribution über einen dct:title verfügt.
dcat:Dataset: Ggf. MUSSdct:identifierzur Dublettenprüfung verwendet werden.dcat:Dataset: Ggf. MUSSdct:modifiedzur Dublettenprüfung verwendet werden.
Die Auswahl erfolgte mit Blick auf die Verarbeitung im GovData-Frontend.
dcat:Dataset: IRIorLiteral:dct:conformsTo,dct:accessRights,dct:provenancedcat:Dataset: IRI:prov:wasGeneratedBy,dcat:landingPage,foaf:pagedcat:Catalog: IRIorLiteral:dct:rightsdcat:Catalog: IRI:foaf:homepagedcat:DataService: IRIorLiteral:dct:accessRightsdcat:Distribution: IRIorLiteral:dct:conformsTo,dct:rightsdcat:Distribution: IRI:foaf:page,odrl:hasPolicydcat:CatalogRecord: IRIorLiteral:dct:conformsTo
Diese Profile prüfen Eigenschaften, die auch im GovData-Dashboard zur Metadatenqualität angezeigt werden.
Feedback gerne als GitHub Issue oder per E-Mail an info@govdata.de.
Bisherige Inhalte wurden in die Datei README_v1X.md verschoben.
© CC BY 4.0 ']init[ AG für GovData'