Harvesting-Quellen¶
Um einen Datenkatalog harvesten zu können, muss zunächst die entsprechende Harvesting-Quelle hinzugefügt werden. Eine Organisation kann eine oder mehrere Harvesting-Quellen mit separaten Harvesting-Webadressen haben.
Harvesting-Quelle hinzufügen¶
Um eine neue Harvesting-Quelle hinzuzufügen, klicken Sie auf die Schaltfläche "Erstellen".
Sie müssen den Namen der Organisation, eine kurze Beschreibung und die Webadresse der Harvesting-Quelle eingeben.
Wenn Sie fertig sind, wird die Harvesting-Quelle in Registry gespeichert und automatisch geharvestet. Es kann etwas dauern, bis die Webadresse überprüft und ihre Daten geharvestet wurden. Automatisches Harvesting wird einmal pro Nacht durchgeführt.
Harvesting-Status überprüfen¶
Wenn Sie auf die Quelle klicken, können Sie den Status der letzten Harvesting-Versuche sehen. Sie können auch auf die Schaltfläche "Neu harvesten" klicken, um manuell einen Harvesting-Versuch auszulösen, der in der Regel nur wenige Minuten dauert.
Wenn Sie auf die Harvesting-Zeile klicken, erhalten Sie weitere Details zu diesem bestimmten Harvesting-Versuch.
Harvesting-Quelle bearbeiten¶
Wenn Sie die Informationen zu einer Harvesting-Quelle, wie Name, Beschreibung oder Webadresse, anzeigen oder bearbeiten möchten, klicken Sie im linken Menü auf "Informationen". Anschließend können Sie auf die Schaltfläche "Bearbeiten" klicken, um Änderungen vorzunehmen.
Es öffnet sich ein Bearbeitungsdialog, in dem Sie den Namen, die Beschreibung und die URL der Harvesting-Quelle ändern können.
Validierung¶
Wenn Sie auf "Validierung" klicken, können Sie sehen, ob es Probleme mit den Metadaten gibt. Sie sehen dann eine Zusammenfassung der Validierungsergebnisse pro Objekttyp/Klasse.
Wenn Sie auf eine Zeile für einen Objekttyp klicken, werden Fehler (rot) und Warnungen (gelb) für die verschiedenen Instanzen aufgelistet. Sie können auch alle Metadatenfelder anzeigen, indem Sie auf die Schaltfläche "Validierungsbericht" klicken.
Die Felder werden dann in derselben Reihenfolge angezeigt, wie sie in EntryScape Catalog erscheinen, mit Warnsymbolen und Fehlern, die unter jedem Feld beschrieben sind.
Statistik¶
Sie können Statistiken zu den Metadaten einer Organisation anzeigen, indem Sie im linken Menü auf "Statistik" klicken.
Linkprüfung¶
Unter "Linkprüfungsbericht" können Sie sehen, wie viele Links funktionieren und wie viele defekt sind im Datenkatalog der Harvesting-Quelle.
Derzeit ist der Linkprüfungsbericht für DCAT-AP-Metadaten konfiguriert. Die für jeden Typ überprüften Felder sind wie folgt:
- dcat:Distribution
- dcterms:conformsTo
- dcat:accessURL
- dcat:downloadURL
- dcat:Dataset
- dcat:landingPage
- dcterms:conformsTo
- foaf:page
- owl:versionInfo
- dcat:DataService
- dcat:endpointDescription
- dcat:landingPage
- foaf:page
Ein erster Versuch, den Link zu erreichen, wird über die HEAD-Methode unternommen. Wenn der Aufruf mit dem Status 400 oder höher beantwortet wird, wird stattdessen die GET-Methode verwendet. Für den Aufruf wird ein Timeout verwendet, derzeit 5000 ms. Um Domains mit vielen Links im Datenkatalog nicht zu überlasten, wird zwischen jedem Aufruf eines Links innerhalb derselben Domain eine Pause von mindestens 1000 ms eingelegt. Sobald der Aufruf erfolgt ist, wird der Status des Links an den Bericht gemeldet.
Benachrichtigungen¶
Informationen zu Benachrichtigungen finden Sie hier.











