Zum Inhalt

Harvesting-Quellen

Um einen Datenkatalog harvesten zu können, muss zunächst die entsprechende Harvesting-Quelle hinzugefügt werden. Eine Organisation kann eine oder mehrere Harvesting-Quellen mit separaten Harvesting-Webadressen haben.

Harvesting-Quelle hinzufügen

Um eine neue Harvesting-Quelle hinzuzufügen, klicken Sie auf die Schaltfläche "Erstellen".

Schaltfläche "Erstellen"

Sie müssen den Namen der Organisation, eine kurze Beschreibung und die Webadresse der Harvesting-Quelle eingeben.

Dialog zum Erstellen einer Quelle

Wenn Sie fertig sind, wird die Harvesting-Quelle in Registry gespeichert und automatisch geharvestet. Es kann etwas dauern, bis die Webadresse überprüft und ihre Daten geharvestet wurden. Automatisches Harvesting wird einmal pro Nacht durchgeführt.

Aufgelistete Quellen

Harvesting-Status überprüfen

Wenn Sie auf die Quelle klicken, können Sie den Status der letzten Harvesting-Versuche sehen. Sie können auch auf die Schaltfläche "Neu harvesten" klicken, um manuell einen Harvesting-Versuch auszulösen, der in der Regel nur wenige Minuten dauert.

Harvesting-Status für eine Quelle

Wenn Sie auf die Harvesting-Zeile klicken, erhalten Sie weitere Details zu diesem bestimmten Harvesting-Versuch.

Detaillierter Harvesting-Status

Harvesting-Quelle bearbeiten

Wenn Sie die Informationen zu einer Harvesting-Quelle, wie Name, Beschreibung oder Webadresse, anzeigen oder bearbeiten möchten, klicken Sie im linken Menü auf "Informationen". Anschließend können Sie auf die Schaltfläche "Bearbeiten" klicken, um Änderungen vorzunehmen.

Harvesting-Quelle bearbeiten

Es öffnet sich ein Bearbeitungsdialog, in dem Sie den Namen, die Beschreibung und die URL der Harvesting-Quelle ändern können.

Bearbeitungsdialog

Validierung

Wenn Sie auf "Validierung" klicken, können Sie sehen, ob es Probleme mit den Metadaten gibt. Sie sehen dann eine Zusammenfassung der Validierungsergebnisse pro Objekttyp/Klasse.

Quellen, Validierung

Wenn Sie auf eine Zeile für einen Objekttyp klicken, werden Fehler (rot) und Warnungen (gelb) für die verschiedenen Instanzen aufgelistet. Sie können auch alle Metadatenfelder anzeigen, indem Sie auf die Schaltfläche "Validierungsbericht" klicken.

Quellen, Validierung, angeklickte Zeile

Die Felder werden dann in derselben Reihenfolge angezeigt, wie sie in EntryScape Catalog erscheinen, mit Warnsymbolen und Fehlern, die unter jedem Feld beschrieben sind.

Quellen, Validierung, Validierungsbericht

Statistik

Sie können Statistiken zu den Metadaten einer Organisation anzeigen, indem Sie im linken Menü auf "Statistik" klicken.

Statistik

Linkprüfung

Unter "Linkprüfungsbericht" können Sie sehen, wie viele Links funktionieren und wie viele defekt sind im Datenkatalog der Harvesting-Quelle.

Linkprüfungsbericht

Derzeit ist der Linkprüfungsbericht für DCAT-AP-Metadaten konfiguriert. Die für jeden Typ überprüften Felder sind wie folgt:

  • dcat:Distribution
    • dcterms:conformsTo
    • dcat:accessURL
    • dcat:downloadURL
  • dcat:Dataset
    • dcat:landingPage
    • dcterms:conformsTo
    • foaf:page
    • owl:versionInfo
  • dcat:DataService
    • dcat:endpointDescription
    • dcat:landingPage
    • foaf:page

Ein erster Versuch, den Link zu erreichen, wird über die HEAD-Methode unternommen. Wenn der Aufruf mit dem Status 400 oder höher beantwortet wird, wird stattdessen die GET-Methode verwendet. Für den Aufruf wird ein Timeout verwendet, derzeit 5000 ms. Um Domains mit vielen Links im Datenkatalog nicht zu überlasten, wird zwischen jedem Aufruf eines Links innerhalb derselben Domain eine Pause von mindestens 1000 ms eingelegt. Sobald der Aufruf erfolgt ist, wird der Status des Links an den Bericht gemeldet.

Benachrichtigungen

Informationen zu Benachrichtigungen finden Sie hier.