Zum Inhalt

Harvesting-Bericht

Übersicht

Der Harvesting-Bericht ist eine visuelle Zusammenfassung darüber, wie viele Organisationen offene Daten veröffentlichen und eine Webseite darüber bereitstellen.

Statistiken von dataportal.se, Wachstum der Datensätze

Statistiken von dataportal.se, Status für Organisationen des öffentlichen Sektors

Berichte

Unter "Berichte" können Sie auch Harvesting-Berichte für jede Quelle einsehen.

Organisationen mit Harvesting-Berichten

Wenn Sie auf eine Harvesting-Quelle klicken, werden Details zum Harvesting angezeigt. Es gibt fünf verschiedene Registerkarten: Status, Informationen, Validierung, Statistik und Linkprüfungsbericht. Jede Ansicht verfügt außerdem über einen direkten Link, über den Sie sie in einem separaten Browser-Tab öffnen können, wenn Sie den Link zur Ansicht mit anderen teilen möchten.

Bericht-Registerkarten mit direkten Links

Status

Unter der Registerkarte "Status" finden Sie den täglichen Harvesting-Status der letzten 30 Tage sowie eine Liste der letzten Harvesting-Versuche.

Berichte, Registerkarte "Status"

Sie können auf die Zeile eines Harvesting-Versuchs klicken, um weitere Informationen dazu zu erhalten.

Informationen zum Harvesting-Versuch

Wenn Sie angemeldet sind und Ihre eigenen Daten anzeigen, sehen Sie außerdem die Schaltfläche "Neu harvesten", auf die Sie klicken können, um ein sofortiges Harvesting durchzuführen.

Schaltfläche "Neu harvesten"

Sie sehen auch einen Link zu einem Validierungsbericht für Ihren Katalog.

Validierungsbericht anzeigen

Informationen

Unter der Registerkarte "Informationen" finden Sie allgemeine Informationen zur Organisation.

Berichte, Registerkarte "Informationen"

Wenn Sie angemeldet sind und Ihre eigene Organisation überprüfen, können Sie die Informationen bearbeiten, indem Sie auf die Schaltfläche "Bearbeiten" klicken.

Schaltfläche "Bearbeiten"

Validierung

Wenn Sie auf die Registerkarte "Validierung" klicken, können Sie sehen, ob es Probleme mit den Metadaten gibt. Sie sehen dann eine Zusammenfassung der Validierungsergebnisse pro Objekttyp/Klasse.

Berichte, Registerkarte "Validierung"

Wenn Sie auf eine Zeile für einen Objekttyp klicken, werden Fehler (rot) und Warnungen (gelb) für die verschiedenen Instanzen aufgelistet. Sie können auch alle Metadatenfelder anzeigen, indem Sie auf die Schaltfläche "Validierungsbericht" klicken.

Berichte, Registerkarte "Validierung", angeklickte Zeile

Die Felder werden dann in derselben Reihenfolge angezeigt, wie sie in EntryScape Catalog erscheinen, mit Warnsymbolen und Fehlern, die unter jedem Feld beschrieben sind.

Berichte, Registerkarte "Validierung", Validierungsbericht

Statistik

Unter der Registerkarte "Statistik" können Sie sehen, wie viele Objekte verschiedener Art geharvestet wurden und wie viele ihrer Pflichtfelder oder empfohlenen Eingabefelder ausgefüllt sind.

Berichte, Registerkarte "Statistik"

Linkprüfungsbericht

Die letzte Registerkarte, "Linkprüfungsbericht", zeigt an, wie viele funktionierende oder defekte Links in den Metadaten gefunden wurden.

Berichte, Registerkarte "Linkprüfungsbericht"

Derzeit ist der Linkprüfungsbericht für DCAT-AP-Metadaten konfiguriert. Die für jeden Typ überprüften Felder sind wie folgt:

  • dcat:Distribution
    • dcterms:conformsTo
    • dcat:accessURL
    • dcat:downloadURL
  • dcat:Dataset
    • dcat:landingPage
    • dcterms:conformsTo
    • foaf:page
    • owl:versionInfo
  • dcat:DataService
    • dcat:endpointDescription
    • dcat:landingPage
    • foaf:page

Ein erster Versuch, den Link zu erreichen, wird über die HEAD-Methode unternommen. Wenn der Aufruf mit dem Status 400 oder höher beantwortet wird, wird stattdessen die GET-Methode verwendet. Für den Aufruf wird ein Timeout verwendet, derzeit 5000 ms. Um Domains mit vielen Links im Datenkatalog nicht zu überlasten, wird zwischen jedem Aufruf eines Links innerhalb derselben Domain eine Pause von mindestens 1000 ms eingelegt. Sobald der Aufruf erfolgt ist, wird der Status des Links an den Bericht gemeldet.