Workflows¶
Workflows im Österreichischen Bibliotheksverbund (OBV)¶
Retrodigitalisierung¶
Dieser Workflow ist in Domains vom Typ retro aktiv. Zum Beispiel in
der Domain ulbtirolihd.
Start: Upload von Zip-Paketen in Domainverzeichnis (
config.path.upload/dname)Entpacken in
config.path.import/dname(ReleaseZipUploadJob)Import der entpackten Verzeichnisse (
ImportJob)Verzeichnisnamen sind AC-Nummern
Payload: Images und optionalen Finereader-Output (aus EOD)
keine Inhaltsverzeichnisstruktur
URN-Erzeugung
Metadaten-Synchronisation mit Katalog über SRU-Schnittstelle
Bearbeitung im VLM
QS auf Imageeigenschaften (
QSJob, manuell, könnte inzwischen automatisiert an den Import gekoppelt werden)Strukturierung
Paginierung
Freigabe
Setzt metadata-state:
upgradePDF-Erzeugung (
PDFJob)
Scheduled Job:
OBVExport(MAB-Export für Kataloganreicherung)Exportiere Datensätze im metadata-state:
insertMAB-Daten
070a:VL-RETRO078o:RETRODIGITALISAT552b:URN655o:urn:nbn:at:at-`BIB:2-XXXVerlinkung in die VL655i: PDF-Link (bisher nicht ausgeliefert weilOBVExport17:00 vorPDFJob03:00)Setzt metadata-state:
delivered
Publikationsserver I: VL-Frontend-Upload¶
Dieser Workflow ist in Domains vom Typ pubserv aktiv. Zum Beispiel in
den Domains obvugroa und ulbtiroloa.
Start: Upload von PDFs (und zusätzlichen Dateien) und Eingabe von bibliografischen Daten über Frontent (
Modsforms)Absenden (HTML-Form-Submit) der Daten triggert
ImportJob(qs-state:in-editing)User bestätigt final: qs-state:
upload doneE-mail-Bestätigung wird ausgelöst
Bearbeitung über Backend-Seite
/state/qs/confirmqs-state:
checkZugriffsbeschränkung oder Sperrfrist (Datum, mit Ziel-Zugriffsbeschränkung)
Qualitätssicherung: PDF, bibliografische Daten
Entscheidung URN: ja/nein (default: ja)
Abnahme
Setzt qs-state:
approved, release-state:releasedErzeugung: AC-Nummer aus Nummernkreis, URN (optional)
Setzt metadata-state:
insert
scheduled Job:
OBVExport(MAB-Export für Kataloganreicherung)Exportiere Datensätze im metadata-state:
insertWenn Freigabe entzogen: metadata-state:
skipped, sonst:MAB-Export über OAI/mabxml-1
070a:VL-NEW078o:HS-DISS,OA-MONOGRAPH, …,001-: AC-Nummer078e:UBL-INTERN(wenn Zugriffsbeschränkung bzw. Sperrfrist Ziel-Zugriffsbeschränkung)081q$c: Wenn Sperrfrist, EntsperrmonatYYYY-MM552b:urn:nbn:at:at-BIB:3-(nicht wenn Sperrfrist)655o: Verlinkung viaurn:nbn:at:at-BIB:3-655i: PDF-Link (nicht wenn Sperrfrist)750i,753i,756i: Abstracts (multi-lang) (nicht wenn Sperrfrist)Setzt metadata-state:
delivered
Dokument in Katalog aktualisiert
Upload von Job-Control Datei in Domainverzeichnis (
config.path.upload/dname) durch OBVSGscheduled Job:
OBVUpdateMapping Input-AC-Nummern auf VLIDs
Katalogsynchronisation auf alle bekannten VLIDs (Job:
UpdateMetadataJob,ImportJob)
Dokument war gesperrt, Sperrfrist läuft aus (Job:
CheckRestrictionDate)Setzt metatada-state:
modrestrictMAB-Export für Kataloganreicherung (Job:
OBVExport)Exportiere Datensätze im metadata-state:
modrestrict070a:VL-UPDATE078o: je nach Workflow078e:UBL-INTERNwenn Zugriffsbeschränkung081q$c: nicht vorhanden bei Entsperrung552b: URN655o: Verlinkung in die VL via URN655i: PDF-Link750i,753i,756i: Abstracts (multi-lang)Setzt metadata-state:
delivered
Publikationsserver II: Quelle Katalog/Opus (Workflow Graz)¶
Dieser Workflow ist in Domains vom Typ pubserv aktiv. Zum Beispiel in
obvugrhs und obvulihs.
Start: Unbekannte AC-Nummern aus Fremdsystem
Upload von Job-Control Datei in Domainverzeichnis (
config.path.upload/dname) durch OBVSGscheduled Job:
OBVUpdateMapping Input-AC-Nummern auf VLIDs
Lade Katalogdaten von allen unbekannten VLIDs (Job:
OBVAutoImport,ImportJob)Auswertung
070a, Mapping auf Domain via:{'VL-WG-UBG': 'obvugrhs', 'VL-WG-UBL': 'obvulihs'}
bisher hardcoded - ableitbar aus Bib-Sigel?
Auswertung:
mab078efür Zugriffsbeschränkung undmab081q$cfür SperrdatumMapping
078o(HS-DISS,OA-MONOGRAPH, etc.) zu VL-Doctype (oaDoctoralThesis,oaBook, etc.)Verlinke PDF Resource
655emitUF:3 = 'Volltext'Lade PDF nicht im
ImportJobSetzt resource-state:
missing
scheduled Job:
LoadRemoteDataDownload PDF from OPUS
Wenn Download erfolgreich: lösche resource-state
Datensätze in resource-state
missingwerden im VLM gelistet
scheduled Job:
OBVReleaseWenn resource-state !=
missingund release-stateunreleasedFreigabe: Setzt release-state:
releasedURN-Erzeugung
Setzt metadata-state:
upgrade
scheduled Job:
OBVExport(MAB-Export für Kataloganreicherung)Exportiere Datensätze im metadata-state:
upgradeWenn release-state
unreleased, setzt metadata-state:skipped, sonst:MAB-Export über OAI/mabxml-1
070a:VL-WG-{BIBSIGLE}078o:HS-DISS,OA-MONOGRAPH, …,078e:UBL-INTERN(wenn Zugriffsbeschränkung bzw. Sperrfrist Ziel-Zugriffsbeschränkung)081q$c: Wenn Sperrfrist, EntsperrmonatYYYY-MM552b: urn:nbn:at:at-BIB:1- (nicht wenn Sperrfrist)655o: Verlinkung in die VL via URN655i: PDF-Link (nicht wenn Sperrfrist)750i,753i,756i: Abstracts (multi-lang) (nicht wenn Sperrfrist)Setzt metadata-state:
delivered
Wie Publikationsserver I
Dokument in Katalog aktualisiert (Job:
OBVUpdate)Dokument war gesperrt, Sperrfrist läuft aus (Job:
CheckRestrictionDate)
Publikationsserver III: Quelle Katalog, PDF-Upload¶
Dieser Workflow ist in Domains vom Typ pubserv aktiv. Zum Beispiel in
ulbtirolhs.
Start: Upload AC-Nummer und PDF via VLM
Entscheide Zugriffsbeschränkung
Entscheide Sperrfrist (automatisch 5 Jahre)
Setzt qs-state:
upload doneund release-state:unreleasedMetadaten-Synchronisation mit Katalog über SRU-Schnittstelle
Abnehmen
Setzt qs-state:
approved, release-state:releasedErzeugung: URN (optional)
Setzt metadata-state:
upgrade
scheduled Job:
OBVExport(MAB-Export für Kataloganreicherung)Exportiere Datensätze im metadata-state:
upgradeWenn release-state
unreleased, setzt metadata-state:skipped, sonst:MAB-Export über OAI/mabxml-1
070a:VL-RETRO078o:HS-DISS,OA-MONOGRAPH, …,078e:UBL-INTERN(wenn Zugriffsbeschränkung bzw. Sperrfrist Ziel-Zugriffsbeschränkung)081q$c: Wenn Sperrfrist, EntsperrmonatYYYY-MM552b: urn:nbn:at:at-BIB:3- (nicht wenn Sperrfrist)655o: Verlinkung in die VL via URN655i: PDF-Link (nicht wenn Sperrfrist)750i,753i,756i: Abstracts (multi-lang) (nicht wenn Sperrfrist)Setzt metadata-state:
delivered
Wie Publikationsserver I
Dokument in Katalog aktualisiert (Job:
OBVUpdate)Dokument war gesperrt, Sperrfrist läuft aus (Job:
CheckRestrictionDate)
Publikationsserver: Entsperrung¶
scheduled Job:
CheckRestrictionDate(Periodische Prüfung erkennt abgelaufenes Sperrdatum) oder081q$cwird bei einer Katalogsynchronisation nicht geliefertSetzt ar-state von
restrictedauf Ziel-ZugriffsbeschränkungsstufeSetzt metadata-state:
modrestrict
scheduled Job:
OBVExport(MAB-Export über OAI/mabxml-1 für Kataloganreicherung)Verarbeite Datensätze in metadata-state:
modrestrict070a:VL-UPDATE078o: je nach Workflow078e:UBL-INTERNwenn Zugriffsbeschränkung081q$c: nicht vorhanden bei Entsperrung552b: URN655o: Verlinkung in die VL via URN655i: PDF-Link750i,753i,756i: Abstracts (multi-lang)metatada:modrestrict → metadata:delivered
FoDok¶
In der Forschungsdokumentation (FoDok) werden die Arbeitsergebnisse von WissenschaftlerInnen in einer Datenbank erfasst und der Öffentlichkeit bereitgestellt. Die Inhalte dieser Datenbank werden über eine definierte Schnittstelle in den VL-Publikationsserver eingespielt.
OAI-Harvesting¶
Als Schnittstelle zu Forschungsdatenbanken wird eine
OAI-Schnittstelle auf Seiten des
Anbieters vorausgesetzt. Die OAI-Schnittstelle liefert im
metadataPrefix
mods das bibliografische Format
MODS. VLS harvestet die
Schnittstelle periodisch über das verb
ListIdentifiers
und verb=GetRecord oder über verb=ListRecords und reagiert auf neue
Datensätze workflowspezifisch. Initial traversiert VLS die gesamte Liste
von angebotenen Datensätzen (ListIdentifiers / ListRecords). Um die
Listengröße zu kontrollieren empfiehlt sich die Verwendung von
resumptionTokens.
Im Produktionsbetrieb selektiert der VLS-Harvester die Datensätze der
letzten N Tage durch den Einsatz von from-until-Parametern. Diese
enthalten Timestamps in ISO8601
(Zeitzone: UTC). Die Selektion von Datensätzen über OAI
Sets
ist, falls notwendig, ebenfalls möglich.
Ein
Beispiel
für eine OAI-Lieferung im MODS-Format ohne weitere Selektion über from
oder until. Ein weiteres
Beispiel
unter Nutzung von from oder until.
Als Authentifizierungsmethode kann der VLS-Harvester HTTP-Basic-Auth auf der angebotenen Schnittstelle verwenden. Der Transport von Auth-Tokens über HTTPS/POST-Parameter wird ebenfalls unterstützt.
Für den Transport von Daten, für die das MODS-Format nativ keinen Support anbietet, ist folgende MODS-Extension Syntax vorgesehen:
<mods:extension>
<vl:identifier type="local">6</vl:identifier>
<vl:deferredPublicationDate>2015-07-15</vl:deferredPublicationDate>
<vl:doctype>oaBook</vl:doctype>
<vl:cataloging>true</vl:cataloging>
<vl:resource type="pdf">http://link/to/file</vl:resource>
<mods:extension>
vl:identifierLokaler Identifier für den Datensatz im Repository der Forschungsdatenbank (optional).
vl:deferredPublicationDateSperrfrist für den Datensatz (optional).
vl:doctypeDokumenttyp:
oaBook,oaArticle,oaBookPartoderoaBdArticle(verpflichtend).vl:catalogingSteuerung der Übertragung des Datensatzes in den OBV-Verbundkatalog: default
true(optional).vl:resourceUrl zur einer Fileresource eines bestimmten Typs:
pdf,epub,zip(verpflichtend).
OAI-Dataproviding¶
Für die Kommunikation von VL zur Forschungsdatenbank stellt VL als Dataprovider die Titel aus FoDok separiert nach Sets bereit: Im Set „rejected“ werden alle Titel gelistet, die in VL abgeleht wurden. Im Set „approved“ werden alle Titel gelistet, die in VL angenommen wurden. Dieses Set enthält die URN, die so nach FODOK zurückgespielt wird. Zum Authentifizierungsverfahren siehe Abschnitt „apis“.
Ablauf¶
Dieser Workflow ist in Domains vom Typ fodok aktiv. Zum Beispiel in
obvugrfodok.
Start: scheduled Job:
OaiImportJob(OAI-Harvesting, externe Datenquelle)Authentifizierung (optional)
Datensätze aus MODS anlegen
Auswertung MODS-Extension
Setze qs-state:
upload donescheduled Job:
LoadRemoteDataJob(Lade PDFs, ..)
Bearbeitung über Backend-Seite
/state/qs/confirmZugriffsbeschränkung oder Sperrfrist (Datum, mit Ziel-Zugriffsbeschränkung)
Qualitätssicherung: PDF, bibliografische Daten
Abnahme
Setzt qs-state:
approved, release-state:releasedErzeugung: AC-Nummer aus Nummernkreis und URN
Setzt metadata-state:
insert
alternativ setze qs-state:
rejected
scheduled Job:
OBVExport(MAB-Export für Kataloganreicherung)Verarbeitet Datensätze in metadata-state:
insertwie Publikationsserver I
Wie Publikationsserver I
Dokument in Katalog aktualisiert (Job:
OBVUpdate)Dokument war gesperrt, Sperrfrist läuft aus (Job:
CheckRestrictionDate)
Rückkanal zum externen System (Oai-Provider)
Authentifizierung notwendig
Auslieferung URN aller Datensätz in qs-state:
approved/oai/qs?verb=ListRecords&metadataPrefix=mods&set=approved
Feedback über Datensätz in qs-state:
rejected/oai/qs?verb=ListRecords&metadataPrefix=mods&set=rejected
Dokumenttypen¶
Folgende Dokumenttypen werden in diesem Domaintype unterstützt:
Monographie¶
Aufsatz in einer Zeitschrift¶
Aufsatz in einem Sammelwerk¶
Elektronisches Dokument¶
Domain-spezifische Jobs¶
Im Kontext der obvsg Domain werden vier neue Jobs definiert (siehe
obv/etc/vls/server.ini und domain/obvsg/jobs/export.py). Der
OBVRelease Job ist für die automatische Freigabe von Datensätzen im
Workflow Publikationsserver II zuständig.
Der OBVAutoImport Job ist für das Importieren von Datensätzen im
Publikationsserver II Workflow zuständig.
Der OBVUpdate Job verarbeitet Job-Control-Dateien mit AC-Nummern. Wenn
ein AC-Nummern-Match in der DB gefunden wird, dann wird der
UpdateMetadataJob gestartet, wenn die AC-Nummer nicht gefunden wird,
dann wird der OBVAutoImport Job gestartet.
Der OBVExport Job ist für das Exportieren von Datensätzen über
OAI/mabxml-1 zuständig. Die exportierten XML-Daten werden auf das
Filesystem geschrieben.
E-Pflicht HBZ¶
Dokument¶
Dieser Workflow ist in Domains vom Typ epflicht aktiv. Aktiv in den
Domains ulbdpc, ulbmspc und ulbbnpc. (metadata-state-block: hspc)
Start 1: Upload von PDFs, EPUPs und ZIPs über VLM
Auswahl einer Lizenz
URN Erzeugung
metadata-state:
incomplete
Start 2: Upload von PDFs (und zusätzlichen Dateien) und Eingabe von bibliografischen Daten über Frontent (
Modsforms)Absenden (HTML-Form-Submit) der Daten triggert
ImportJobURN Erzeugung
metadata-state:
incompleteE-mail-Benachrichtigung an die Bibliothek wird ausgelöst
Bearbeitung im VLM
QS auf PDF (und andere Formate)
URN aus VLM in der (neuen) Katalog-Titelaufnahme ergänzen
Abschließen:
Setzt metadata-state:
availableKatalogsynchronisation auf Datensatz via URN (
UpdateMetadataJob)wenn erfolgreich: Setzt metadata-state:
complete, release-state:releasedwenn nicht, bleibt: metadata-state:
incomplete
scheduled Job:
UpdateMetadataJob(Katalogsynchronisation fürincomplete)synchronisiere Datensätze im metadata-state:
incompletewenn erfolgreich: Setzt metadata-state:
complete, release-state:released
Zeitschriften
Hefte, Jahrgänge, Aufsätze, Beilagen: kein URN, kein metadata-state
Hefte, Jahrgänge, Aufsätze, Beilagen: automatische Freigabe, falls Überordnung freigegeben
Mehrbändige Werke
Anlegen der Überordnung:
URN-Erzeugung
URN in Titelaufnahme ergänzen
Abschließen
Anlegen der Bände: Upload der PDFs (und andere Formate)
URN-Erzeugung
URN in Titelaufnahme ergänzen
Abschließen
Automatische hierarchische Verknüpfung der Datensätze über HT-Nummer
DNB - Harvester
URN-Registrierung über epicur
Verlag/Vertrieb¶
Start: Registrierung eines Accounts
Eingabe von Anmeldename, E-mail-Adresse und Passwort über Frontend
Bestätigungsmail (validate token) wird ausgelöst
Status Account:
unvollständignach E-Mail-Validation Status Account:
ungeprüft
Eingabe von Stammdaten
Auswahl, in welcher Rolle der Ablieferer agiert (Verlag/Vertrieb)
Eingabe der Stammdaten über Frontend (??forms)
new user notification Mail wird ausgelöst
Status Account:
bestätigtVertriebsfall: todo
Passwort Reset¶
Verfügbar über den Link ‚Passwort ändern‘ - http://vls.example.com/resetpw - in der Registrierungsinfo eingeloggter Verlage / Vertriebe. Verfahren über E-Mail-Verifikation.