Options
Automatisierte Typklassifikation von Normdaten mit BERT
Hebeis, Maximilian; Fruth, Leon; Gradl, Tobias; u. a. (2026): Automatisierte Typklassifikation von Normdaten mit BERT, in: Bamberg: Otto-Friedrich-Universität, S. 447–450.
Faculty/Chair:
Author:
Publisher Information:
Year of publication:
2026
Pages:
Source/Other editions:
Silke Schwandt, Gabriel Viehhauser, Tara Andrews, u. a. (Hrsg.), Book of Abstracts : DHd 2026, Zenodo, 2026, S. 447–450
Year of first publication:
2026
Language:
German
Remark:
DOI des zugehörigen Posters: https://doi.org/10.5281/zenodo.18999712
Abstract:
Normdaten sind zentral für die Interoperabilität geisteswissenschaftlicher Daten. Die an der Otto-Friedrich-Universität Bamberg entwickelte integrierte Suchplattform ADISS integriert verschiedene Normdatenquellen wie GND, Wikidata oder Geonames, jedoch bislang ohne einheitliche Typisierung. Dies erschwert eine gezielte Facettierung bei der Suche. Ziel des Projekts ist daher ein System zur automatisierten Typenzuordnung mittels maschinellen Lernens. Auf Basis von BERT soll ein Klassifikator trainiert werden, der Normdatensätze in ein reduziertes Zielschema überführt. Trainingsdaten entstehen durch Mapping zwischen GND- und Wikidata-Datensätzen. Neben Quelltypen werden Name und Beschreibung des jeweiligen Normdatensatzes als semantische Features genutzt. Erste Experimente mit einem auf einem multilingualen BERT-Modell als Encoder basierenden hierarchischen Klassifikator zeigen vielversprechende Ergebnisse. Künftig sollen die Datenbasis und Modellparameter optimiert werden, um eine robuste, domänenübergreifende Typisierung zur Verbesserung der Suchfunktionalität in ADISS zu ermöglichen.
Keywords: ; ; ; ; ; ; ;
Normdaten
Textklassifikation
Maschinelles Lernen
Forschungsdateninfrastrukturen
Metadaten
Entity Typing
BERT
Datenintegration
Type:
Conferenceobject
Activation date:
April 17, 2026
Permalink
https://fis.uni-bamberg.de/handle/uniba/114771