Options
Automatisierte Typklassifikation von Normdaten mit BERT
Hebeis, Maximilian; Fruth, Leon; Gradl, Tobias; u. a. (2026): Automatisierte Typklassifikation von Normdaten mit BERT, in: Silke Schwandt, Gabriel Viehhauser, Tara Andrews, u. a. (Hrsg.), Book of Abstracts : DHd 2026, Zenodo, S. 447–450, doi: 10.5281/zenodo.18703020.
Faculty/Chair:
Author:
Alternative Title:
Automatic Type Classification of Authority Records with BERT
Title of the compilation:
Book of Abstracts : DHd 2026
Editors:
Conference:
DHd 2026: Nicht nur Text, nicht nur Daten; 12. Jahrestagung des Verbands Digital Humanities im deutschsprachigen Raum e.V.; 23. bis 27. Februar 2026 ; Wien
Publisher Information:
Year of publication:
2026
Pages:
Language:
German
Remark:
Zugehöriges Poster siehe: https://fis.uni-bamberg.de/handle/uniba/114772
Abstract:
Normdaten sind zentral für die Interoperabilität geisteswissenschaftlicher Daten. Die an der Otto-Friedrich-Universität Bamberg entwickelte integrierte Suchplattform ADISS integriert verschiedene Normdatenquellen wie GND, Wikidata oder Geonames, jedoch bislang ohne einheitliche Typisierung. Dies erschwert eine gezielte Facettierung bei der Suche. Ziel des Projekts ist daher ein System zur automatisierten Typenzuordnung mittels maschinellen Lernens. Auf Basis von BERT soll ein Klassifikator trainiert werden, der Normdatensätze in ein reduziertes Zielschema überführt. Trainingsdaten entstehen durch Mapping zwischen GND- und Wikidata-Datensätzen. Neben Quelltypen werden Name und Beschreibung des jeweiligen Normdatensatzes als semantische Features genutzt. Erste Experimente mit einem auf einem multilingualen BERT-Modell als Encoder basierenden hierarchischen Klassifikator zeigen vielversprechende Ergebnisse. Künftig sollen die Datenbasis und Modellparameter optimiert werden, um eine robuste, domänenübergreifende Typisierung zur Verbesserung der Suchfunktionalität in ADISS zu ermöglichen.
Keywords: ;  ;  ;  ;  ;  ;  ; 
Normdaten
Textklassifikation
Maschinelles Lernen
Forschungsdateninfrastrukturen
Metadaten
Entity Typing
BERT
Datenintegration
Type:
Conferenceobject
Activation date:
April 17, 2026
Versioning
Question on publication
Permalink
https://fis.uni-bamberg.de/handle/uniba/114773