Hebeis, MaximilianMaximilianHebeis0009-0008-2531-3616Fruth, LeonLeonFruth0009-0001-2128-3025Gradl, TobiasTobiasGradl0000-0002-1392-2464Henrich, AndreasAndreasHenrich0000-0002-5074-32542026-04-172026-04-172026https://fis.uni-bamberg.de/handle/uniba/114773Zugehöriges Poster siehe: https://fis.uni-bamberg.de/handle/uniba/114772Normdaten sind zentral für die Interoperabilität geisteswissenschaftlicher Daten. Die an der Otto-Friedrich-Universität Bamberg entwickelte integrierte Suchplattform ADISS integriert verschiedene Normdatenquellen wie GND, Wikidata oder Geonames, jedoch bislang ohne einheitliche Typisierung. Dies erschwert eine gezielte Facettierung bei der Suche. Ziel des Projekts ist daher ein System zur automatisierten Typenzuordnung mittels maschinellen Lernens. Auf Basis von BERT soll ein Klassifikator trainiert werden, der Normdatensätze in ein reduziertes Zielschema überführt. Trainingsdaten entstehen durch Mapping zwischen GND- und Wikidata-Datensätzen. Neben Quelltypen werden Name und Beschreibung des jeweiligen Normdatensatzes als semantische Features genutzt. Erste Experimente mit einem auf einem multilingualen BERT-Modell als Encoder basierenden hierarchischen Klassifikator zeigen vielversprechende Ergebnisse. Künftig sollen die Datenbasis und Modellparameter optimiert werden, um eine robuste, domänenübergreifende Typisierung zur Verbesserung der Suchfunktionalität in ADISS zu ermöglichen.deuNormdatenTextklassifikationMaschinelles LernenForschungsdateninfrastrukturenMetadatenEntity TypingBERTDatenintegrationAutomatisierte Typklassifikation von Normdaten mit BERTAutomatic Type Classification of Authority Records with BERTconferenceobject10.5281/zenodo.18703020