BayDat - Die bayerische Dialektdatenbank

Die Basis der BayDat — Die Würzburger BayDat — Die neue BayDat — Aktuelles — Kurzanleitung

BayDat erfasst, speichert und verknüpft die in direkter Befragung erhobenen Mundarten in Bayern in einer elektronischen Datenbank. Sie archiviert das vorhandene Material zukunftssicher, bereitet es nach modernen Kriterien auf, stellt es für Onlinerecherchen zur Verfügung und bietet auf diese Weise allen Interessierten einen strukturierten Zugriff.

Die Basis: Der Bayerische Sprachatlas (BSA)

1984 begannen Sprachwissenschaftler an der Universität Augsburg mit der Erhebung von Dialektdaten für das groß angelegte Forschungs- und Dokumentationsprojekt Sprachatlas von Bayerisch-Schwaben (SBS). 1986 folgte die Universität Bayreuth mit den Vorbereitungen für den Sprachatlas von Nordostbayern (SNOB) . Unter Einbeziehung von Kollegen aus weiteren bayerischen Universitäten entstanden in den folgenden Jahren die vier Partnerprojekte Sprachatlas von Mittelfranken (SMF) an der Universität Erlangen, Sprachatlas von Unterfranken (SUF) an der Universität Würzburg, Sprachatlas von Niederbayern (SNIB) und Sprachatlas von Oberbayern (SOB), beide an der Universität Passau. Alle sechs Sprachatlasprojekte bildeten gemeinsam den Forschungsverbund Bayerischer Sprachatlas (BSA) , der von der Deutschen Forschungsgemeinschaft und dem Bayerischen Staatsministerium für Wissenschaft, Forschung und Kunst finanziert wurde.
Die sechs Teilprojekte des BSA haben ihre Daten an insgesamt 1613 Orten erhoben und in phonetischer Transkription, der sogenannten Teuthonista-Lautschrift, aufgezeichnet. Für die Auswahl der Orte wurde ein Gitternetz auf die Karte des jeweiligen Regierungsbezirks projiziert und aus jedem so entstandenen Planquadrat mit einer Seitenlänge von sieben Kilometern je ein Erhebungsort ausgewählt. In direkter Befragung haben geschulte Exploratoren die Daten bei am Erhebungsort ansässigen Dialektsprechern erhoben, die zum Zeitpunkt der Erhebung 60 Jahre oder älter waren. Die Grundlage dafür war ein Fragebuch mit ca. 2500 Einzelfragen, das für alle Teilprojekte gleich war und nur in regionalspezifischen Besonderheiten Abweichungen vom allgemeinen Bestand (ca. 5%) enthielt. Gegenstand der Fragen waren vorrangig der Laut- und Formenbestand sowie ausgewählte Teile des Dialektwortschatzes. Der inhaltliche Schwerpunkt der Fragen lag auf der bäuerlichen und handwerklichen Lebens- und Arbeitswelt, weil die entsprechenden Tätigkeiten und Gegenstände besonders stark in Vergessenheit zu geraten drohen. So wurden bspw. Fragen zum Vorgang des Brotbackens, der Butterherstellung oder der Flachsbearbeitung gestellt, aber auch Fragen zur Heuernte, zur Viehhaltung und zum Ackerbau. Aus diesen Erhebungen für den BSA liegen ungefähr vier Millionen Antworten vor. Alle Dialekterhebungen wurden mit gleichem Standard und in enger Koordination durchgeführt. Dieses Vorgehen garantiert, dass die Ergebnisse miteinander vergleichbar sind.

Der Weg zu BayDat

Um diese Menge an erhobenen Dialektdaten für die Erstellung der verschiedenen Sprachatlanten sinnvoll weiterverarbeiten zu können, entschied man sich bereits früh, die Materialien elektronisch zu erfassen. Dazu wurden sie mit einer speziellen Kodierung versehen und in eine Datenbank eingegeben. Die erhobenen Sprachdaten wurden zunächst projektintern, also dezentral, in elektronischen Datenbanken und/oder Akten-Ordnern verwaltet.
Trotz der sehr umfangreichen Publikationen – je nach Teilprojekt zwischen meist sechs und 13 Atlasbänden – konnte im Rahmen der Sprachatlanten nur ein Teil der Erhebungsdaten ausgewertet werden, schätzungsweise etwa 40% des gesamten erhobenen Materials. Es handelt sich dabei um die wissenschaftliche Aufbereitung und grafische Darstellung ausgewählter Phänomene in Kartenform zu den Bereichen Vokalismus, Konsonantismus, Morphologie, Syntax und Lexik. Verschiedene Kriterien, wie die Aussagekraft des Kartenbildes, aber auch die Bedeutung der dargestellten Thematik für das Untersuchungsgebiet, lieferten hierbei den Entscheidungsmaßstab für die Veröffentlichung eines dialektalen Phänomens auf einer Sprachkarte. Weiterhin spielte die Frage, ob das entsprechende Kartenthema von benachbarten Kleinraumatlanten der oberdeutschen Mundarten bearbeitet worden war und somit zur Ergänzung der dort getroffenen Aussagen beitragen kann, eine Rolle bei der Auswahl.
Das Material, das für eine Veröffentlichung in Buchform ausgewählt wurde, stellt also nur einen Bruchteil des Gesamtmaterials dar. Um aber alle Daten für weitere Recherchen und Forschungsarbeiten verfügbar zu machen und sie zukunftssicher zu speichern, entstand das von der Deutschen Forschungsgemeinschaft und dem Bayerischen Staatsministerium für Wissenschaft, Forschung und Kunst finanziell geförderte Projekt BayDat. Es nahm im Juli 2000 am Lehrstuhl für deutsche Sprachwissenschaft des Instituts für deutsche Philologie der Universität Würzburg seine Arbeit auf. Seit 2003 zählt BayDat zu den Hauptangeboten des Unterfränkischen Dialektinstituts (UDI), das maßgeblich von der Unterfränkischen Kulturstiftung des Bezirks Unterfranken finanziell unterstützt wird. Als Schnittstelle zwischen Wissenschaft und dialektinteressierter Öffentlichkeit und als Nachfolgeeinrichtung des Projekts Sprachatlas von Unterfranken führt UDI die Arbeit des SUF fort, indem es u.a. die erhobenen Dialektdaten weiter pflegt und für die Öffentlichkeit aufbereitet. BayDat kommt deshalb eine doppelte Funktion zu: Sie führt einerseits das gesamte, für den BSA erhobene Material in einer zentralen Datenbank zusammen, bereitet es unter sprachwissenschaftlichen Gesichtspunkten weiter auf, um es für zukünftige Forschungen effektiver nutzbar zu machen, und garantiert somit eine zukunftssichere Speicherung. Andererseits zielt BayDat aber auch darauf ab, die Erhebungsdaten einem möglichst breiten Nutzerkreis zugänglich zu machen, von Sprachwissenschaftlern über Kultur- und Heimatpfleger, Mundartdichter, Lehrer und Schüler, die sich im Unterricht mit dem Thema Dialekt befassen, bis hin zu dialektinteressierten Laien.

Die Würzburger BayDat

Über eine dynamische Datenbankabfrage konnte schließlich ab 2007 das vorhandene Material auf unterschiedliche Art und Weise öffentlich abgefragt werden. Die große Datenmenge von ca. vier bis fünf Millionen Datensätzen war in einer Oracle-Datenbank gespeichert, sodass Belege über gezielte Abfragen selektiert werden konnten. Der BayDat-Nutzer konnte sich bei seiner Suche — z.B. nach den Bezeichnungen für den 'zweiten Grasschnitt' oder der Realisierung des Stammvokals -a- im Belegwort Fass in Bayern — die entsprechenden Belege (= notierte Antworten auf die Erhebungsfrage) für seine persönlichen Recherchen ausgeben. Er stellte über eine Suchmaske seine Frage und bekam rasch das entsprechende PDF-Dokument in Form einer Belegliste bzw. eine HTML-Seite mit den Belegen (Ergebnisse) ausgeliefert. Sowohl die PDF-Belegliste als auch die HTML-Ergebnisliste enthielt alle Antworten zu einer Frage aus sämtlichen Ortschaften, in denen Befragungen durchgeführt wurden und die der Nutzer der Onlineoberfläche in seine Suchanfrage übernommen hatte. BayDat unterschied sich daher grundlegend von der Veröffentlichung der BSA-Atlasbände, da das Material in Listen geliefert wurde, die die einzelnen Belege der Befragungsorte zu einem bestimmten Phänomen enthielten. Eine systematische Auswertung der Daten konnte nicht geleistet werden und war auch zu keinem Zeitpunkt geplant. Diese Arbeit mussten vielmehr die Benutzer in ihrer vertiefenden Beschäftigung mit den Materialien selbst leisten. Selbstverständlich war es für alle Nutzer jederzeit möglich, sich bei Fragen, Fehlern und Problemen an die zuständigen UDI- und BayDat-MitarbeiterInnen zu wenden.
Über die reine Belegabfrage hinaus gab es für Forschende, Studierende, aber auch für interessierte Laien die Möglichkeit, sich Karten nach ihren eigenen Vorstellungen zu erstellen. Hierfür stellt das UDI nach wie vor auf seiner Homepage die sogenannten Grundkarten der jeweiligen BSA-Projekte zur Verfügung. Auf einer Grundkarte sind die wichtigsten Informationen für eine Sprachkarte eingezeichnet, also etwa all diejenigen Ortschaften, in denen Befragungen durchgeführt wurden, sowie die wichtigsten Städte und Flüsse zur Orientierung. In diese Grundkarten kann der Benutzer die Belege aus den Beleglisten, z.B. in Form von Signaturen, also grafischen Symbolen an den entsprechenden Ortspunkten einzeichnen.
Um die Lesbarkeit der in Teuthonista transkribierten Belege zu erleichtern und als Bearbeitungshilfe steht zudem auf der UDI-Homepage eine Kleine Lautschriftenkunde bereit; darin sind alle nötigen Informationen zur Teuthonista-Lautschrift aufgeführt.
Eine umfassende Dokumentation über den Aufbau und die Funktionalität der Würzburger BayDat bietet die Arbeit von Ralf Zimmermann, die als Band 1 der Reihe WespA. Würzburger elektronische sprachwissenschaftliche Arbeiten 2007 online veröffentlicht wurde.

Umzug zur BAdW

Wie oben erwähnt wurde BayDat in Oracle programmiert. Für eine kontinuierliche Software-Aktualisierung und Datenpflege fehlten sowohl die Mittel als auch das Personal. Das Rechenzentrum der Universität Würzburg hostete BayDat jedoch weiterhin im Rahmen der Möglichkeiten.
BayDat wurde nach wie vor sehr intensiv von verschiedenen wissenschaftlichen Projekten benutzt, u.a. auch von den drei Dialekt-Wörterbüchern (bayerisch, fränkisch, schwäbisch) der Bayerischen Akademie der Wissenschaften (BAdW). Darum war es außerordentlich wünschenswert, dass BayDat erhalten bleibt und systematisch gepflegt wird. Forschungsdatensicherung ist zudem die Voraussetzung dafür, dass dringend nötige Korrekturen, aber auch zukünftige Verbesserungen und Erweiterungen vorgenommen werden können.
Aus diesem Grund zog BayDat im Januar 2019 vom Rechenzentrum der Universität Würzburg an die Bayerische Akademie der Wissenschaften. Verantwortlich für den Umzug und die weitere Pflege ist das Referat für IT & Digital Humanities. Im Rahmen des Umzugs an die BAdW wurden umfangreiche Umstrukturierungen und Optimierungen der Datenbasis vorgenommen. Die Weboberfläche wurde vollständig neu entwickelt und präsentiert sich seither in neuem Gewand. Auch die zugrundeliegende Datenbank wurde neu konzipiert, allerdings unter Beibehaltung der ursprünglichen Struktur, die lediglich erweitert, optimiert und technisch modernisiert wurde.
Nach einigen Tests der Funktionalität ging die neue BayDat schließlich Ende Februar 2019 online. Weitere Verbesserungen werden nach und nach eingepflegt und auf dieser Seite vorgestellt und dokumentiert.

Alle Funktionen der ersten BayDat sind implementiert, obgleich Sie aufgrund der Umstrukturierung und Modernisierung an anderen Stellen zu finden sind. Diese Stellen sind jedoch klar benannt und somit leicht wiederfindbar. Für einige Beispielsuchanfragen und weitere Hilfen, besuchen Sie bitte die Hilfe.

Aktuelles:


Januar 2024:		Dank der Kolleginnen und Kollegen von REDE enthält der CSV-Export nun drei neue Felder, in denen die GID sowie die Geo-Koordinaten (Latitude, Longitude) zu den Ortssiglen enthalten sind. Insbesondere über erstere, die GID, können Sie einfacher Karten in SprachGIS erstellen. Angereichert wurden alle Ortssiglen bzw. Ortsnamen, die eindeutig zugeordnet werden konnten. Daher sind aktuell 75 Orte aus SNOB und SOB noch nicht mit einer GID versehen. Wir arbeiten daran, diese Lücken zu füllen, und reichern anschließend die fehlenden Geo-Koordinaten an. Falls Ihnen Fehler auffallen bzw. Zweifel daran bestehen, dass ein Ort mit der richtigen GID versehen ist, können Sie dies gern unter Angabe der betroffenen Ortssigle Herrn Manuel Raaf (manuel.raaf [at] badw.de) mitteilen.
Februar 2023:		Materialen zur BayDat finden Sie nun auf dieser Seite. Als ersten Beitrag können Sie dort die Datenbank zur Monografie von Grit Nickel zur eigenständigen Nachnutzung herunterladen.
September 2020:		Erweiterung des CSV-Exports um Ortsdaten und Fragenummern der einzelnen Sprachatlanten.
Juli 2019:		Einbindung der Scans des SUF.
Juni 2019:		CSV-Export der Suchergebnisse wurde implementiert.
Mai 2019:		Einspeisung korrigierter Datensätze des SMF.
April 2019:		Abschaltung der alten BayDat und Umleitung der bisherigen Webadressen zur neuen BayDat.
Februar 2019:		Fertigstellung und Onlinestellung der neuen BayDat.

Zeichnen eigener Dialektkarten:

Falls Sie auf Basis der BayDat-Belege eigene Dialektkarten erstellen möchten, finden Sie Grundkarten sämtlicher BSA-Projekte auf den Seiten des Unterfränkischen Dialektinstituts unter dem Stichwort Karten.

Probleme und Fehler

Sollten Sie Probleme bei der Benutzung der BayDat-Datenbank haben oder Fehler entdecken, nehmen Sie bitte per E-Mail Kontakt mit uns auf.

Die Programmierung erfolgte durch Manuel Raaf. Das Logo wurde dankenswerterweise von Barbarella Petz entworfen.