Digitale Editionsrichtlinien – Registerdatenbank MinRProt

Kodierungsprinzipien und -Muster in TEI für die Registerdatenban der „Protokolle des Bayerischen Ministerrats 1945-1962“

Inhalt

Namen und IDs

RDB-Dateinamen

  • Jede RDB-Datei erhält einen Namen, der sie innerhalb des Projekts MinRProt eindeutig beschreibt. Dieser besteht aus drei Teilen:
Kürzel des Editionsprojekts „RDB“ als Kennzeichen für eine Registerdatenbanksdatei Suffix für den Typ der Datenbank
minrprot RDB _PER
Ministerratsprotokolle ab 1945 - Personen

RDB-Typen

  • Im Projekt MinRProt gibt es fünf unterschieidliche RDB-Dateitypen. Jede wird am Ende der Bearbeitung zu einem eigenständigen Register bzw. Verzeichnis umgewandelt.
Suffix Name
GQL Gedruckte Quellen und Literatur
ORT Orte
PER Personen
SSW Sachschlagwörter
UGQ Ungedruckte Quellen

Eintrag-IDs

Beim Anlegen mittels der entsprechenden Aktion, erhält jeder Eintrag eine automatisch erzeugte, einzigartige ID. Sie besteht aus dem Inhalt des Hauptfeldes des Eintrags (das bei der Anlegung ausgefüllt werden muss), bei längeren Einträgen u.U. abgeschnitten und ohne Umlaute, scharfes S und andere Leerzeichen. Hieran wird mit einem Unterstrich eine 5-stellige Zusatzzahl (die nicht mit 0 beginnen darf) angehängt. Sie soll verhindern, dass zwei Einträge mit gleichem oder ähnlichem Hauptfeld dieselbe ID bekommen.

In sehr seltenen Fällen kann es geschehen, dass es zufällig trotzdem zu Doppelungen kommt. In diesem Fall weißt Oxygen mit einer Fehlermeldung und roter Unterstreichung auf den Fehler hin. Dann sollten die Bearbeiter*innen den gerade angelegten Eintrag löschen und noch einmal anlegen. Haben sie den Fehler zu spät bemerkt und wird auf den Eintrag schon von anderer Stelle aus verwiesen, muss vor einer Löschung der gesamte Editionstext nach den Referenzen durchsucht und diese korrigiert werden.

XML-Vorsatz

  • Am Beginn jedes Dokuments wird, durch die Vorlagedateien, der XML-TEI-ALL-Vorsatz eingefügt:

RDB-Dateistruktur

  • Die RDB-Dateien werden zu Projektbeginn erzeugt und mit Ihrer Grundstruktur versehen.

Grundstruktur

TEI-HEADER

GQL - Gedruckte Quellen und Literatur

  • Die Datenbank der gedruckten Quellen- und Literaturtitel besteht aus einer einfachen <listBibl>, der die einzelnen Einträge untergeordnet sind.

RDB-Liste

RDB-Eintrag

  • Literaturtitel werden als <bibl>-Elemente abgebildet.

  • Das Element <title type="Volltitel"> ist das Hauptfeld, die Elemente <title type="Kurztitel"> und <date> müssen ebenfalls ausgefüllt werden.

  • Das <seg type="Kennabschnitt">-Element in den Titeln ist optional und kennzeichnet, dass dieser Teil des Titels besonders hervorgehoben werden soll.

  • Der Volltitel kann auch mehrere Kennabschnitte enthalten, z.B. wenn es mehrere Autoren gibt.

  • Ebenso kann im Kurztitel das <seg @type="Titelabschnitt">-Element weggelassen werden, um den kompletten Kurztitel hervorzuheben.

  • Das <seg @type="Hauptabschnitt"> im Volltitel kann nicht weggelassen werden.

  • Die Bildung der Eintrags-ID erfolgt abweichend von der Norm.

    • Hat der Volltitel einen oder mehrere Kennabschnitte wird nur der erste von ihnen zur Bildung der ID herangezogen.
    • Hat der Volltitel keinen Kennabschnitt, wird der Inhalt des Hauptabschnitts benutzt.
    • Zusätzlich zum Volltitel wird auch das Veröffentlichungsdatum in die ID integriert.

ORT - Orte

RDB-Liste

  • Die Datenbank der Orte besteht aus einer einfachen <listPlace>, die die einzelnen Einträge untergeordnet sind.

RDB-Eintrag

  • Orte werden als <place>-Elemente abgebildet.
  • Das Element <placeName> ist das Hauptfeld, alle anderen Felder sind optional ausfüllbar.
  • Das <location>-Element hat den type="Punkt" in Erwartung, dass zu einem späteren Zeitpunkt alternative Koordinaten zu den Einträgen hinzugefügt werden könnten.
  • Die Geo-Punktkoordinaten werden nicht von den Bearbeiter*innen manuell, sondern über die entsprechende Aktion eingefügt.

 

PER - Personen

RDB-Liste

  • Die Datenbank der Personen besteht aus einer einfachen <listPerson>, die die einzelnen Einträge untergeordnet sind.

RDB-Eintrag

  • Das Element <persName type="Registername"> ist das Hauptfeld. Der Lesename muss ebenfalls eingetragen werden. Alle anderen Felder sind optional. Das Feld Querverweis wird nur bei Bedarf durch die entsprechende Aktion eingefügt.
  • Im Biogramm können über die entsprechenden Aktionen Referenzen auf Literaturtitel, Quellen, Personen, Orte, Sachschlagwörter und Tagesordnungspunkte gesetzt werden. Dies geschieht jeweils über ein <rs>- bzw. <ref>-Element. Außerdem können Fremdwörter gekennzeichnet werden mittels eines <foreign>-Elements.
  • Im Biogramm ist in der Regel der Nachname der Person besonders hervorgehoben. Dies geschieht durch die Aktion Personennamen hervorheben (Biogramm). Die Referenz hat die Form:

SSW - Sachschlagwörter

RDB-Liste

  • Die Datenbank der Sachschlagwörter besteht aus mehreren geschachtelten <list>s. Dabei sind die untergeordneten Listen in den <item>-Elementen der Sachschlagwörtern enthalten, um hierarchische Schlagwortordnungen abzubilden.
  • Jede Liste enthält ein n-Attribut, das die Ebene der Schachtelung angibt. Die Zählung beginnt bei null und entspricht der Anzahl an Aufzählungsstrichen, die einem Schlagwort in der Registerdarstellung vorangestellt werden.
  • Sachschlagwörter können, müssen aber nicht, untergeordnete Sachschlagwortlisten enthalten.

RDB-Eintrag

  • Sachschlagwörter sind als <item>-Elemente abgebildet.
  • Das <term>-Element ist das Hauptfeld und muss ausgefüllt sein.
  • Untergeordnete Listen und Querverweise werden nur bei Bedarf durch die entsprechenden Aktionen eingefügt.
  • Ein Sachschlagworteintrag kann eine untergeordnete Liste und beliebig viele Querverweise enthalten.
  • Ein Sachschlagwort kann außerdem über eine Georeferenz verfügen. Diese wird durch ein corresp-Attribut im <item>-Element abgebildet und verweist auf einen Eintrag aus der Orts-RDB, der mit dem Sachschlagwort in Verbindung steht.

UGQ - Ungedruckte Quellen

RDB-Liste

  • Die Datenbank der ungedruckten Quellen besteht aus mehreren geschachtelten <list>s. Sie stellen die hierarchische Gliederung der RDB in Archive, Bestände und Quellen dar.
  • Die Datenbank enthält drei verschiedene Arten von Einträgen: Archive, Bestände und Quellen. Sie werden alle als <item>-Elemente abgebildet. In der Edition können allerdings nur auf Quellen-Einträge referenziert werden.
  • Archive-Einträge können eine Bestands- und/oder eine Quellenlisten enthalten. Bestands-Einträge können nur eine Quellenliste enthalten. Quellen-Einträge können keine weiteren Listen enthalten.

Archiv-Einträge

  • Ein Archiv wird als <item>-Element abgebildet.
  • Das <name type="Kennname">-Element ist das Hauptfeld. der Vollname kann leer bleiben, falls er mit dem Kennnamen identisch ist.
  • Die Listen für Bestände und Quellen werden beim erstmaligen Ausführen der entsprechenden Aktionen zum Einfügen neuer Bestände/Quellen innerhalb des Archivs hinzugefügt.

Bestands-Einträge

  • Ein Bestand wird als <item>-Element abgebildet.
  • Das <name type="Kennname">-Element ist das Hauptfeld. Der Vollname kann leer bleiben, falls er mit dem Kennnamen identisch ist.
  • Die Listen für Quellen werden beim erstmaligen Ausführen der Aktion zum Einfügen neuer Quellen innerhalb des Bestands hinzugefügt.

Quellen-Einträge

  • Eine Quelle wird als <item>-Element abgebildet.
  • Das <title>-Element ist das Hauptfeld. Es enthält den Bezeichner der Quelle, also die Stücknummer, die Signatur oder ähnliches.
  • Das <desc>-Element wird nur bei Bedarf hinzugefügt und enthält einen Zusatz der die Quelle näher beschreibt (und in der Druckfassung in Klammern dargestellt wird).

Maximilian Schrott [zuletzt geändert: 16.12.2020]