Immer wieder erreichen mich Anfragen, ob ich nicht für das neue Projekt eines Braurechners die Daten des Müggelland-Rezeptkalkulators zur Verfügung stellen könnte. Am besten gleich als SQL-Dump, so dass sie mühelos in das eigene Projekt eingelesen werden können. Der Programmierer wolle sich ja schließlich nicht die sinnlose Arbeit machen, die Rohstoffdaten wochenlang mühsam abzutippen.
Bisher habe ich diese Anfragen meist mit Nichtachtung gestraft. Die Daten in meinen Rohstoff-Datenbanken sind schließlich wirklich mühsam über Jahre aus verschiedensten Quellen zusammengetragen worden. Neben dem stumpfen Abtippen machen auch die Suche, Normalisierung und spätere Aktualisierung eine Menge an Arbeit, die sich ein außenstehender kaum vorstellen kann, vom Design und Support der Infrastruktur ganz abgesehen. Irgendwie fühlt es sich nicht richtig an, sie dann so larifari herauszugeben.
Im Moment stecken in den Rohstoff-Datenbanken 176 Malze, 320 Hopfensorten, 366 Hefen und 53 Zusatzstoffe. Für die Rezeptberechnung braucht man pro Rohstoff eigentlich nur wenige Daten: bei den Malzen die Farbe und das Extraktpotential, beim Hopfen den Alphasäuregehalt und bei den Hefen den potentiellen Vergärungsgrad. Trotzdem stecken in den Datenbanken viele zusätzliche Informationen wie Analysedaten der Malze und Hopfen, Eigenschaften der Hefen wie Ausflockung und Alkoholtoleranz oder das Aromenspektrum der Hopfen. Insgesamt haben die Malze 21, die Hopfen 58, die Hefen 23 und die Zusatzstoffe 6 Datenpunkte.
Eine einheitliche Datenbasis der Rohstoffe macht auch über die Arbeitserleichterung für den Nutzer hinaus Sinn. Der Import, Export und Austausch zwischen verschiedenen Programmen macht immer wieder Probleme, wenn die Zutaten der Rezepte nicht übergreifend definiert sind. Fehlende Einträge, aber auch schon kleine Unterschiede in der Schreibweise oder den Kennzahlen machen zum Beispiel einen Import aus einem anderen Programm wenn nicht unmöglich, dann doch zumindest arbeitsaufwändig.
Die Herausgabe eines bestimmten Arbeitsstands der Daten macht aber im nachhinein oft Probleme. Vom Zeitpunkt der Herausgabe ab entwickeln sich die Datenbestände unabhängig voneinander in verschiedene Richtungen. Die Unterschiede häufen sich mit der Zeit an, weil auf beiden Seiten Veränderungen vorgenommen werden, die auf der jeweils anderen Seite nicht berücksichtigt werden. Besser im Sinne der Austauschbarkeit wäre es, Daten an einer zentralen Stelle zu pflegen und bei Änderungen den neuen Stand wieder in alle Applikationen zu importieren.
Wie ihr euch sicher schon anhand der Überschrift denken könnt, will ich die Daten trotzdem öffentlich zugänglich machen, und zwar in Form einer offenen Datenbank. Der Inhalt der Datenbank wird ebenso öffentlich wie ihre Struktur. Jeder wird die Daten über verschiedene Wege auslesen, aber auch zur Erweiterung des Inhalts beitragen können, indem er Angaben korrigiert, weitere Materialien vorschlägt oder zusätzliche Daten zu den vorhandenen ergänzt.
Als Lizenz für die Benutzung habe ich mich für die Open Database Lizenz (ODC-BY 1.0) entschieden, die die Nutzung der Datenbank bei Nennung der Quelle sowohl für private als auch für kommerzielle Zwecke erlaubt. Die Inhalte stehen unter der Database Contents Lizenz (DbCL 1.0), die ebenso offen ist.
Der Aufbau der Datenbank wird schrittweise erfolgen. Ein Anfang ist mit den Zutaten-Tabellen der BrauReKa-Seite bereits gemacht: Die vollständigen Daten aller Materialien sind offen über die Rohstoff-Seiten einsehbar. Ich werde aber alle Aktivitäten auf der Seite
zusammenfassen. Dort werden die Definitionen der Datenbanken, die Im- und Exportformate und Schnittstellen sowie alle Werkzeuge zur Bearbeitung zur Verfügung stehen. Die Struktur der Datenbank wird sich etwas von der historisch gewachsenen Braureka-Datenbank unterscheiden. Die Übersicht der ersten Version seht ihr unten.
Die Datenbank enthält Stammdaten zu Malzen und anderen vergärbaren Zutaten, Hopfen und Hefen. Über Link-Tabellekönnen den Hopfensorten Aromen zugeordnet werden (das ist eventuell in einer späteren Version auch für die Malze sinnvoll). Hefen und Hopfen sind zudem über weitere Link-Tabellen mit den Bierstilen verbunden, für die sie eingesetzt werden können. Schließlich gibt es zwei weitere Link-Tabellen die Hefen und Hopfen mit der eigenen Stammdaten-Tabelle linken, um geeignete Ersatzsorten zu definieren.
Für Malze und Hopfen existieren zudem Tabellen für Rohstoff-Analysen. Es können beliebig viele Analysen für jeden Rohstoff gespeichert werden.
Für jede Stammdaten-Tabelle existieren zwei Views. Ein „…_short” genannter View enthält nur die für Berechnungen wichtigen Daten. Ein zweiter View enthält alle Stammdaten sowie die Mittelwerte der Analysedaten.
Schließlich gibt es eine Tabelle für Wasseranalysedaten. Die Beschaffung der Daten ist zwar an sich kein Problem, aber doch immer mit etwas Mühe verbunden. Die Wasserwerke haben mitnichten ein einheitliches System, ihre Analysedaten abzulegen. Auch der Umfang und die Einheiten der Messwerte unterscheiden sich oft.
Die Wasseranalysen-Tabelle definiert ein einheitliches Set an Datenpunkten und Einheiten. Werden über die Zeit mehrere Analysen eingegeben, kann man auch sehr schön Veränderungen der Wasserqualität über die Zeit beobachten, etwa den in den letzten Jahren rasanten Anstieg der Sulfatwerte des Berliner Wassers.
Künftig werde ich Änderungen an den Daten zuerst in der oBraMa-DB vornehmen, und auch der Braureka-Rezeptkalkulator wird seine Zutatenlisten aus dieser Datenbank beziehen.
Jeder Nutzer kann die Strukturen und Daten frei und kostenlos nutzen. Zusätzlich kann er neue Einträge über ein Formular eingeben. Sie werden nach Prüfung in die Datenbank aufgenommen. Für bestehende Einträge kann jeder Nutzer über ein E‑Mail-Interface Fehler melden oder Ergänzungen beitragen.
Die Prüfung neuer Einträge, die Korrektur von Fehlern und die Einarbeitung von Ergänzungen werden nur registrierte Mitarbeiter vornehmen können. Für diese Funktion kann sich jeder anmelden, der regelmäßig ein paar Minuten für die Pflege der Datenbank opfern möchte. Nutzt dazu bitte die E‑Mail-Adresse unten.
Noch sind nicht alle Einzelheiten definiert, es ist also jetzt die beste Gelegenheit, eure Ideen in das Projekt einzubringen. Welche Daten sind euch wichtig, welche zusätzlichen Schnittstellen soll die Datenbank haben und welche Werkzeuge braucht für die Bearbeitung? Kontaktiert mich bitte unter
Falls ihr die oBraMa-Daten benutzt, würde ich mich freuen, wenn ihr euer Projekt als Referenz meldet. Ich werde dann alle diese Projekte auf der oBraMa-Webseite veröffentlichen und verlinken.
Viel Erfolg bei euren Projekten mit den Daten der oBraMa-Datenbank!
Vorab sorry für die Kritik, ich denke aber dass sie eine Überlegung wert ist:
Die Idee ist schön, aber hier wurde ganz klar der 2. vor dem 1. Schritt gemacht. Die Fehler aus den Datenquellen wurden 1:1 übernommen. Damit kann Obrama nicht seriös genutzt werden. Beispiele: Brown Malt wird mit Amber Malt gleichgesetzt, obwohl es unterschiedliche Malze sind. Viele Hopfennamen sind veraltet. Beispiel Cascade NZ heißt seit 2018 Taiheke und man kann ihn auch nicht mehr mit herkömmlichen Cascade vergleichen, es hat sich durch das neuseeländische Mikroklima eine eigene Varietät herausgebildet (Litschi). Viele Hopfenbeschreibungen decken sich nicht mit anderen Quellen; woher die Informationen in der Datenbank stammen, lässt sich durch fehlende Referenzierung nicht überprüfen.
Ich weiß, dass eine Überarbeitung der Datenbanken eine Heidenarbeit ist. Aber eine Qualitätssicherung vorher ist wirklich angeraten, wenn obrama eine Referenz sein soll.
Viele Grüße
Radulph