Die oBra­Ma Braumaterial-Datenbank

Immer wie­der errei­chen mich Anfra­gen, ob ich nicht für das neue Pro­jekt eines Brau­rech­ners die Daten des Müggelland-​Rezeptkalkulators zur Ver­fü­gung stel­len könn­te. Am bes­ten gleich als SQL-​Dump, so dass sie mühe­los in das eige­ne Pro­jekt ein­ge­le­sen wer­den kön­nen. Der Pro­gram­mie­rer wol­le sich ja schließ­lich nicht die sinn­lo­se Arbeit machen, die Roh­stoff­da­ten wochen­lang müh­sam abzutippen.

Bis­her habe ich die­se Anfra­gen meist mit Nicht­ach­tung gestraft. Die Daten in mei­nen Rohstoff-​Datenbanken sind schließ­lich wirk­lich müh­sam über Jah­re aus ver­schie­dens­ten Quel­len zusam­men­ge­tra­gen wor­den. Neben dem stump­fen Abtip­pen machen auch die Suche, Nor­ma­li­sie­rung und spä­te­re Aktua­li­sie­rung eine Men­ge an Arbeit, die sich ein außen­ste­hen­der kaum vor­stel­len kann, vom Design und Sup­port der Infra­struk­tur ganz abge­se­hen. Irgend­wie fühlt es sich nicht rich­tig an, sie dann so lari­fa­ri herauszugeben.

Im Moment ste­cken in den Rohstoff-​Datenbanken 176 Mal­ze, 320 Hop­fen­sor­ten, 366 Hefen und 53 Zusatz­stof­fe. Für die Rezept­be­rech­nung braucht man pro Roh­stoff eigent­lich nur weni­ge Daten: bei den Mal­zen die Far­be und das Extrakt­po­ten­ti­al, beim Hop­fen den Alpha­säu­re­ge­halt und bei den Hefen den poten­ti­el­len Ver­gä­rungs­grad. Trotz­dem ste­cken in den Daten­ban­ken vie­le zusätz­li­che Infor­ma­tio­nen wie Ana­ly­se­da­ten der Mal­ze und Hop­fen, Eigen­schaf­ten der Hefen wie Aus­flo­ckung und Alko­hol­to­le­ranz oder das Aro­men­spek­trum der Hop­fen. Ins­ge­samt haben die Mal­ze 21, die Hop­fen 58, die Hefen 23 und die Zusatz­stof­fe 6 Datenpunkte.

Eine ein­heit­li­che Daten­ba­sis der Roh­stof­fe macht auch über die Arbeits­er­leich­te­rung für den Nut­zer hin­aus Sinn. Der Import, Export und Aus­tausch zwi­schen ver­schie­de­nen Pro­gram­men macht immer wie­der Pro­ble­me, wenn die Zuta­ten der Rezep­te nicht über­grei­fend defi­niert sind. Feh­len­de Ein­trä­ge, aber auch schon klei­ne Unter­schie­de in der Schreib­wei­se oder den Kenn­zah­len machen zum Bei­spiel einen Import aus einem ande­ren Pro­gramm wenn nicht unmög­lich, dann doch zumin­dest arbeitsaufwändig.

Die Her­aus­ga­be eines bestimm­ten Arbeits­stands der Daten macht aber im nach­hin­ein oft Pro­ble­me. Vom Zeit­punkt der Her­aus­ga­be ab ent­wi­ckeln sich die Daten­be­stän­de unab­hän­gig von­ein­an­der in ver­schie­de­ne Rich­tun­gen. Die Unter­schie­de häu­fen sich mit der Zeit an, weil auf bei­den Sei­ten Ver­än­de­run­gen vor­ge­nom­men wer­den, die auf der jeweils ande­ren Sei­te nicht berück­sich­tigt wer­den. Bes­ser im Sin­ne der Aus­tausch­bar­keit wäre es, Daten an einer zen­tra­len Stel­le zu pfle­gen und bei Ände­run­gen den neu­en Stand wie­der in alle Appli­ka­tio­nen zu importieren.

Wie ihr euch sicher schon anhand der Über­schrift den­ken könnt, will ich die Daten trotz­dem öffent­lich zugäng­lich machen, und zwar in Form einer offe­nen Daten­bank. Der Inhalt der Daten­bank wird eben­so öffent­lich wie ihre Struk­tur. Jeder wird die Daten über ver­schie­de­ne Wege aus­le­sen, aber auch zur Erwei­te­rung des Inhalts bei­tra­gen kön­nen, indem er Anga­ben kor­ri­giert, wei­te­re Mate­ria­li­en vor­schlägt oder zusätz­li­che Daten zu den vor­han­de­nen ergänzt.

oBraMa DB Startseite

Als Lizenz für die Benut­zung habe ich mich für die Open Data­ba­se Lizenz (ODC-​BY 1.0) ent­schie­den, die die Nut­zung der Daten­bank bei Nen­nung der Quel­le sowohl für pri­va­te als auch für kom­mer­zi­el­le Zwe­cke erlaubt. Die Inhal­te ste­hen unter der Data­ba­se Con­tents Lizenz (DbCL 1.0), die eben­so offen ist.

Der Auf­bau der Daten­bank wird schritt­wei­se erfol­gen. Ein Anfang ist mit den Zutaten-​Tabellen der BrauReKa-​Seite bereits gemacht: Die voll­stän­di­gen Daten aller Mate­ria­li­en sind offen über die Rohstoff-​Seiten ein­seh­bar. Ich wer­de aber alle Akti­vi­tä­ten auf der Seite

oBraMa.mueggelland.de

zusam­men­fas­sen. Dort wer­den die Defi­ni­tio­nen der Daten­ban­ken, die Im- und Export­for­ma­te und Schnitt­stel­len sowie alle Werk­zeu­ge zur Bear­bei­tung zur Ver­fü­gung ste­hen. Die Struk­tur der Daten­bank wird sich etwas von der his­to­risch gewach­se­nen Braureka-​Datenbank unter­schei­den. Die Über­sicht der ers­ten Ver­si­on seht ihr unten.

oBraMa DB Tabellen und Beziehungen

Die Daten­bank ent­hält Stamm­da­ten zu Mal­zen und ande­ren ver­gär­ba­ren Zuta­ten, Hop­fen und Hefen. Über Link-​Tabellekönnen den Hop­fen­sor­ten Aro­men zuge­ord­net wer­den (das ist even­tu­ell in einer spä­te­ren Ver­si­on auch für die Mal­ze sinn­voll). Hefen und Hop­fen sind zudem über wei­te­re Link-​Tabellen mit den Bier­sti­len ver­bun­den, für die sie ein­ge­setzt wer­den kön­nen. Schließ­lich gibt es zwei wei­te­re Link-​Tabellen die Hefen und Hop­fen mit der eige­nen Stammdaten-​Tabelle lin­ken, um geeig­ne­te Ersatz­sor­ten zu definieren.

Für Mal­ze und Hop­fen exis­tie­ren zudem Tabel­len für Rohstoff-​Analysen. Es kön­nen belie­big vie­le Ana­ly­sen für jeden Roh­stoff gespei­chert werden.

Für jede Stammdaten-​Tabelle exis­tie­ren zwei Views. Ein „…_​short” genann­ter View ent­hält nur die für Berech­nun­gen wich­ti­gen Daten. Ein zwei­ter View ent­hält alle Stamm­da­ten sowie die Mit­tel­wer­te der Analysedaten.

Schließ­lich gibt es eine Tabel­le für Was­ser­ana­ly­se­da­ten. Die Beschaf­fung der Daten ist zwar an sich kein Pro­blem, aber doch immer mit etwas Mühe ver­bun­den. Die Was­ser­wer­ke haben mit­nich­ten ein ein­heit­li­ches Sys­tem, ihre Ana­ly­se­da­ten abzu­le­gen. Auch der Umfang und die Ein­hei­ten der Mess­wer­te unter­schei­den sich oft.

Die Wasseranalysen-​Tabelle defi­niert ein ein­heit­li­ches Set an Daten­punk­ten und Ein­hei­ten. Wer­den über die Zeit meh­re­re Ana­ly­sen ein­ge­ge­ben, kann man auch sehr schön Ver­än­de­run­gen der Was­ser­qua­li­tät über die Zeit beob­ach­ten, etwa den in den letz­ten Jah­ren rasan­ten Anstieg der Sul­fat­wer­te des Ber­li­ner Wassers.

Künf­tig wer­de ich Ände­run­gen an den Daten zuerst in der oBraMa-​DB vor­neh­men, und auch der Braureka-​Rezeptkalkulator wird sei­ne Zuta­ten­lis­ten aus die­ser Daten­bank beziehen.

Jeder Nut­zer kann die Struk­tu­ren und Daten frei und kos­ten­los nut­zen. Zusätz­lich kann er neue Ein­trä­ge über ein For­mu­lar ein­ge­ben. Sie wer­den nach Prü­fung in die Daten­bank auf­ge­nom­men. Für bestehen­de Ein­trä­ge kann jeder Nut­zer über ein E‑Mail-​Interface Feh­ler mel­den oder Ergän­zun­gen beitragen.

Die Prü­fung neu­er Ein­trä­ge, die Kor­rek­tur von Feh­lern und die Ein­ar­bei­tung von Ergän­zun­gen wer­den nur regis­trier­te Mit­ar­bei­ter vor­neh­men kön­nen. Für die­se Funk­ti­on kann sich jeder anmel­den, der regel­mä­ßig ein paar Minu­ten für die Pfle­ge der Daten­bank opfern möch­te. Nutzt dazu bit­te die E‑Mail-​Adresse unten.

Noch sind nicht alle Ein­zel­hei­ten defi­niert, es ist also jetzt die bes­te Gele­gen­heit, eure Ideen in das Pro­jekt ein­zu­brin­gen. Wel­che Daten sind euch wich­tig, wel­che zusätz­li­chen Schnitt­stel­len soll die Daten­bank haben und wel­che Werk­zeu­ge braucht für die Bear­bei­tung? Kon­tak­tiert mich bit­te unter

obrama@mueggelland.de

Falls ihr die oBraMa-​Daten benutzt, wür­de ich mich freu­en, wenn ihr euer Pro­jekt als Refe­renz mel­det. Ich wer­de dann alle die­se Pro­jek­te auf der oBraMa-​Webseite ver­öf­fent­li­chen und verlinken.

Viel Erfolg bei euren Pro­jek­ten mit den Daten der oBraMa-Datenbank!

1 Kommentare zu “Die oBra­Ma Braumaterial-Datenbank

  1. rakader

    Vor­ab sor­ry für die Kri­tik, ich den­ke aber dass sie eine Über­le­gung wert ist:
    Die Idee ist schön, aber hier wur­de ganz klar der 2. vor dem 1. Schritt gemacht. Die Feh­ler aus den Daten­quel­len wur­den 1:1 über­nom­men. Damit kann Obra­ma nicht seri­ös genutzt wer­den. Bei­spie­le: Brown Malt wird mit Amber Malt gleich­ge­setzt, obwohl es unter­schied­li­che Mal­ze sind. Vie­le Hop­fen­na­men sind ver­al­tet. Bei­spiel Cas­ca­de NZ heißt seit 2018 Tai­he­ke und man kann ihn auch nicht mehr mit her­kömm­li­chen Cas­ca­de ver­glei­chen, es hat sich durch das neu­see­län­di­sche Mikro­kli­ma eine eige­ne Varie­tät her­aus­ge­bil­det (Lit­schi). Vie­le Hop­fen­be­schrei­bun­gen decken sich nicht mit ande­ren Quel­len; woher die Infor­ma­tio­nen in der Daten­bank stam­men, lässt sich durch feh­len­de Refe­ren­zie­rung nicht überprüfen.

    Ich weiß, dass eine Über­ar­bei­tung der Daten­ban­ken eine Hei­den­ar­beit ist. Aber eine Qua­li­täts­si­che­rung vor­her ist wirk­lich ange­ra­ten, wenn obra­ma eine Refe­renz sein soll.

    Vie­le Grüße
    Radulph

Schreibe einen Kommentar