Datenbankgestützte Analyse von Metagenomikdaten
Diplom- oder Masterarbeit
Die Vielfalt der mikrobiellen Welt ist ueberwältigend, doch die
allermeisten Mikroben lassen sich nicht kultivieren und können deshalb
nicht im Labor untersucht werden. Um dieses Problem zu umgehen, werden
in der Metagenomik Gemeinschaften von Mikroben mittels Sequenzierung
und bioinformatischer Analyse untersucht. Hierbei fallen sehr große
Mengen von Daten an, typischerweise im Bereich mehrerer Gigabytes. Ein wichtiges Werkzeug fuer die Analyse von Metagenomikdaten ist MEGAN,
welches eine taxonomische und funktionale Klassifikation solcher Daten
erlaubt. MEGAN benutzt derzeit lediglich Files, um Metagenomikdaten
effizient zu speichern. Thema dieser Diplom-/Masterarbeit ist es,
Metagenomikdaten in tabellarische Form zu bringen, um dann ein
relationales Datenbanksystem zur effizienten Extraktion von Reads und
Matches sowie zur Datenanalyse (bspw. Klassifikation) einzusetzen. Hier
sollte sich ein signifikanter Performancevorteil erreichen lassen. Voraussetzungen: Kenntnisse im Bereich relationaler Datenbanken wären vorteilhaft. Der bioinformatische Hintergrund kann on the fly erworben werden.

