forschung
Mein Forschungsinteresse ist die Entwicklung von Methoden und Software, die helfen, aktuelle Fragestellungen aus der Biologie und Evolution zu verstehen. Ein besonderer Fokus liegt dabei auf Tools, die große Datensätze aus diversen Quellen analysieren und visualisieren, wie zum Beispiel High-Throughout Sequencing Daten, phylogenetische Daten, und Umweltfaktoren. Durch die Kombination dieser Daten miteinander können Muster und Interaktionen zwischen ihnen gefunden und innerhalb eines biologischen Kontextes interpretiert werden. Meine Methoden nutzen Konzepte aus verschiedenen Feldern, wie zum Beispiel Graphentheorie, statistische Datenanalyse, und maschinellem Lernen.
Eine der Hauptanwendungen meiner Forschung ist das so-genannte phylogenetische Placement von metagenomischen Sequenzen. Die Methoden zeigen die Verbindungen und Muster zwischen Proben aus der Umwelt im Kontext eines evolutionären Stammbaumes, und beziehen dabei Metadaten mit ein. Die Veröffentlichungen zu diesen Methoden sind unten aufgeführt.
Im laufe der Jahre habe ich außerdem zu verschiedenen empirischen Studien beigetragen, insbesondere zu großen metagenomischen Studien. Dadurch habe ein Verständnis für die Ansätze und Bedürftnisse von Biologen entwickelt, und Inspiration für meine Forschung ziehen können.
Bedingt durch das aktuelle und zukünftige Wachstum von biologischen Datensätzen, ist die Skalierbarkeit von Software ein wichtiger Faktor. Daher arbeite ich hauptsächlich in modernen C++11, welches hohe Effizeinz hergibt. Trotz dessen versuche ich in meinem Softwaredesign einfach verständlich zu bleiben, sodass andere Forscher auf meiner Arbeit aufbauen können. Meine Software-Bibliothek genesis ist ein gutes Beispiel dafür. Außerdem biete ich das Kommandozeilen-Programm gappa für End-Anwender an, die meine Methoden nutzen möchten. Beide werden unter Software näher beschrieben.