Als "dunkle Materie der Biologie" bezeichnete man lange Zeit jene Bestandteile des Genoms, die das Ablesen von Proteinen aus Genen "nur" unterstützen und die einer wissenschaftlichen Untersuchung schwer zugänglich waren. Zu diesen Bestandteilen gehören Ribonukleinsäuren (kurz RNAs genannt), die sich durch ein Sauerstoff- und ein Wasserstoffatom (also eine Hydroxylgruppe) von der Desoxyribonukleinsäuren (kurz DNAs genannt) unterscheiden. Durch die zusätzliche Hydroxylgruppe ist die RNA relativ instabil und im Experiment schwerer zu fassen. In der Natur werden RNA-Moleküle jedoch durch die Ausbildung von Strukturen stabilisiert.
Die Bedeutung der RNA wurde lange unterschätzt. Erst in jüngster Zeit erkannte man deren eigenständige Rolle z. B. bei der Regulation der Gene. Desto dringlicher stellte sich die Aufgabe, neben den relativ leicht zu entschlüsselnden Genen, von denen Proteine abgelesen werden, auch die RNA-Gene zu identifizierenden. Genau das ist jetzt den Wissenschaftlern um den Bioinformatiker Peter Stadler vom Institut für Informatik der Universität Leipzig und seinen österreichischen Kollegen Stefan Washietl und Ivo Hofacker vom Bioinformatik-Integrations Netzwerk des österreichischen Genomforschungsprogramms GEN-AU gelungen.
Dazu koppelten die Wissenschaftler eine vergleichende Sequenzanalyse mit einer Strukturvorhersage. Letztere beruht darauf, dass besonders stabile Strukturen ein Indiz für RNA-Gene sind. Das Programm der Bioinformatiker modelliert gleichsam unzählige molekulare Verbindungen und isoliert die stabil erscheinenden. Auf dieser Grundlage durchforstet man dann die Genome verschiedener Organismen nach jenen stabilen Molekülen, die etwa beim Menschen ebenso vorkommen wie bei der Maus oder beim Zebrafisch. "Das ist ein untrügliches Kennzeichen für die biologische Relevanz der molekularen Struktur und erlaubt ihre Identifizierung als RNA-Gen.", erklärt Prof. Peter Stadler.
Große Genauigkeit und hohe Geschwindigkeit der Analyse sind das Markenzeichen der neuen Software. Es ist prinzipiell anwendbar für alle Lebewesen vom Bakterium über Pflanzen bis zum Menschen. Zudem kann auf das Programm unter www.tbi.univie.ac.at/~wash/RNAz weltweit frei zurückgegriffen werden.
Nächster Schritt soll die vollständige Inventarisierung struktureller RNAs im menschlichen Genom sein. "Wir hoffen, dass die Methode der 'computational RNomics' (wie die Bioinformatik der RNA Moleküle in Fachjargon genannt wird) zur Entdeckung weiterer Räume in der expandierenden RNA-Welt zellulärer Mechanismen führen wird", resümiert Prof. Stadler die Arbeit seines Teams.
Fachveröffentlichung:
Fast and reliable prediction of noncoding RNAs, in Proceedings of the National Academy of Sciences (PNAS)
doi: 10.1073/pnas.0409169102