Stöckli, Andreas. NeuroCarb : Anwendung von künstlichen neuronalen Netzwerken für die NMR Strukturaufklärung von Oligosacchariden. 2006, Doctoral Thesis, University of Basel, Faculty of Science.
|
PDF
14Mb |
Official URL: http://edoc.unibas.ch/diss/DissB_7685
Downloads: Statistics Overview
Abstract
Durch die Fortschritte in der biotechnologischen Forschung gewinnen Glykoproteine
als Wirkstoffe immer mehr an Bedeutung. Für die Produktion dieser Biopolymere,
müssen sie mit einem konstanten Glykosylierungsmuster exprimiert werden, da Veränderungen
in der Zusammensetzung der Glykane zu einer Veränderung ihrer
pharmakokinetischen und pharmakodynamischen Eigenschaften führen können. Um
diese viel versprechenden Wirkstoffe effizient und gewinnbringend herstellen zu
können, werden deshalb kostengünstige, schnelle und genaue Methoden zur
Analyse der Glykan-Komposition benötigt.
Zurzeit werden für die Strukturaufklärung von Oligosacchariden, nach erfolgter
enzymatischer Aufspaltung durch Exoglykosidasen und Aufreinigung mit Hochleistungs-
Flüssigchromatographie (HPLC), hauptsächlich Methoden der Massenspektrometrie
(MS) verwendet. Die Massenspektren können mit der Hilfe von
Datenbanken interpretiert werden und liefern die Glykosylierungsmuster. Das Ziel
der vorliegenden Arbeit war es, mit der Hilfe von künstlichen neuronalen Netzwerken
eine neue Methode für die Strukturaufklärung von Oligosacchariden basierend auf
13C-NMR Spektren zu entwickeln.
Oligosaccharide sind aus einfachen Untereinheiten — den Monosacchariden aufgebaut.
Es wurde bereits gezeigt, dass neuronale Netzwerke in der Lage sind
substituierte und unsubstituierte Monosaccharide (Glucose, Galactose und
Mannose) anhand von 13C-NMR Resonanzen nach der Monosaccharid-Identität
(Glc, Gal, Man), der Konfiguration am anomeren C-Atom (α/β), und eventuellen
Substitutionen aufzuteilen. In der vorliegenden Arbeit wurde dieses Konzept auf
mono- und di-substituierte, in Säugetieren vorkommende Monosaccharid-Einheiten
(Glc, Gal, Man, Fuc, Xyl, GlcA, GlcNAc, GalNAc und D-Neu5Ac) erweitert.
Ausgehend von einer Datenbank mit 1097 13C-NMR Spektren ungeschützter Oligosaccharide,
wurden sowohl Netzwerke mit unüberwachten als auch überwachten
Lernalgorithmen trainiert. Dabei wurden die Oligosaccharide auf drei verschiedene
Arten mit ihren chemischen Verschiebungen im 13C-NMR korreliert. (i) Im Nachbargruppen-
Ansatz wurde eine einzelne chemische Verschiebung mit der Konfiguration
eines C-Atom inklusive der Konfiguration seiner beiden benachbarten C-Atome
korreliert. Aus Literaturdaten der Monosaccharid-Einheiten Glucose, Galactose und
Mannose wurden auf Grund der Konfiguration und Substitution insgesamt 72
verschiedenen Gruppen gebildet. Damit wurden dreischichtige Netzwerke mit dem
Backpropagation Algorithmus trainiert. Von einem Literaturtest mit 812
Monosaccharid-Einheiten konnten jedoch nur 7.5% korrekt klassifiziert werden.
Deshalb wurde der Ansatz nicht mehr weiter verfolgt. (ii) Für den Monosaccharid-
Ansatz wurden Monosaccharid-Einheiten mit der Konfiguration am anomeren CAtom
und ihrem Substitutionsmuster mit ihren chemischen Verschiebungen
korreliert. Dafür wurden Literaturdaten der in Säugetieren vorkommenden
Monosaccharid-Einheiten (Glc, Gal, Man, Fuc, Xyl, GlcA, GlcNac, GalNAc, und
Neu5Ac) in 98 verschiedene Gruppen eingeteilt. In einem ersten Schritt, konnte mit
Kohonen-Netzwerken erfolgreich gezeigt werden, dass neuronale Netzwerke in der
Lage sind, Monosaccharide den 98 Monosaccharid-Gruppen zuzuordnen. In einem
zweiten Schritt, wurden mit den gleichen Gruppen 3- bis 4-schichtige Netzwerke mit
dem Backpropagation Algorithmus trainiert. Die Generalisierungsfähigkeit (Fähigkeit
zur korrekten Klassifizierung unbekannter Testdatensätze) der trainierten Netzwerke
wurde mit Mittelwerten der antrainierten Gruppen (99.2–100%), Literaturdatensätzen
(46.9–95.5%) und verschiedenen Datensätzen in-house gemessener 13C-NMR
Spektren ungeschützter Disaccharide (50–100%) überprüft. (iii) Im Disaccharid-
Ansatz wurden den Netzwerken Disaccharide als Gruppen antrainiert. Aus den
Oligosacchariden der Literaturdatenbank wurden insgesamt 265 verschiedene
Disaccharid-Gruppen gebildet und damit dreischichtige Netzwerke mit dem
Backpropagation Algorithmus trainiert. Die Erkennung des Literaturtests mit 260
Literaturdatensätzen lag bei 10–19%. Auch dieser Ansatz wurde wegen der
unzureichenden Resultate verworfen.
In der vorliegenden Arbeit konnte gezeigt werden, dass neuronale Netzwerke in der
Lage sind, Monosaccharide anhand der chemischen Verschiebungen ihrer C-Atome
nach Monosaccharid-Identität, nach der Konfiguration am anomeren C-Atom und
nach ihrem Substitutionsmuster einzuteilen. Der erfolgreichste Ansatz, die
chemischen Verschiebungen mit Monosaccharid-Gruppen zu korrelieren, sollte in
weiteren Versuchen ausgebaut und verfeinert werden.
als Wirkstoffe immer mehr an Bedeutung. Für die Produktion dieser Biopolymere,
müssen sie mit einem konstanten Glykosylierungsmuster exprimiert werden, da Veränderungen
in der Zusammensetzung der Glykane zu einer Veränderung ihrer
pharmakokinetischen und pharmakodynamischen Eigenschaften führen können. Um
diese viel versprechenden Wirkstoffe effizient und gewinnbringend herstellen zu
können, werden deshalb kostengünstige, schnelle und genaue Methoden zur
Analyse der Glykan-Komposition benötigt.
Zurzeit werden für die Strukturaufklärung von Oligosacchariden, nach erfolgter
enzymatischer Aufspaltung durch Exoglykosidasen und Aufreinigung mit Hochleistungs-
Flüssigchromatographie (HPLC), hauptsächlich Methoden der Massenspektrometrie
(MS) verwendet. Die Massenspektren können mit der Hilfe von
Datenbanken interpretiert werden und liefern die Glykosylierungsmuster. Das Ziel
der vorliegenden Arbeit war es, mit der Hilfe von künstlichen neuronalen Netzwerken
eine neue Methode für die Strukturaufklärung von Oligosacchariden basierend auf
13C-NMR Spektren zu entwickeln.
Oligosaccharide sind aus einfachen Untereinheiten — den Monosacchariden aufgebaut.
Es wurde bereits gezeigt, dass neuronale Netzwerke in der Lage sind
substituierte und unsubstituierte Monosaccharide (Glucose, Galactose und
Mannose) anhand von 13C-NMR Resonanzen nach der Monosaccharid-Identität
(Glc, Gal, Man), der Konfiguration am anomeren C-Atom (α/β), und eventuellen
Substitutionen aufzuteilen. In der vorliegenden Arbeit wurde dieses Konzept auf
mono- und di-substituierte, in Säugetieren vorkommende Monosaccharid-Einheiten
(Glc, Gal, Man, Fuc, Xyl, GlcA, GlcNAc, GalNAc und D-Neu5Ac) erweitert.
Ausgehend von einer Datenbank mit 1097 13C-NMR Spektren ungeschützter Oligosaccharide,
wurden sowohl Netzwerke mit unüberwachten als auch überwachten
Lernalgorithmen trainiert. Dabei wurden die Oligosaccharide auf drei verschiedene
Arten mit ihren chemischen Verschiebungen im 13C-NMR korreliert. (i) Im Nachbargruppen-
Ansatz wurde eine einzelne chemische Verschiebung mit der Konfiguration
eines C-Atom inklusive der Konfiguration seiner beiden benachbarten C-Atome
korreliert. Aus Literaturdaten der Monosaccharid-Einheiten Glucose, Galactose und
Mannose wurden auf Grund der Konfiguration und Substitution insgesamt 72
verschiedenen Gruppen gebildet. Damit wurden dreischichtige Netzwerke mit dem
Backpropagation Algorithmus trainiert. Von einem Literaturtest mit 812
Monosaccharid-Einheiten konnten jedoch nur 7.5% korrekt klassifiziert werden.
Deshalb wurde der Ansatz nicht mehr weiter verfolgt. (ii) Für den Monosaccharid-
Ansatz wurden Monosaccharid-Einheiten mit der Konfiguration am anomeren CAtom
und ihrem Substitutionsmuster mit ihren chemischen Verschiebungen
korreliert. Dafür wurden Literaturdaten der in Säugetieren vorkommenden
Monosaccharid-Einheiten (Glc, Gal, Man, Fuc, Xyl, GlcA, GlcNac, GalNAc, und
Neu5Ac) in 98 verschiedene Gruppen eingeteilt. In einem ersten Schritt, konnte mit
Kohonen-Netzwerken erfolgreich gezeigt werden, dass neuronale Netzwerke in der
Lage sind, Monosaccharide den 98 Monosaccharid-Gruppen zuzuordnen. In einem
zweiten Schritt, wurden mit den gleichen Gruppen 3- bis 4-schichtige Netzwerke mit
dem Backpropagation Algorithmus trainiert. Die Generalisierungsfähigkeit (Fähigkeit
zur korrekten Klassifizierung unbekannter Testdatensätze) der trainierten Netzwerke
wurde mit Mittelwerten der antrainierten Gruppen (99.2–100%), Literaturdatensätzen
(46.9–95.5%) und verschiedenen Datensätzen in-house gemessener 13C-NMR
Spektren ungeschützter Disaccharide (50–100%) überprüft. (iii) Im Disaccharid-
Ansatz wurden den Netzwerken Disaccharide als Gruppen antrainiert. Aus den
Oligosacchariden der Literaturdatenbank wurden insgesamt 265 verschiedene
Disaccharid-Gruppen gebildet und damit dreischichtige Netzwerke mit dem
Backpropagation Algorithmus trainiert. Die Erkennung des Literaturtests mit 260
Literaturdatensätzen lag bei 10–19%. Auch dieser Ansatz wurde wegen der
unzureichenden Resultate verworfen.
In der vorliegenden Arbeit konnte gezeigt werden, dass neuronale Netzwerke in der
Lage sind, Monosaccharide anhand der chemischen Verschiebungen ihrer C-Atome
nach Monosaccharid-Identität, nach der Konfiguration am anomeren C-Atom und
nach ihrem Substitutionsmuster einzuteilen. Der erfolgreichste Ansatz, die
chemischen Verschiebungen mit Monosaccharid-Gruppen zu korrelieren, sollte in
weiteren Versuchen ausgebaut und verfeinert werden.
Advisors: | Ernst, Beat |
---|---|
Committee Members: | Vedani, Angelo |
Faculties and Departments: | 05 Faculty of Science > Departement Pharmazeutische Wissenschaften > Ehemalige Einheiten Pharmazie > Molekulare Pharmazie (Ernst) |
UniBasel Contributors: | Stöckli, Andreas and Ernst, Beat and Vedani, Angelo |
Item Type: | Thesis |
Thesis Subtype: | Doctoral Thesis |
Thesis no: | 7685 |
Thesis status: | Complete |
Number of Pages: | 350 |
Language: | German |
Identification Number: |
|
edoc DOI: | |
Last Modified: | 22 Apr 2018 04:30 |
Deposited On: | 13 Feb 2009 15:48 |
Repository Staff Only: item control page