edoc

Modelling the effects of single point mutations on the structure and function of proteins

Battey, James Nicolas Duncan. Modelling the effects of single point mutations on the structure and function of proteins. 2009, Doctoral Thesis, University of Basel, Faculty of Science.

[img]
Preview
PDF
7Mb

Official URL: http://edoc.unibas.ch/diss/DissB_8904

Downloads: Statistics Overview

Abstract

Insight into the molecular impact of mutations on the structure and function of proteins is of great importance in biology. It helps understand the evolution of proteins, rationalize the molecular causes of disease and, from a practical perspective, aid in planning experiments. In this work, three goals are pursued.
Firstly, a method for objectively assessing the effect of mutations on protein structure is formulated. The random noise component in the comparison of two structures is quantified by a log linear regression model incorporating information on experimental quality and intrinsic flexibility, which can account for approximately half of all structural variation between alternative structures. Applying this model to the task of isolating the effects of single point mutations, it is shown that subtle changes in structure, induced by mutations from evolutionarily favourable residues to unfavourable ones, can't be observed without correcting for noise.
Secondly, the use of automated prediction tools for generating 3D structures for proteins without experimental structures is assessed. It is found that current state of the art automated modelling methods rival or exceed most expert modelling groups in terms of coverage and accuracy. However, in both cases there is still significant room for improvement until protein structure model reach accuracy comparable to experimental structures for non-trivial target proteins. Computationally cheap methods fare comparatively well and thus represent useful tools for the purpose of providing valuable structural information for systematic analyses, such as the study at hand.
Finally, the use of machine learning methods for predicting the impact of mutations on protein function is assessed, using a large set of single amino acid variants in humans. The contribution of structural and evolutionary information to predicting the phenotype of mutations is tested rigorously and it is found that structural information provides information not present in evolutionary data. A generalised classifier using both sequence and structure derived information outperforms other comparable published methods. By validating the classifier on independent datasets we show that it can be used as a general purpose mutation prediction tool, and that our validation methods give reasonable estimates of its performance.
Zusammenfassung
Einsicht in die Auswirkungen von Mutationen auf die Struktur und Funktion von Proteinen ist im Bereich der Biochemie von grosser Bedeutung. Sie hilft sowohl beim Verständnis der Proteinevolution und den Ursachen von Erbkrankheiten, als auch bei der Planung von Mutageneseexperimenten. In der vorliegenden Arbeit werden drei Ziele verfolgt.
Erstens wird eine Methode vorgestellt, die dazu dient die structurellen Auswirkungen von Mutationen auf Proteinen auf objektive Weise zu charakterisieren. Zufällig auftretende räumliche Variationen zwischen alternativen Proteinstrukturen, d.h. Strukturen des selben Proteins, welche in verschiedenen Experimenten gelösst wurden, werden mithilfe log-linearer Regression in Abhängigkeit von Deskriptoren, die experimentelle Fehler oder strukturelle Flexibilität wiederspiegeln, modelliert. Mit diesem Modell, welches etwa die Hälfte der auftretenden räumlichen Variabilität zwischen alternativen Strukturen erklären kann, lässt sich ein Erwartungswert für zufällige auftretende Abweichungen berechnen. Somit kann die Signifikanz beobachteter Variationen ermittelt werden. Auf Punktmutationen anwandt, kann durch dieses Modell gezeigt werden, dass evolutionär ungünstige Mutationen gegenüber evolutionär Bevorzugten Effekte auf Strukturen haben, die ohne die Korrektur durch das Modell nicht erkennbar sind.
Zweitens wird die Genauigkeit von Methoden zur Proteinstrukturvorhersage bewertet. Die jetztige Generation von vollständig automatisierten Methoden kann durchaus jenen Methoden, die auf menschliche Intervention angewiesen sind, Konkurrenz bieten und in vielen Fällen diese sogar übertreffen. In beiden Fällen sind Verbesserungen nötig, bevor ihre Genauigkeit vergleichbar ist mit experimentellen Strukturen. Dennoch tragen besonders diejenigen Methoden, die wenig Rechenkraft benötigen und dennoch im Vergleich gute Leistung erbringen, dazu bei wertvolle strukturelle Informationen zu gewinnen, mit der biologische Fragenstellungen erörtert werden können.
Drittens werden "Machine Learning" Methoden benutzt um mithilfe struktureller und evolutionärer Information die phänotypischen Konsequenzen von Mutationen im Menschen vorherzusagen. Der Beitrag dieser beiden Imformationsquellen zur Vorhersage wird dabei rigoros getested, und es wird festgestellt, dass strukturelle Information durchaus evolutionäre Information ergänzen kann. Ein Modell, dass der Klassifizierung der Effekte von Mutationen dient, wird vorgestellt, welches vergleichbare publizierte Methoden in Genauigkeit übertreffen kann. Indem die hier vorgestellte Methode auf unabhängigen Datensätzen getestet wird, ist gewährleistet, dass sie generell anwendbar ist und dass deren Leistung mit unseren Validierungsmethoden zuverlässig eingeschätzt wird.
Advisors:Schwede, Torsten
Committee Members:Michielin, Olivier
Faculties and Departments:05 Faculty of Science > Departement Biozentrum > Computational & Systems Biology > Bioinformatics (Schwede)
UniBasel Contributors:Schwede, Torsten
Item Type:Thesis
Thesis Subtype:Doctoral Thesis
Thesis no:8904
Thesis status:Complete
Number of Pages:149
Language:English
Identification Number:
edoc DOI:
Last Modified:22 Jan 2018 15:51
Deposited On:19 Feb 2010 14:05

Repository Staff Only: item control page