Scalable Bayesian spatial analysis with Gaussian Markov random fields
Description:... Accurate statistical analysis of spatial data is important in many applications. Failing to properly account for spatial autocorrelation may often lead to false conclusions. At the same time, the ever-increasing sizes of spatial datasets pose a great computational challenge, as many standard methods for spatial analysis are limited to a few thousand data points.
In this thesis, we explore how Gaussian Markov random fields (GMRFs) can be used for scalable analysis of spatial data. GMRFs are closely connected to the commonly used Gaussian processes, but have sparsity properties that make them computationally cheap both in time and memory. The Bayesian framework enables a GMRF to be used as a spatial prior, comprising the assumption of smooth variation over space, and gives a principled way to estimate the parameters and propagate uncertainty.
We develop new algorithms that enable applying GMRF priors in 3D to the brain activity inherent in functional magnetic resonance imaging (fMRI) data, with millions of observations. We show that our methods are both faster and more accurate than previous work. A method for approximating selected elements of the inverse precision matrix (i.e. the covariance matrix) is also proposed, which is important for evaluating the posterior uncertainty. In addition, we establish a link between GMRFs and deep convolutional neural networks, which have been successfully used in countless machine learning tasks for images, resulting in a deep GMRF model. Finally, we show how GMRFs can be used in real-time robotic search and rescue operations, for modeling the spatial distribution of injured persons.
Tillförlitlig statistisk analys av spatiala data är viktigt inom många tillämpningar. Om inte korrekt hänsyn tas till spatial autokorrelation kan det ofta leda till felaktiga slutsatser. Samtidigt ökar ständigt storleken på de spatiala datamaterialen vilket utgör en stor beräkningsmässig utmaning, eftersom många standardmetoder för spatial analys är begränsade till några tusental datapunkter.
I denna avhandling utforskar vi hur Gaussiska Markov-fält (eng: Gaussian Markov random fields, GMRF) kan användas för mer skalbara analyser av spatiala data. GMRF-modeller är nära besläktade med de ofta använda Gaussiska processerna, men har gleshetsegenskaper som gör dem beräkningsmässigt effektiva både vad gäller tids- och minnesåtgång. Det Bayesianska synsättet gör det möjligt att använda GMRF som en spatial prior som innefattar antagandet om långsam spatial variation och ger ett principiellt tillvägagångssätt för att skatta parametrar och propagera osäkerhet.
Vi utvecklar nya algoritmer som gör det möjligt att använda GMRF-priors i 3D för den hjärnaktivitet som indirekt kan observeras i hjärnbilder framtagna med tekniken fMRI, som innehåller milliontals datapunkter. Vi visar att våra metoder är både snabbare och mer korrekta än tidigare forskning. En metod för att approximera utvalda element i den inversa precisionsmatrisen (dvs. kovariansmatrisen) framförs också, vilket är viktigt för att kunna evaluera osäkerheten i posteriorn. Vidare gör vi en koppling mellan GMRF och djupa neurala faltningsnätverk, som har använts framgångsrikt för mängder av bildrelaterade problem inom maskininlärning, vilket mynnar ut i en djup GMRF-modell. Slutligen visar vi hur GMRF kan användas i realtid av autonoma drönare för räddningsinsatser i katastrofområden för att modellera den spatiala fördelningen av skadade personer.
Show description