Julio Huamán
Der Inhalt dieser Nachricht wurde maschinell übersetzt und kann einige Ungenauigkeiten gegenüber dem auf Spanisch veröffentlichten Originalinhalt enthalten.
"Fast Bayesian inference for block-NNGP for large data" ist der wissenschaftliche Artikel, mit dem Dr. Zaida Quiroz, Dozentin an unserer Fakultät für Naturwissenschaften, den Preis für das beste Papier auf der V Latin American Conference on Statistical Computing (LACSC 2021) gewonnen hat. Mit ihr arbeiteten die Wissenschaftler Marcos Prates, Dipak Dey und Havard Rue zusammen, die einen wesentlichen Anteil an dieser Arbeit hatten.
Bei der Bayes'schen Inferenz handelt es sich um eine statistische Inferenz, bei der anhand von Beweisen versucht wird, die Richtigkeit einer Hypothese zu beweisen. Er geht auf das Theorem von Thomas Bayes und seine häufige Verwendung im Prozess der Deduktion zurück. Sie ist daher für den Bereich der Statistik von erheblicher Bedeutung.
"Ich arbeite mit räumlichen Statistiken. Es ist etwas seltsam, man hört es in Peru nicht oft, aber es ist ein Bereich, in dem wir Objekte wie Karten untersuchen, die verschiedene Arten von Daten enthalten können, sei es Regionen oder Geolokalisierung, Breitengrad, Längengrad usw.", sagt Dr. Quiroz.
Als Ergebnis seiner Arbeit und seiner Doktorarbeit konnte er ein verbessertes System zur Untersuchung von Mustern im Raum entwickeln, das sich auf die Theorie stützt und praktische Auswirkungen hat. Dies wiederum kann verschiedenen Disziplinen wie der Geologie oder dem Bergbau helfen. In solchen Fällen kann dieses Modell zum Beispiel verwendet werden, um ein Gelände mit einer gewissen Mineralienkonzentration zu lokalisieren. Nach der gleichen Logik könnte ein Experte Daten über Niederschläge, Gesundheit oder Umwelt sammeln und bearbeiten.
"Wenn man mit dieser Art von Daten arbeitet, werden sie in der Regel mit GPS erfasst, und es handelt sich um eine große Menge an Informationen. Der Umgang mit großen Daten kann kompliziert sein. Die Idee war, mit diesen räumlichen statistischen Modellen zu arbeiten, sie aber so anzupassen, dass sie auch bei einer Datenmenge von 10 000 Stück funktionieren. Viele der bereits existierenden statistischen Modelle können nicht verwendet werden, wenn man diese Menge an Informationen hat, da sie normalerweise mit 1.000 Daten arbeiten", erklärt unser Lehrer.
Seit 2016 arbeitet Dr. Zaida Quiroz, wie erwähnt, im Rahmen ihrer Doktorarbeit an dieser Forschung. Durch einen siebenmonatigen Aufenthalt in den Vereinigten Staaten an der University of Connecticut konnte sie dann den theoretischen Teil des Modells, an dem sie bereits zuvor gearbeitet hatte, auch dank ihrer Mitautoren ergänzen. Außerdem verbrachte er einen Monat an der King Abdullah University of Science and Technology in Saudi-Arabien.
"Eine Stärke dieser Arbeit, die entscheidend zum Gewinn des Wettbewerbs beigetragen hat, war die statistische Berechnung. Dies wird ein Teil der Schlussfolgerung mit einer Methode, die ziemlich neu ist. Ein Modell, das aufgrund der Datenmenge drei Wochen oder einen Monat braucht, ist mit unserem Modell in wenigen Stunden fertig. Der rechnerische Beitrag war wirklich sehr groß", sagt sie.
Wenn Ihnen dieser Artikel gefallen hat, sind Sie vielleicht daran interessiert, mehr über die PUCP Statistik-Spezialisierung zu erfahren. Diese Wissenschaft macht Daten sinnvoll und liefert die Theorie und die Methoden, um aus ihnen Informationen zu gewinnen und reale Probleme zu lösen.
So werden Statistiken zur Unterstützung der Entscheidungsfindung in Regierungen, politischen Parteien, Finanzunternehmen, Meinungsforschungsinstituten, Versicherungsgesellschaften, Banken, Krankenhäusern, sozialen Organisationen und der Industrie eingesetzt.