Das R-Paket RaProR berechnet Skizzen von großen Datensätzen. Skizzen sind Datensätze mit derselben Anzahl an Variablen wie der Ausgangsdatensatz, aber einer kleineren Anzahl an Beobachtungen. Wie wir in [1] zeigen, kann die Skizze genutzt werden, um appromative Bayesianische oder frequentistische lineare Regression durchzuführen. Genauer gesagt sind die Likelihood und die a posteriori-Verteilung nah an denen auf dem Originaldatensatz. Jeder Algorithmus zur Berechnung von Regressionsmdellen, dessen Laufzeit von der Anzahl der Beobachtungen abhängt, läuft auf der Skizze deutlich schneller.
Verfügbar auf CRAN: https://CRAN.R-project.org/package=RaProR.
[1] Geppert, LN, Ickstadt, K, Munteanu, A, Quedenfeld, J, Sohler, C: Random projections for Bayesian regression, In Statistics and Computing 27, 79-101 (2017). DOI 10.1007/s11222-015-9608-z.