R & Python
Home » Technologien »
Daten-Stichproben untersuchen mit R
R ist eine freie Softwareumgebung für Statistik, die seit 1995 unter der GNU General Public License steht. Wir setzen R in erster Linie ein, um im Rahmen eines Vor- oder Analyseprojekts Stichproben größerer Datenbestände schnell und flexibel zu untersuchen und datengetriebene Beratung anzubieten. Mit Hilfe von Regressions- und Clusteranalysen lassen sich beispielsweise Modelle erstellen, um Zusammenhänge zwischen Variablen zu analysieren und Vorhersagen zu treffen. Mit Bibliotheken wie ggplot2 lassen sich die Daten einfach und übersichtlich visualisieren. R verfügt über eine große Community und viele Erweiterungen. Das CRAN Repository bietet über 7.000 Pakete, die die Umgebung ergänzen.
Flexible und integrierbare Analysen mit Python
Während R explizit für Statistiker ausgelegt ist, erlebt mit Python derzeit auch eine General-Purpose-Programmiersprache Aufwind im Data Science-Umfeld. Grund dafür ist einerseits die steigende Maturität von Paketen für die Datenanalyse wie NumPy und matplotlib. Andererseits bietet Python flexiblere Integrationsmöglichkeiten. Datenanalysen und statistischer Code können einfacher in Web-Applikationen einfließen oder mit Datenbanken interagieren.