R & Python

Home » Technologien » R & Python

Daten-Stichproben untersuchen mit R

R ist eine freie Softwareumgebung für Statistik, die seit 1995 unter der GNU General Public License steht. Wir setzen R in erster Linie ein, um im Rahmen eines Vor- oder Analyseprojekts Stichproben größerer Datenbestände schnell und flexibel zu untersuchen und datengetriebene Beratung anzubieten. Mit Hilfe von Regressions- und Clusteranalysen lassen sich beispielsweise Modelle erstellen, um Zusammenhänge zwischen Variablen zu analysieren und Vorhersagen zu treffen. Mit Bibliotheken wie ggplot2 lassen sich die Daten einfach und übersichtlich visualisieren. R verfügt über eine große Community und viele Erweiterungen. Das CRAN Repository bietet über 7.000 Pakete, die die Umgebung ergänzen.

Flexible und integrierbare Analysen mit Python

Während R explizit für Statistiker ausgelegt ist, erlebt mit Python derzeit auch eine General-Purpose-Programmiersprache Aufwind im Data Science-Umfeld. Grund dafür ist einerseits die steigende Maturität von Paketen für die Datenanalyse wie NumPy und matplotlib. Andererseits bietet Python flexiblere Integrationsmöglichkeiten. Datenanalysen und statistischer Code können einfacher in Web-Applikationen einfließen oder mit Datenbanken interagieren.