Inhaltsverzeichnis
📊 Seitenaufrufe: 71
Mein Python-Skript analysiert vollautomatisch die Fahrzeugdaten von 360 VW T3 Bullis auf mobile.de und beantwortet damit eventuell eine der wirklich großen Fragen des Lebens: „Was letzte Preis?!“
Da ich mich kürzlich dazu durchgerungen habe, meinen geliebten Volkswagen T3 Bulli nach über acht Jahren in meinem Besitz nun doch zum Verkauf anzubieten, musste ich irgendeine Verhandlungsbasis finden. Was wäre dafür besser geeignet, als eine schnelle statistische Auswertung aller momentan inserierten Bullis, um sich vorab wenigstens einen groben Überblick über die üblichen Verkaufspreise zu verschaffen!
Funktionsweise
Mein Python-Skript lädt dafür alle entsprechenden Suchergebnis-Seiten (und Thumbnails) herunter, parst das HTML (PyQuery) und decodiert die Fahrzeugdaten. Voraussetzung ist, dass das Captcha zuvor einmalig im Browser gelöst wurde und das Python-Skript bei allen Anfragen im Request-Header den User-Agent des verwendeten Browsers setzt. (Es tut also so, als wäre es der Browser.) Ich verwende einen lokalen Cache für alle Daten, sodass ich insbesondere beim erstmaligen Ermitteln der richtigen CSS-Selektoren nicht ständig auf die Downloads warten musste.
Die decodierten Fahrzeugdaten werden in einem Pandas-DataFrame gespeichert und dann wie gewünscht sortiert sowie gefiltert. Die Plots generiere ich mit Matplotlib, wobei ein Thumbnail sowie ein kleiner Infotext für jedes Fahrzeug angezeigt wird.
Ergebnisse
Hinweis Nachdem ich bereits einige Plots generiert habe, fiel mir auf, dass auch T4 in den Suchergebnissen vorhanden sind. Wer hat die denn bestellt?! — Die Suche von mobile.de scheint hier entweder einen Bug zu besitzen, oder man würde uns gerne absichtlich eine aktuellere Fahrzeuggeneration andrehen…Hier die Ergebnisse meiner Auswertung von 360 VW T3 Bullis (und ein paar wenigen VW T4 im abgehobenen Preis-/PS-Segment).
Die Farbe der Textboxen gibt Auskunft über den Zustand des Fahrzeugs:
Grün | Unfallfrei |
Grau | Kein Zustand angegeben |
Rot | Beschädigt / Nicht fahrtauglich / Unfallfahrzeug |
Benzin vs Diesel
Es ist zu erkennen, dass etwas weniger Benziner zum Verkauf angeboten werden. (Der letzte Diesel-Datenpunkt bei 73.000 € ist ein T4, der sich leider hineingemogelt hat.)
Schaltgetriebe vs Automatik
Es verwundert nicht, dass es mehr Bullis mit Schaltgetriebe als mit Automatik gibt. Die Spanne beim Schaltgetriebe reicht bis 85.000 € (irgendwas mit Porschemotor) und beim Automatikgetriebe reicht es immerhin bis 50.000 € (der letzte Automatik-Datenpunkt ist wieder nur der hineingemogelte Diesel-T4).
PS-Verteilung
Interessant ist auch die PS-Verteilung (sowohl Benziner als auch Diesel):
Fazit
Marktdaten in dieser Form aufzubereiten und zu visualisieren ist immer spannend — und es half mir letztendlich auch dabei, eine Verhandlungsbasis für meinen zu verkaufenden Bulli zu schaffen.
Bitte kontaktiere mich oder hinterlasse einen Kommentar, wenn dir dieses Projekt gefällt. 🙂