A következőkben a magyarországi használtautó piacot fogom áttekinteni, egy adatelemzés keretén belül. A kezdetben áttekintem a külső adatforrást, milyen adatok találhatóak a forrásban, és elsődlegesen milyen vizualizációk és következtetések találhatóak benne.
Az áttekintést követően jöhet, egy gyors adattisztítás, esedlegesen rosszul mentett adatok javítása, átalakítás a megfelelő formátumra.
Ezek után Tableau Public segítségével elkezdődhet az elemzés és a felfedezés szakasza, ahol korrelációkat fogok keresni az adatban. Milyen tendenciák láthatóak, és milyen befolyásoló tényezők léphetnek fel az árazás során.
Az Adat
Az adat egy külső forrásból származik a kaggle.com oldalról. Az egyik legnagyobb használtautó piac weboldaláról történt az adatgyűjtés. Az adat megfelelő és tiszta forrásból származik, az adatgyűjtés módja átlátható, ahogy a .csv fájlokból álló gyűjtött adat is.
A feltöltött használtautók 2007-től kezdődően, 2020-as évig bezárólag találhatóak. Nagyobb számban 2019.01.01-től 2020.05.06-ig találunk hirdetéseket.
Az adatgyűjtésről egy teljes github oldalt találhatunk.
Az adatok külön szerepeltek, azonban a könnyebb használhatóság érdekében, főleg a Tableau miatt, egy excel fájlba importáltam őket, külön munkalapokra.
Az adatgyűjtés során a színek átalakításra kerültek számformátumra. Ez tisztán látható, hogy az oldal részletes, bővített keresőmezőjéből került átalakításra. Azonban ehhez nem található külön .csv fájl, amelyben ezek találhatóak, így létrehozásra került.
Kérdések
Az adatokban a következő kérdésekre fogom keresni a választ az áttekintés után.
Milyen mértékben esik a dízeles és benzines autók ára?
A következő vizualizáción a dízeles és benzines autók gyártó által ajánlott és a hirdető által megadott ár különbségét láthatjuk éves, havi bontásban. Ennek a segítségével tudjuk megnézni azt, hogy az adott autó, mennyit vesztett a tényleges értékéből. Általános adatról beszélünk, amelyben nem tartoznak bele fontos tényezők, mint a futott km, márka, típus.
Mégis jól mutatja a vizualizáció, a dízeles és benzines autók viszonylatát. Noha a benzines autók esetében (kék vonal), nagyobb kiugrásokat találunk, mégis a dízeles autók azok, amelyek a legtöbb esetben átlépik az 5 milliós határt, tehát az évek múlásával több mint 5 millió forintot veszítettek az értékükből.
Hogyan alakulnak az eladási árak a 2018-2020-as évben?
Kimutatható-e egy adott tendencia az autók eladási árának növekedésében és csökkenésében?
Jól látható tendencia alakult ki, egyre növevekedik a feltöltött hirdetések száma, illetve az autók ára is.
Mely városokban adják fel a legtöbb hirdetést, és melyekben kerül a legtöbb az eladásra?
A térképen jól látható, mely városokban kerül eladásra a legtöbb gépjármű. Ide sorolhatjuk Kecskemétet, Fótot, és Székesfehérvárt. Áttekintve a térképet azt is megfigyelhetjük, hogy a határmenti városokban kiugró értékeket láthatunk, mint Szombathely, Zalaegerszeg, Szeged, Békéscsaba, és Nyíregyháza. Több kisebb települést is találunk, ahol még hasonló tendenciát figyelhetünk meg.
Továbbá azt a tényt is alátámaszthatjuk, hogy a sűrübben lakott városokban, több autó kerül meghirdetésre.
Milyen korreláció található az autó motorjának felépítése és értékállósága között?
A kérdésben leginkább azt a tényezőt keresem, hogy a hány hengeres, milyen típusú autók amelyek az évek múlásával keveset vesztenek az eredeti piaci árukból.
Ennek a kérdésnek a megválaszolásához a Microsoft adatelemző eszközét hívom segítségül a Power BI-t, mégpedig a befolyásoló tényező és a decision tree miatt.
Power BI esetében is könnyen összeköthetőek voltak a csv fájlok, már az újonnan elkészített excel alapján. Azonban egy új oszlop létrehozása volt szükséges, amely az MSRP – a gyártó által ajánlott – és a Hirdető által meghatározott ár különbsége, amely megmutatja, hogy mennyit esett vagy éppen nőtt az autó ára.
Az alábbi kép ennek az oszlopnak a segítségével készült, egy döntésfa vizualizáció kiválasztásával. További magyarázó mezőként pedig hozzáadva a ccm, a hengerfelyek elrendezése, hengerek száma, és a lóerő.
Máris látható, hogy egy 626 lovas 4395 CCM, V-8-as autó volt az, amely több mint 6 millió forinttal növekedett az ára. Leírást hozzáadva látható, hogy ez egy 2019-es BMW X6-os M Competition típusú autó.
Tovább vizsgálva a grafikont elmondhatjuk, hogy többségében, a magasabb kategóriás SUV-k azok, amelyek értéke növekedett az eredeti árhoz képest.
Hogy pontosan mi adja ezt a növekedést, azt az adatbázis nem tartalmazza, azonban egy kvalitatív elemzéssel, akár a hirdetés leírásában szereplő: „felújított” , „új” , vagy akár „tuning” szavakat átakalítva boolean értékre mérhető lenne.
Mennyiben befolyásolja a kiemelés az autó eladásának árát és idejét?
A weboldalon lehetőség van az autó kiemelésre, így akár az első találati oldalon is megjelenhet. Ez mekkora mértékben befolyásolja az eladást?
A vizualizáción a hirdetés átlagos ideje, és a hirdetés átlagos ára látható, kiemelés és elkelt viszonylatban. Jól látható, hogy azok a gépjárművek, amelyeket kiemeltek és eladtak potenciálisan 30 nappal kevesebb a weboldalon töltött idejük, mint azoknak, amelyeket nem emeltek ki. Továbbá azt is láthatjuk, hogy azok az autók, amelyek kiemelésre kerültek és elkeltek, potenciálisan nagyobb értékűek, átlagosan több mint 2 millió forinttal többe kerülnek, mint a nem kiemelt darabok. Még nagyobb különbséget láthatunk a nem eladott darab között, ahol ez az érték majdnem eléri a 4 millió forintot.
Hány százalékát adták a 2018-2020-as évben a hivatásos eladók a meglévő adatok alapján?
Nagy számban kerülnek feltöltésre használtautók a hivatásos eladóktól. Mennyivel több autót töltenek fel, mint egy átlagos ember? Mekkora forgalmat generálnak a hivatásos eladók, az átlagos eladókhoz képest?
Az alábbi diagramon, jól láthatjuk, hogy átlagosan, több mint a 70%-át a hirdetéseknek a hivatásos eladók töltik fel. Ugyanez a szám vonatkozik, a kiemelésre is, megmutatkozik, hogy közel a kiemelések 75%-át a hivatásos eladók generálják.
Milyen színű autó kel el a legyorsabban és a leggyakrabban?
Következzen egy olyan információ, amelyet mindenki szeretne igazán megismerni.
A mostani diagramban láthatjuk, hogy mely színű autókból került a legtöbb hirdetésre. A grafikon jól mutatja, hogy a vajszínű, fehér és ezüst a három szín, amely a legkiemelkedőbb. De megfigyelhetjük, a terep, kék és piros autókat is. Habár ezek a színek vannak többségben az oldalon, nem biztos, hogy ezek azok, amelyek a legnagyobb arányban is kelnek el. A sávoknál megtalálható az eladás százalékos aránya is, az adott színnek. A homok színű autók 43% százaléka kelt el átlagosan, míg a zöld színű autóknak pedig 33%-a.
Egy fontos információt még találunk a diagramon, a színekhez mért átlagos hirdetés idejét. Látható, hogy az Ibolya és az Okker színek kiemelkedően több időt töltenek el a weboldalon a meghirdetés és eladás között, több mint 200 napot.
Hogyan változik a gépjármű ára a kilométeróra állás alapján?
Ezt az információt valószínűleg mindenki megmondja, hogy minél többet fut egy autó, annál olcsóbb lesz. Biztos, így van ez? Most ezt is megvizsgáljuk.
Az alábbi szóráson jól látszódik, hogy az állítás igaznak mondható, minél kevesebb kilométerrel rendelkezik egy autó, annál drágább. Egy további fontos tényező lehet, ugyanezen a síkon a gépjármű gyártási éve. Ezt világos – minél öregebb -, és sötét – minél fiatalabb – zölddel jelöltem. Azonban megfigyelhetjük, hogy ugyanaz a tendencia, mint a kilométeróra állása és gépjármű ára esetében, az évjárat nem mutat hasonlóan kiemelkedő tendenciát.
Egy-két kiugró érték található volt az adatban, így a kilométeróra állása maximalizálva lett, 1 millió km-re.
Mely autómárka a legkelendőbb a használtautó piacon?
Az első helyen az Opel áll, amelyből 2018-2020.05 időszakában a legtöbb hirdetést adták fel. Ezt követi a Ford, majd a Volkswagen. Negyedik helyen a BMW áll, majd a Mercedes-Benz. Azonban eladás tekintetében első helyen a Daewoo áll 44%-al, majd a Suzuki 39,78%-al.
Mely autómárka őrzi meg leginkább az értékállóságát?
A következő vonaldiagramon, narancs színnel van jelölve a gyártó által ajánlott átlagos ár, míg kékkel a hirdetések átlagos ára. Minél közelebb helyezkedik el a két vonal egymáshoz, annál kevesebbet vesztett az értékéből. A két ár egyszerű osztásával, megnézhetjük, hogy az eredeti átlagos árának hány százalékába kerül átlagosan jelenleg az autó. Ezek alapján a Dacia, a Volvo, Nissan, Mazda, Toyota, Ford, amelyek több mint 50%-át érik átlagosan még jelenleg is a gyártó által ajánlott árukat.
Természetesen itt is még rengeteg tényező bevonható lenne a képletbe, amellyel még tisztább képet kapnánk, évjárat, felszereltség, motor típusa, nem beszélve a forint inflációjáról.
Végső soron, ha szeretnénk egy Chrysler-t, Alfa Romeo-t, Land Rovert, vagy akár egy Porsche-t, akkor az idő múlásával, akár kevesebb mint 40%-al olcsóbban vásárolhatjuk meg ezeknek a márkáknak az autóit.
Szeretnél hasonló elemzést kapni a vállalkozásodról? Keress fel a kapcsolat oldalon keresztül.