Kaip vizualizuoti sudėtingus duomenis sistemoje „Linux“

Tikriausiai esate girdėję apie „Elasticsearch“ - paieškos variklį, kuris leidžia indeksuoti, o tada greitai ieškoti jūsų duomenyse. Gali būti, kad sukūrėte keletą vizualizacijų Kibanoje, „Elasticsearch“ GUI, nurodydami ir spustelėdami kelią per aptakią sąsają.

Ko galbūt nenaudojote, tai mažiau žinomas vizualizacijos papildinys „Timelion“.

„Timelion“ yra fantastinis vizualizacijos kūrimo įrankis, leidžiantis užrašyti savo užklausas paprasta ir galinga išraiškos kalba, kad būtų rodomi grafikai. Jis naudojamas rodant laiko eilučių duomenis, pvz., Gyventojų skaičiaus augimą ar įvykius jūsų svetainėje.

  • Pateikiame geriausių kūrėjams skirtų nešiojamųjų kompiuterių sąrašą
  • Patikrinkite šiuos geriausius kūrėjams skirtus adresus
  • Šiose geriausiose darbo vietose lengvai sugadinkite skaičius
Apie šį straipsnį

Šis straipsnis pirmą kartą pasirodė „Linux Format Magazine“ Nr. 269, paskelbtame 2022-2023 m. Lapkričio mėn.

Naudodami „Timelion“ galime apskaičiuoti slenkamuosius vidurkius, parodyti skirtumą tarp praėjusios savaitės ir šiandienos duomenų ir nustatyti kai kuriuos pagrindinius anomalijų atvejus. Tai naudinga priemonė žinoti, kaip dirbti. Pradėkime.

Montavimas

Jei esate įprastas „Linux“ formato skaitytojas, yra „Docker“ kūrimo pavyzdžių, kaip nustatyti klasterį LXF261.

Kitu atveju „Elasticsearch“ ir „Kibana“ diegimas yra gana paprastas. Vienintelis reikalavimas yra „Java“, kurią galbūt jau esate įdiegę.

Jei ne paprastas sudo apt install default-jre įdiegia jį Debiano distros sistemose, arba sudo dnf install java turėtų padaryti tą patį Red Hat šeimai.

Tada jums tiesiog reikia atsisiųsti naujausią „Elasticsearch“ ir „Kibana“ versiją norimam operacinės sistemos skoniui.

Rašymo metu naujausia versija yra kibana-7.8.1-linux-x86_64.tar.gz.

Galite jį išgauti naudodami tar -xvzf kibana-7.8.1-linux-x86_64.tar.gz, perjunkite į išgautą katalogą ir paleiskite ./bin/kibana &, kad suaktyvintumėte „Kibana“ egzempliorių.

Kai atliksite lygiai tuos pačius veiksmus, kad nustatytumėte „Elasticsearch“, pakeisdami „kibana“ į „elasticsearch“, turėtumėte turėti galimybę savo mėgstamoje naršyklėje pereiti į http: // localhost: 5601 ir pamatyti naują blizgančią „Kibana“ sąsają aplink su.

Jei norite įdiegti paketus naudodami paketų tvarkytuvę, toje pačioje nuorodoje kaip ir anksčiau yra informacijos apie „Elastic“ paketo įtraukimą į savo sistemą ir tokiu būdu įdiegtus „Kibana“ ir „Elasticsearch“ paketus.

Galite uždėti diagramas vienas ant kito ir naudoti formatą, kad diagramos atrodytų geriausiai.

Gaukite šiek tiek duomenų

Naujausios „Kibana“ versijos leidžia automatiškai įtraukti duomenų rinkinius į mūsų grupę naudojant „Data Visualizer“, o ne kurti scenarijų ar „Logstash“ konfigūraciją. Jis gali tvarkyti duomenų rinkinius JSON arba CSV formatu, taip pat kai kuriuos standartinius žurnalo failus, pvz., „Apache“ žurnalus. Vienintelis apribojimas yra tas, kad jie yra mažesni nei 100 MB. Tai yra daugiau nei pakankamai mūsų tikslams.

Mes naudosime „Covid-19“ atvejų pasaulinį duomenų rinkinį iš ES atvirųjų duomenų portalo. Atsisiuntėme CSV failą iš puslapio išteklių skyriaus.

Jei kyla problemų, galite pasirinkti atsisiųsti „Excel“ .xlsx versiją, atidaryti naudodami „LibreOffice Calc“ ir išsaugoti ją kaip „Text CSV“ (.csv) formatą. Taip pat galima atsisiųsti JSON versiją, kurią galite naudoti kaip alternatyvą.

Norėdami patekti į duomenų vizualizatorių Kibanoje, viršutiniame kairiajame kampe spustelėkite mėsainio piktogramą, tada - mašininis mokymasis ir galiausiai - duomenų vizualizatorius. Lauke Importuoti duomenis spustelėkite Įkelti failą, tada pasirinkite arba vilkite ir upuść failą ir pasirinkite savo csv failą.

Atlikę trumpą analizę, parodys statistiką, kuri atrasta iš pirmųjų 1000 CSV failo eilučių. Tai, kokio formato, jo manymu, yra kiekvienas laukas, pvz., Tekstas, data ar numeris, ir pažymėkite svarbiausias laukuose esančias reikšmes.

Paprastai tai gerai pavyksta mums tai išsiaiškinti. Jei jums reikėjo atlikti kokius nors pakeitimus, galite spustelėti Nepaisyti nustatymų, kad pakeistumėte, pavyzdžiui, lauko pavadinimą, kuris bus nustatytas „Elasticsearch“.

Vienas lauko pavadinimas, kurį turėtume nepaisyti, yra dataRep, kuri nurodo apskaičiuoto skaičiaus mūsų duomenų rinkinyje datą. „Timelion“ nežinos, kaip tai naudoti kaip laiko lauką pagal numatytuosius nustatymus, todėl vėliau galime supaprastinti savo gyvenimą, dabar šį lauką pervadinę į tai, ką jis atpažins.

Geras kandidatas yra laiko žyma. Norėdami tai nustatyti, spustelėkite Taikyti. Kai būsite patenkinti tuo, kaip atrodo likusi jo dalis, apačioje spustelėkite „Importuoti“, nurodykite indeksui pavadinimą (mes pasirinkome „covid“), tada dar kartą spustelėkite „Importuoti“, kad duomenis gautumėte į savo grupę.

Įdomios straipsniai...