DataMelt

Versiunea actuală a paginii nu a fost încă examinată de colaboratori experimentați și poate diferi semnificativ de versiunea revizuită pe 14 februarie 2019; verificările necesită 13 modificări .
DataMelt
Dezvoltator S.V.Chekanov _
Scris in Java
Sistem de operare Unix , Linux , OS X , Microsoft Windows
Prima editie 2005 (nume inițial JHepWork)
Platformă hardware Mașină virtuală Java
ultima versiune 2.4 (februarie 2019)
Licență Sursă deschisă (LGPL, GPL și similare)
Site-ul web jwork.org/dmelt/

DataMelt (sau DMelt pe scurt ) este un program gratuit pentru calcul științific [1] [2] . DataMelt este un mediu interactiv pentru calcul, analiza și vizualizarea datelor și învățarea automată. Programul DataMelt este conceput pentru oameni de știință, ingineri și studenți. DataMelt este multi-platformă deoarece este scris în Java , deci rulează pe orice sistem de operare unde poate fi instalată o mașină virtuală Java. Programul este conceput pentru analiza datelor statistice, ajustarea curbelor, algoritmi de analiză a datelor, calcule numerice, învățarea automată și reprezentarea grafică în 2D și 3D. DataMelt folosește limbaje de programare de nivel înalt precum Jython , JRuby . Java poate fi folosit și pentru a apela bibliotecile numerice și grafice DataMelt.

Istoricul creației

DataMelt își are originile în fizica particulelor , unde extragerea datelor este preocuparea principală. A fost creat ca proiect jHepWork în 2005 și a fost scris inițial pentru analiza datelor pentru fizicienii particulelor de la laboratorul DESY din Germania. Mai târziu a fost îmbunătățit la Laboratorul Național Argonne pentru cercetarea în fizica particulelor [3] folosind conceptul software Java pentru proiectul International Linear Collider , dezvoltat la SLAC . Versiunile ulterioare ale jHepWork au fost modificate pentru uz general (oameni de știință, ingineri, studenți în scopuri educaționale) de când proiectul International Linear Collider a încetat. În 2013, jHepWork a fost redenumit DataMelt și a devenit un proiect cu scop general, susținut de comunitate. Principala sursă de referință este cartea Analiza datelor științifice folosind scripturile Jython și Java. [4] care discută tehnici de analiză a datelor folosind scripting Java și Jython . Acest lucru a fost discutat mai târziu și în revista germană Java SPEKTRUM. [5] . Șirul „HEP” din numele proiectului „jHepWork” este prescurtarea pentru „High Energy Physics”. Dar, datorită popularității sale mari în afara acestei zone a fizicii, a fost redenumit SCaViS ( mediu de calcul științific „S” „C” și mediu de utilizare „Vis” ). Acest proiect a durat 3 ani înainte de a fi redenumit DataMelt (sau DMelt pe scurt).

Platforme acceptate

DataMelt rulează pe platformele Windows, Linux, Mac și Android . Pachetul Android se numește AWork.

Recenzii

DataMelt și versiunile sale anterioare, SCaVis (2013-2015) și JHepWork (2005-2013), care sunt încă disponibile în arhiva DataMelt , sunt discutate în aceste articole: [6] [7] [8] [9] Programul a fost comparat cu alte programe similare din aceste resurse [10] [11] [12] .

DataMelt (2015-), este o nouă dezvoltare a programelor JHepWork și SCaVis. Aceste resurse compară DataMelt cu alte pachete populare de analiză statistică și numerică. [13] [14] [15] [16] . Conform recenziilor mai recente ale articolelor și blogurilor online, DataMelt este unul dintre programele populare de analiză a datelor [17] [18] . .

Exemplu de cod

Iată un exemplu despre cum să afișați histogramele 2D citind un fișier CVS descărcat de pe site- ul Băncii Mondiale .

din jhplot.io.csv import * din java.io import * din jhplot import * d = {} reader = CSVReader ( FileReader ( "ny.gdp.pcap.cd_Indicator_en_csv_v2.csv" )); while True : nextLine = cititor . readNext () dacă nextLine este None : break xlen = len ( nextLine ) dacă xlen < 50 : continua d [ nextLine [ 0 ]] = float ( nextLine [ xlen - 2 ]) # cheie=țară, valoare=DGP c1 = HChart ( "2013" , 800 , 400 ) #c1.setGTitle("2013 Produsul intern brut pe cap de locuitor") c1 . vizibil () c1 . setChartBar () c1 . setNameY ( „dolari SUA actuali” ) c1 . setNameX ( " " ) c1 . setName ( "Produsul intern brut pe cap de locuitor 2013" ) name1 = „Sursa datelor: Indicatori de dezvoltare mondială” set_value = nume lambda : c1 . valueBar ( d [ nume ], nume , nume1 ) set_value ( nume = "Rusia" ) set_value ( nume = " Polonia " ) set_value ( nume = " România " ) set_value ( nume = " Bulgaria " ) set_value ( nume = " Belarus " ) set_value ( nume = " Ucraina " ) c1 . actualizare ()

Când acest script este executat, histograma este afișată într-o fereastră separată. Imaginea poate fi salvată în mai multe formate.

Iată un alt exemplu simplu care ilustrează cum să populați o diagramă cu bare 2D și să o afișați pe o pânză. Scriptul creează, de asemenea, o formă PDF . Acest script ilustrează cum să lipiți și să amestecați clasele native Java (din pachetul java.util) și clasele DataMelt (din pachetul jhplot) în interiorul unui script scris folosind sintaxa Python.

din importul java.util Aleatoriu din importul jhplot * c1 = HPlot3D ( "Canvas" ) # creați o pânză interactivă c1 . setGTitle ( "Titlu global" ) c1 . setNameX ( "X" ) c1 . setNameY ( "Y" ) c1 . vizibil () c1 . setAutoRange () h1 = H2D ( "histograma 2D" , 25 , - 3,0 , 3,0 , 25 , - 3,0 , 3,0 ) rand = Aleatoriu () pentru i în interval ( 200 ): h1 . umple ( rand . nextGauss (), rand . nextGauss ()) c1 . trage ( h1 ) c1 . export ( "jhplot3d.eps" ) # export în grafică vectorială EPS

Acest script poate fi rulat fie cu DataMelt IDE, fie cu Jython independent după specificarea căii de clasă pentru bibliotecile DataMelt.

Note

  1. Calcularea numerică și analiza datelor statistice pe platforma Java. S. V. Cekanov, Cartea. Springer, (2016) ISBN 978-3-319-28531-3 , 700 de pagini, [1] Arhivat 14 aprilie 2019 la Wayback Machine
  2. DataMelt: Mediu de calcul și vizualizare gratuit. De Moaaz Aldesoky. medevel.com. [2] Arhivat pe 9 august 2019 la Wayback Machine
  3. HEP Data Analysis Using jHepWork and Java, arXiv: 0809.0840v2, Preprint ANL-HEP-CP-08-53. CERN preprint, arXiv: 0809.0840v2 Arhivat 19 noiembrie 2018 la Wayback Machine
  4. Analizarea datelor științifice folosind Jython Scripting și Java. Carte. S. V. Chekanov (SVChekanov), Springer-Verlag, ISBN 978-1-84996-286-5 , [3] Arhivat 14 aprilie 2019 la Wayback Machine
  5. ScaVis - Werkbank pentru cei care dezvoltă aplicații pentru Java și Jython. Roe Klaus. SPECTRU JAVA. (în germană), volumul 5 (2013) 26-28 [4] Arhivat 6 iunie 2019 la Wayback Machine
  6. Analiza datelor și extragerea datelor folosind Java, Jython și blogul jHepWork. 2010. Oracle.com. [5] Arhivat pe 6 iunie 2019 la Wayback Machine
  7. SCaVis - Werkbank für technisch-wissenschaftliche Berechnungen und Visualisierungen mit Java und Jython. de Rohe Klaus. Java SPEKTRUM. (în germană) volumul 5 (2013) 26-28 [6] Arhivat 6 iunie 2019 la Wayback Machine
  8. Analiza datelor HEP folosind jHepWork și Java. Proceedings of the HERA-LHC workshops (2007-2008), DESY-CERN [7] Arhivat 19 noiembrie 2018 la Wayback Machine
  9. Analiza de adecvare a instrumentelor și metodelor de data mining. [8] . S. Kovac, teză de licență (în engleză), jHepWork este revizuită la pagina 39-42, Universitatea Masaryk.
  10. O revizuire: Studiu comparativ al colectării diverse de instrumente de extragere a datelor. De S. Sarumathi, N. Shanthi, S. Vidhya, M. Sharmila. Jurnalul Internațional de Inginerie Calculatoare, Control, Cuantică și Informațională. 2014; 8(6). 7.
  11. Un studiu al instrumentelor, tehnicilor și tendințelor pentru Big Data Analytics. De R.Shireesha et al. (2016) International Journal of Advance Computing Technique and Applications (IJACTA), ISSN : 2321-4546, Vol 4, Issue 1 [9] Arhivat la 31 martie 2019 la Wayback Machine
  12. Comparație între diverse instrumente pentru data mining. De P.Kaur etc. IJERT ISSN: 2278-0181 Vol. 3 Numărul 10 (2010) [10] Arhivat 8 mai 2018 la Wayback Machine
  13. Comparative Analysis of Information Extraction Techniques for Data Mining, de Amit Verma et al. Indian Journal of Science and Technology, Vol 9, martie 2016 [11] Arhivat 20 iulie 2018 la Wayback Machine
  14. ^ Brief Review of Educational Applications Using Data Mining and Machine Learning, [12] Arhivat 8 mai 2018 la Wayback Machine , de A. Berenice Urbina Nájera, Jorgede la Calleja Mora, Redie ISSN 1607-4041. Revista Electronica de Investigación Educativa, 19(4), 84-96
  15. Analiza datelor utilizând instrumentul Data Mining Orange. Maqsud S. Kukasvadiya et. al. [13] Arhivat 9 mai 2018 la Wayback Machine (2017) IJEDR, Volumul 5, Numărul 2, ISSN: 2321-9939
  16. Big Data - A Survey of Big Data Technologies. De P.Dhavalchandra, M.Jignasu, R.Amit. Jurnalul Internațional de Știință și Tehnologie. Volumul 2, p45-50 (2016) [14] Arhivat 8 mai 2018 la Wayback Machine
  17. Popularitatea programelor software pentru știința datelor folosind recenzii recente, articol (sept 2018), T.Smalzer (preluat în 2019), [15] Arhivat 29 iulie 2019 la Wayback Machine
  18. Evaluation and comparison of open source software suites for data mining and knowledge discovery, de Abdulrahman H. Altalhi, JM Luna, MA Vallejo, S. Ventura, Wires/Willey, DOI: 10.1002/widm.1204 (2017), [16] Arhivat pe 31 mai 2019 la Wayback Machine

Link -uri