Zavedenie výučby analýzy veľkých dát

Základné informácie

Tematická oblasť: komisia č. 2 pre nové technológie, metódy a formy vo vzdelávaní

Názov projektu (slovenský): Zavedenie výučby analýzy veľkých dát

Názov projektu (anglický): Introduction of Education in Big Data Analytics

Začiatok riešenia projektu: 2015

Koniec riešenia projektu: 2017

Stav projektu: Ukončený

Číslo projektu: 025TUKE-4/2015

Vedúci projektu: prof. Ing. Ján Paralič, PhD.

Vysoká škola: Technická univerzita v Košiciach

Pracovisko: Fakulta elektrotechniky a informatiky

Anotácia originálnych výsledkov riešenia projektu v slovenskom jazyku

Projekt bol zameraný na podporu výučby analýzy veľkých dát v odbore Hospodárska informatika vyučovanom na Technickej univerzite v Košiciach. Jedným z hlavných výstupov projektu je vybudovaná cloudová infraštruktúra, ktorá umožňuje nasadenie a prevádzku technológií a nástrojov používaných pre spracovanie a analýzu veľkých dát. Na nej bola nasadená platforma používaná vo výučbe novozavedeného predmetu Technológie spracovania veľkých dát. Pre podporu jeho výučby boli vytvorené študijné materiály pokrývajúce teoretickú časť a aj praktické úlohy. V rámci praktických cvičení bola vytvorená množina ukážkových aplikácií, úloh, tutoriálov a príručiek k jednotlivým technológiám a nástrojom. Výučbové materiály sú dostupné on-line a vybrané technológie a úlohy boli vydané aj vo forme skrípt Technológie spracovania veľkých dát: návody na cvičenia. 

Anotácia originálnych výsledkov riešenia projektu v anglickom jazyku

The project was aimed to support the education in the area of big data analysis in Business informatics study programme at Technical University in Kosice. One of the most important results of the project is the cloud infrastructure, which enables deployment and operation of the technologies and tools used in big data processing and analysis. It was also used to deploy the platform for support of the teaching of Technologies for processing big data, a newly established course. Study materials for support of the teaching of this course were developed, covering both theoretical and practical aspects. For the teaching of the practical skills, a set of example applications and exercises were created, as well as the tutorials and instructions to specific tools and technologies. Those materials are available online and selected exercises and tutorials were released as a textbook Technologies for processing big data: exercise tutorials (in Slovak).

Finančná dotácia z MŠVVaŠ SR v rámci KEGA

Finančná dotácia z MŠVVaŠ SR v rámci KEGA Kapitálové výdavky v €
Čerpané za celé obdobie riešenia projektu 20 839,00 0,00

Zoznam výstupov projektu za celé obdobie riešenia

Publikačná činnosť

Kód kategórie Konkrétny výstup, názov (ISBN, počet strán a i.)
BCI Bednár, Peter (75%); Sarnovský, Martin (25%): Technológie spracovania veľkých dát. 2017
ADE Vadovský, Michal (50%); Paralič, Ján (50%): Data collection methods for the diagnosis of parkinson's disease. 2017 ISSN 1805-8698
AFC Mikula, Martin (50%); Machová, Kristína (50%): Anotovanie slovníka pre analýzu sentimentu pomocou PSO. 2017 Plzeň : Západočeská univerzita v Plzni, 2017 : ISBN 978-80-261-0720-0
AFC Muchová, Miroslava (50%); Paralič, Ján (50%): Analýza dát za účelom zlepšenia konkrétneho firemného procesu logistickej firmy. 2016 Bratislava : STU, 2016 : ISBN 978-80-227-4619-9
AFC Vadovský, Michal (50%); Paralič, Ján (50%): Použitie spracovaných záznamov reči pacientov pre určenie štádia Parkinsonovej choroby. 2017 Plzeň : Západočeská univerzita v Plzni, 2017 : ISBN 978-80-261-0720-0
AFC Smatana, Miroslav (50%); Butka, Peter (50%): Dynamic visualization of generalized one-sided concept lattices and their reductions. 2017 Cham : Springer, 2017 : ISBN 978-3-319-46583-8 ISSN 2194-5357
AFC Smatana, Miroslav (50%); Butka, Peter (50%): Hierarchical topic modeling based on the combination of formal concept analysis and singular value decomposition. 2017 Cham : Springer, 2017 : ISBN 978-3-319-43982-2 ISSN 2194-5357
AFC Smatana, Miroslav (50%); Butka, Peter (45%); Cöveková, Lenka (5%): Tree based reduction of concept lattices based on conceptual indexes. 2017 Cham : Springer, 2017 : ISBN 978-3-319-46583-8 ISSN 2194-5357
AFD Sarnovský, Martin (95%); Bajus, Dávid (5%): Building environment analysis based on clustering methods from sensor data on top of the Hadoop platform. 2017 Danvers : IEEE, 2017 : ISBN 978-1-5090-5654-5
AFD Sarnovský, Martin (50%); Butka, Peter (45%); Hužvárová, Andrea (5%): Twitter data analysis and visualizations using the R language on top of the Hadoop platform. 2017 Danvers : IEEE, 2017 : ISBN 978-1-5090-5654-5
AFD Sarnovský, Martin (50%); Butka, Peter (45%); Paulina, Jakub (5%): Social-media data analysis using tessera framework in the hadoop cluster environment. 2017 Cham : Springer, 2017 : ISBN 978-3-319-46586-9 ISSN 2194-5357
AFD Muchová, Miroslava (50%); Paralič, Ján (40%); Jančuš, Marek (10%): An approach to support education of data mining algorithms. 2017 Danvers : IEEE, 2017 : ISBN 978-1-5090-5654-5
AFD Vantová, Zuzana (40%); Paralič, Ján (30%); Gašpar, Vladimír (30%): Mobile application for creating presence lists. 2017 Danvers : IEEE, 2017 : ISBN 978-1-5090-5654-5
AFD Vadovský, Michal (50%); Paralič, Ján (50%): Parkinson´s Disease patients classification based on the speech signals. 2017 Danvers : IEEE, 2017 : ISBN 978-1-5090-5654-5
AFC Miroslava Muchová, Ján Paralič, Michael Nemčík In: Using Predictive Data Mining Models for Data Analysis in a Logistics Company. ISAT 2017: Information Systems Architecture and Technology: Proceedings of 38th International Conference on Information Systems Architecture and Technology: 17.-19.9.2017: Szklarska Poreba S. 161-170 Germany: Springer ISBN 978-3-319-67220-5
AFC Miroslav Smatana, Peter Butka, Zuzana Cabalova: Retrieval of important concepts from generalized one-sided concept lattice. In: 2017 IEEE 21st International Conference on Intelligent Engineering Systems (INES), IEEE, Larnaca, Cyprus, 2017, ISBN 978-1-4799-7678-2
AFC Peter Butka, Miroslav Smatana, Veronika Novotná: Interactive visualization of query results set from information retrieval using concept lattices. ISAT 2017: Information Systems Architecture and Technology: Proceedings of 38th International Conference on Information Systems Architecture and Technology: 17.-19.9.2017: Szklarska Poreba S. 128-137 Germany: Springer ISBN 978-3-319-67220-5
AFC Veronika Novotná, Peter Butka, Miroslav Smatana: Interaktívna vizualizácia výsledkov vyhľadávania informácií pomocou konceptových zväzov. J. Steinberger, M. Zíma, D. Fiala, M. Dostal, M. Nykl (eds.) Data a znalosti 2017, Plzeň, 5. - 6. října 2017, pp. 15-19, ISBN 978-80-261-0720-0
AFC Miroslav Smatana, Peter Butka, Zuzana Čabalová: Vyhľadávanie významných konceptov v rámci konceptuálnej analýzy dát. J. Steinberger, M. Zíma, D. Fiala, M. Dostal, M. Nykl (eds.) Data a znalosti 2017, Plzeň, 5. - 6. října 2017, pp. 131-135, ISBN 978-80-261-0720-0
AFC Miroslav Smatana, Peter Butka, Matúš Gore: Hierarchické prístupy k modelovaniu témy v dokumentoch. J. Steinberger, M. Zíma, D. Fiala, M. Dostal, M. Nykl (eds.) Data a znalosti 2017, Plzeň, 5. - 6. října 2017, pp. 136-140, ISBN 978-80-261-0720-0
AFC František Babič, Jaroslav Olejár, Zuzana Vantová, Ján Paralič: Predictive and Descriptive Analysis for Heart Disease Diagnosis. Computer Science and Information Systems (FedCSIS), 2017 Federated Conference on Computer Science and Information Systems, Prague, Czech Republic, 3-6 Sept. 2017, pp. 155-163, ISBN 978-83-946253-7-5
AFC František Babič, Vladimír Gašpar: A Creative Ecosystem to Improve the Students Adaptation to Current Trends in IT companies.A chapter in: Teaching and Learning in a Digital World, Springer, 2017
AFC Babič F., Pusztová Ľ. (2017) Analysis of Users Buying Behaviour to Improve the Coupon Marketing. In: Abramowicz W. (eds) Business Information Systems Workshops. BIS 2017. Lecture Notes in Business Information Processing, vol 303. Springer, Cham, ISBN 978-3-319-69023-0
AFC František Babič, Michal Vadovský, Ján Paralič: Exploračná analýza medicínskych záznamov. J. Steinberger, M. Zíma, D. Fiala, M. Dostal, M. Nykl (eds.) Data a znalosti 2017, Plzeň, 5. - 6. října 2017, pp. 166-170.
AFD Sarnovsky M., Cibulova P. (2018) Measurement Center Processes Support in the Automotive Industry. In: Wilimowska Z., Borzemski L., Świątek J. (eds) Information Systems Architecture and Technology: Proceedings of 38th International Conference on Information Systems Architecture and Technology – ISAT 2017. ISAT 2017. Advances in Intelligent Systems and Computing, vol 657. Springer, Cham, ISBN 978-3-319-67223-6
AFC Sarnovský, Martin (50%); Butka, Peter (45%); Paulina, Jakub (5%): Social-media data analysis using tessera framework in the hadoop cluster environment. 2017 Cham : Springer, 2017 : ISBN 978-3-319-46586-9 ISSN 2194-5357
AFD Sarnovský, Martin (50%); Paralič, Ján (50%): Teaching big data analysis at Technical University in Kosice in Business information systems study program. 2015 Danvers : IEEE, 2015 : ISBN 978-1-4673-8534-3
AFD Sarnovský, Martin (100%): Výučba technológií pre spracovanie veľkých dát v odbore Hospodárska informatika. 2015 Košice : TU, 2015 : ISBN 978-80-553-2271-1
AFD Bednár, Peter (100%): Unified parsing and information extraction language. 2016 Danvers : IEEE, 2016 : ISBN 978-146738740-8
AFD Smatana, Miroslav (50%); Butka, Peter (50%): Extraction of Keyphrases from Single Document Based on Hierarchical Concepts. 2016 Danvers : IEEE, 2016 : ISBN 978-1-4673-8739-2
AFD Smatana, Miroslav (50%); Butka, Peter (50%): Topic modeling in social networks as decision support system. 2015 Trnava : University of Ss. Cyril and Methodius, 2015 : ISBN 978-80-8105-779-3
AFC Smatana, Miroslav (34%); Paralič, Ján (33%); Butka, Peter (33%): Topic Modeling over text streams from social media. 2016 Berlin : Springer, 2016 : ISBN 978-3-319-45509-9 ISSN 0302-9743
ADD Butka, Peter (50%); Pócs, Jozef (10%); Pócsová, Jana (40%): Distributed computation of generalized one-sided concept lattices on sparse data tables. 2015 ISSN 1335-9150
AFC Sarnovský, Martin (20%); Butka, Peter (20%); Bednár, Peter (20%); Babič, František (20%); Paralič, Ján (20%): Analytical platform based on Jbowl library providing text-mining services in distributed environment. 2015 ISBN 978-3-319-24315-3
AED Sarnovský, Martin (90%); Ulbricht, Ivan (10%); Juhár, Jozef (0%); Kocur, Dušan (0%): Návrh riešenia pre podporu vzdelávacích procesov v oblasti ITSM s podporou nástroja na báze cloud computingu. 2015 Košice : TU, 2015 : ISBN 978-80-553-2178-3
AED Sarnovský, Martin (90%); Čarnoká, Noema (10%); Juhár, Jozef (0%); Kocur, Dušan (0%): Zhlukovanie textov použitím distribuovaného algoritmu K-Means. 2015 Košice : TU, 2015 : ISBN 978-80-553-2178-3
AED Sarnovský, Martin (90%); Szakalová, Edina (10%); Juhár, Jozef (0%); Kocur, Dušan (0%): Implementácia aplikácie pre zhlukovanie textov použitím nástroja Mahout. 2015 Košice : TU, 2015 : ISBN 978-80-553-2178-3
AED Rohaľová, Laura (10%); Butka, Peter (90%); Juhár, Jozef (0%); Kocur, Dušan (0%): Implementácia vlastného balíka v R pre tvorbu jednostranných fuzzy konceptových zväzov. 2015 Košice : FEI TU, 2015 : ISBN 978-80-553-2178-3
AED Novacký, Jakub (10%); Butka, Peter (90%); Juhár, Jozef (0%); Kocur, Dušan (0%): Návrh a implementácia vizualizácie algoritmu GHSOM v jazyku Processing. 2015 Košice : FEI TU, 2015 : ISBN 978-80-553-2178-3
AED Náhori, Peter (10%); Butka, Peter (90%); Juhár, Jozef (0%); Kocur, Dušan (0%): Systém pre podporu distribuovanej realizácie úloh dolovania v textoch v rámci BOINC infraštruktúry. 2015 Košice : FEI TU, 2015 : ISBN 978-80-553-2178-3
AED Kyšeľová, Jana (10%); Butka, Peter (90%); Juhár, Jozef (0%); Kocur, Dušan (0%): Využitie štruktúry a obsahu konceptového zväzu pre analýzu siete. 2015 Košice : FEI TU, 2015 : ISBN 978-80-553-2178-3
AED Oravcová, Katarína (34%); Turňová, Eva (33%); Paralič, Ján (33%); Juhár, Jozef (0%); Kocur, Dušan (0%): Decision support system for big data processing tool selection. 2015 Košice : FEI TU, 2015 : ISBN 978-80-553-2178-3

Ohlasy

Názov kategórie Konkrétny názov
2 - citácie v domácich publikáciách registrované v citačných indexoch Web of Science a v databáze SCOPUS ADD, Peter Butka, Jozef Pócs, Jana Pócsová: Distributed computation of generalized one-sided concept lattices on sparse data tables. In: Computing and Informatics. Vol. 34, no. 1 (2015), p. 77-98. ISSN 1335-9150
1 - citácie v zahraničných publikáciách registrované v citačných indexoch Web of Science a v databáze SCOPUS ADD, Peter Butka, Jozef Pócs, Jana Pócsová: Distributed computation of generalized one-sided concept lattices on sparse data tables. In: Computing and Informatics. Vol. 34, no. 1 (2015), p. 77-98. ISSN 1335-9150
1 - citácie v zahraničných publikáciách registrované v citačných indexoch Web of Science a v databáze SCOPUS ADD, Peter Butka, Jozef Pócs, Jana Pócsová: Distributed computation of generalized one-sided concept lattices on sparse data tables. In: Computing and Informatics. Vol. 34, no. 1 (2015), p. 77-98. ISSN 1335-9150
2 - citácie v domácich publikáciách registrované v citačných indexoch Web of Science a v databáze SCOPUS ADD, Peter Butka, Jozef Pócs, Jana Pócsová: Distributed computation of generalized one-sided concept lattices on sparse data tables. In: Computing and Informatics. Vol. 34, no. 1 (2015), p. 77-98. ISSN 1335-9150
1 - citácie v zahraničných publikáciách registrované v citačných indexoch Web of Science a v databáze SCOPUS ADD, Peter Butka, Jozef Pócs, Jana Pócsová: Distributed computation of generalized one-sided concept lattices on sparse data tables. In: Computing and Informatics. Vol. 34, no. 1 (2015), p. 77-98. ISSN 1335-9150
1 - citácie v zahraničných publikáciách registrované v citačných indexoch Web of Science a v databáze SCOPUS ADD, Peter Butka, Jozef Pócs, Jana Pócsová: Distributed computation of generalized one-sided concept lattices on sparse data tables. In: Computing and Informatics. Vol. 34, no. 1 (2015), p. 77-98. ISSN 1335-9150
1 - citácie v zahraničných publikáciách registrované v citačných indexoch Web of Science a v databáze SCOPUS ADD, Peter Butka, Jozef Pócs, Jana Pócsová: Distributed computation of generalized one-sided concept lattices on sparse data tables. In: Computing and Informatics. Vol. 34, no. 1 (2015), p. 77-98. ISSN 1335-9150
1 - citácie v zahraničných publikáciách registrované v citačných indexoch Web of Science a v databáze SCOPUS ADD, Peter Butka, Jozef Pócs, Jana Pócsová: Distributed computation of generalized one-sided concept lattices on sparse data tables. In: Computing and Informatics. Vol. 34, no. 1 (2015), p. 77-98. ISSN 1335-9150
3 - citácie v zahraničných publikáciách neregistrované v citačných indexoch AFD Smatana, Miroslav (50%); Butka, Peter (50%): Extraction of Keyphrases from Single Document Based on Hierarchical Concepts. 2016 Danvers : IEEE, 2016 : ISBN 978-1-4673-8739-2
3 - citácie v zahraničných publikáciách neregistrované v citačných indexoch Martin Sarnovsky, Peter Butka, Andrea Huzvarova: Twitter data analysis and visualizations using the R language on top of the Hadoop platform. In: SAMI 2017. - Danvers : IEEE, 2017 S. 327-331. ISBN 978-1-5090-5654-5

Iné výstupy (napr. e-learning, webové stránky, virtuálne laboratórium, školenia, kurzy, workshop a pod.)

Názov výstupu Opis výstupu Link
On-line výučbové materiály Modifikovaná a rozšírená verzia výučbových materiálov je dostupná na web stránke predmetu Technológie spracovania veľkých dát. Obsahuje materiály k prednáškam, návody a tutoriály k cvičeniam, spolu s dátovými množinami a zdrojovými kódmi riešených úloh, zadania krátkych domácich úloh pre samostatné riešenie a zadanie s dátovou množinou pre projektové zadanie riešené skupinami študentov počas semestra. http://web.tuke.sk/fei-cit/sarnovsky/tsvd/
Moodle kurz predmetu Moodle kurz predmetu obsahujúci banku otázok pokrývajúcu oblasť analýzy veľkých dát pre potreby predmetu Technológie spracovania veľkých dát, z nich vytvorené priebežné a záverečné testy. Prihlásenie sa do systému je obmedzené pre študentov prihlásených na predmet a vyučujúcich (LDAP autentifikácia). https://kkui.fei.tuke.sk/chi/moodle/login/index.php
Platforma pre analýzu veľkých dát Prostredie Rozšírené prostredie postavené na distribúcii Cloudera Hadoop, updatované o Apache Spark a príbuzné knižnice, grafické používateľské rozhranie klastra (nástroj Hue) umožňujúci správu súborového systému, nasadenie úloh, monitoring a administráciu samotného prostredia. Vzhľadom na nasadenie je prístup k infraštruktúre možný iba z IP adries v rámci adresného priestoru TU v Košiciach. http://147.232.202.100:8888/
Pozvaná prednáška Ing. Peter Bednár, PhD. mal pozvanú prednášku na tému Spracovanie veľkých dát na konferencii Data a znalosti 1.10.2015 v Prahe (http://www.dataznalosti.cz/program/) http://www.dataznalosti.cz/wp-content/uploads/2015/03/peter-bednar-big-data
Workshop WIKT 2015 Zorganizovanie 10. ročníka Workshopu o inteligentných a znalostne orientovaných technológiách (WIKT 2015) v Košiciach. Jedna zo sekcií venovaná špeciálne analýze veľkých dát. http://web.tuke.sk/fei-cit/wikt2015
Workshop WIKT 2017 Zorganizovanie 12. ročníka Workshopu o inteligentných a znalostne orientovaných technológiách (WIKT 2017) v Košiciach. Mnoho príspevkov bolo zameraných na problematiku analýzy (veľkých) dát. http://web.tuke.sk/fei-cit/wikt2017

Záverečné hodnotenie príslušnej komisie KEGA

Splnil ciele excelentne (s dosiahnutím celospoločenských prínosov).

Filter

Filter