Women in Data Science (WIDS) Zagreb

8.3.2018., HUB385

1

kvalitetno iskorišten dan

11

tehničkih predavanja

180

zaljubljenika u znanost
WiDS Zagreb

O Konferenciji

WiDS konferencija globalna je jednodnevna konferencija čiji je cilj proširiti znanje o najnovijim tehnologijama i istraživanjima vezanim uz obradu i korištenje podatka u raznim domenama te prikazati kako vodeća poduzeća u tim područjima koriste znanost za svoj uspijeh. Misija konferencije je kroz žene kao govornike i organizatorice potaknuti, educirati i podržavati žene u znanosti.

Konferencija je prvi puta održana 2015. godine u organizaciji Stanfordovog instituta za računalno i matematičko inženjerstvo. Prošle godine konferencija je održana na 80 lokacija u 30 država, a 2018. godine očekuje se preko 100 lokalnih konferencija.
Ciljevi konferencije WiDS Zagreb su: okupiti vodeće znanstvenike i poduzeća u Hrvatskoj koji se bave ovom tematikom, povezati ljude sličnih interesa, omogućiti međusobnu podjelu znanja, prikazati interdisciplinarnost podatkovne znanosti na konkretnim primjerima iz poslovnog svijeta i svakodnevnog života.Program će uključivati tehnička predavanja, panel diskusiju o Data Science-u u edukaciji te nekoliko networking pauzi za međusobno upoznavanje.

Nadamo se da će ova konferencija biti uvod znanstvenicima i znanstvenicama u nastajanju te im pomoći u razvoju njihove karijere.
Pozivamo sve zainteresirane da nam se pridruže na ovom uzbudljivom i edukativnom događaju.

Iako na ovoj konferenciji žene vode glavnu riječ, nadamo se da će iz publike dolaziti i puno muške podrške.

Predavačice

Ana Škaro
Analiza i održavanje postrojenja za proizvodnju električne energije
Vrijeme predavanja: 16:00 - 16:25

Ana Škaro

Software development engineer, AVL
Anela Husković
Panel: Edukacija o podatkovnoj znanosti
Vrijeme predavanja: 13:40 - 14:20

Anela Husković

Solution Specialist for Data platforms and Artificial intelligence, Microsoft
Antonija Mušćet
Personalizacija usluge zasnovane na obradi velike količine podataka iz telekomunikacijske mreže
Vrijeme predavanja: 11:25 - 11:50

Antonija Mušćet

Services Engineer, Ericsson Nikola Tesla
Bojana Dalbelo Bašić
Znanost o podacima: izvori, izazovi i inspiracije
Vrijeme predavanja: 09:40 - 10:10

Bojana Dalbelo Bašić

Redoviti profesor, Zavod za elektroniku, mikroelektroniku, računalne i inteligentne sustave, FER
Helena Kmetić
Dinamičko određivanje cijena i primjene
Vrijeme predavanja: 16:50 - 17:15

Helena Kmetić

Cantab Analytica
Irina Bručić
Monetizacija podataka susreće zaštitu podataka
Vrijeme predavanja: 12:15 - 12:40

Irina Bručić

Direktorica sektora financija, Mercury Processing Services International
Ivana Nižetić Kosović
Analiza podataka o okolišu
Vrijeme predavanja: 16:25 - 16:50

Ivana Nižetić Kosović

Istraživač i developer, Ericsson Nikola Tesla
Jana Žiljak Gršić
Panel: Edukacija o podatkovnoj znanosti
Vrijeme predavanja: 13:40 - 14:20

Jana Žiljak Gršić

Pročelnica IR odjela, TVZ
Jasna Fumagalli
Monetizacija podataka susreće zaštitu podataka
Vrijeme predavanja: 12:15 - 12:40

Jasna Fumagalli

Direktorica sektora za compliance, sigurnost i upravljanje rizicima, Mercury Processing Services International
Lidija Šimrak
Panel: Edukacija o podatkovnoj znanosti
Vrijeme predavanja: 13:40 - 14:20

Lidija Šimrak

Voditeljica odjela za međunarodnu suradnju, Visoko učilište Algebra
Ljiljana Brkić
Korištenje programskog sustava za automatiziranu procjenu točnosti studentskih radova
Vrijeme predavanja: 11:50 - 12:15

Ljiljana Brkić

Docent, Zavod za primijenjeno računarstvo, FER
Maria Brbić
Predikcija fenotipova iz tekstualnih i genomskih podataka
Vrijeme predavanja: 14:45 - 15:10

Maria Brbić

Stručni suradnik doktorand, Institut Ruđer Bošković / Poslijediplomski studij Računarske znanosti, FER
Marina Ptiček
Skladišta podataka i Big Data: Kako iz "jučer" i "danas" predvidjeti - "sutra"
Vrijeme predavanja: 10:10 - 10:35

Marina Ptiček

Asistent, Zavod za primijenjeno računarstvo, FER
Mihaela Vranić
Analiza društvenih mreža kroz primjere iz prakse
Vrijeme predavanja: 11:00 - 11:25

Mihaela Vranić

Docent, Zavod za osnove elektrotehnike i električka mjerenja, FER
Mirta Baranović
Panel: Edukacija o podatkovnoj znanosti
Vrijeme predavanja: 13:40 - 14:20

Mirta Baranović

Redoviti profesor, Zavod za primijenjeno računarstvo, FER
Nina Erceg
Umjetna inteligencija spašava živote na autocestama
Vrijeme predavanja: 15:35 - 16:00

Nina Erceg

Razvojni inženjer, Telegra Solutions
Petra Marče
Analiza i održavanje postrojenja za proizvodnju električne energije
Vrijeme predavanja: 16:00 - 16:25

Petra Marče

Software development engineer, AVL
Snježana Rimac-Drlje
Panel: Edukacija o podatkovnoj znanosti
Vrijeme predavanja: 13:40 - 14:20

Snježana Rimac-Drlje

Redoviti profesor, Katedra za multimedijske sustave i digitalnu televiziju, FERIT
Stefani Majić
Kad logovi pričaju priče
Vrijeme predavanja: 14:20 - 14:45

Stefani Majić

Software Test Engineer, SPAN d.o.o

Program

Želja za otkrivanjem novog znanja iz najvećeg blaga kojeg imamo – podataka – inspiracija je da istražujemo nove metode i tražimo nove poslovne primjene. Iz statistike, strojnog učenja, umjetne inteligencije, rudarenja podataka i otkrivanja znanja u velikim količinama podataka izvire novo interdisciplinarno područje – znanost o podacima. Kako se kroz znanost o podacima promijenila uloga tih područja? Koje su njihove granice i kako su ona povezana?

Predavanje će pokazati kako različiti pristupi iz gore navedenih područja, na istim multimodalnim podacima, rezultiraju specifičnim rješenjima sa svojim prednostima i manama. Jedan od izazova znanosti o podacima jest stvoriti sinergiju različitih pristupa i dati novu bogatiju interpretaciju rezultata analize.

Big data je novi podatkovni trend prisutan svuda oko nas, prvenstveno kroz Internet i pametne uređaje. Oni generiraju velike količine podataka koji su potencijalno zanimljivi za analizu koja bi, adekvatno primijenjena, u mnogim područjima otvorila mogućnosti za nove, pametne i napredne usluge.

Nažalost, tradicionalni analitički sustavi nisu sposobni nositi se s novim vrstama podataka raznolike strukture koji dolaze velikim brzinama i u velikim količinama.

Brojna istraživanja bave se pokušajima premošćivanja jaza između tradicionalne analitike i novih podatkovnih trendova, a ovo će predavanje prenijeti glavnu problematiku područja, sažeti istraživačke pristupe njihovom rješavanju i kroz primjere opisati moguće scenarije primjene napredne analize podatka koji bi nas mogli čekati u budućnosti jednom kada ti problemi budu riješeni.

Uz današnju tehnologiju te podatke koji se prikupljaju, analiza društvenih mreža omogućuje značajne doprinose u različitim područjima: telekomunikacijama, financijskoj industriji, industriji osiguranja, sociologiji – pri promatranju međuljudskih odnosa i interakcija i drugdje.
Danas mnogi ljudi koriste aplikacije koje podržavaju društvene mreže (npr. Facebook, Twitter i slično). Komunikacija koja se odvija među njima može dovesti do različitih zaključaka o primjerice ‘stupnju prijateljstva’ među tim ljudima. Današnja nam tehnologija i razvoj znanosti omogućuju modeliranje društvenih grafova koji se mogu oformiti i na osnovu već spomenute komunikacije, ali i na osnovu komunikacije koju korisnici ostvaruju putem svojih mobilnih uređaja.

Na predavanju će biti predstavljeno nekoliko primjera gdje se recentna znanstvena dostignuća i različite metode prikaza društvenih mreža, odnosno grafova mogu iskoristiti za bolje poznavanje mreže kao cjeline, njezinih dijelova, ali i utjecajnosti određenih pojedinaca na donošenje odluka ili priklanjanja nekim rješenjima/proizvodima/izborima.

Personalizirani sustav zasnovan na obradi velike količine podataka iz telekomunikacijske mreže izračunava prijedlog poklona korisniku temeljem CDR-ova (Charging Data Recorda). Svaki CDR sadrži različite agregirane podatke kao što su korisnikov IMSI, podaci o lokaciji te podaci o mrežnoj sesiji. Temeljem tih podataka za korisnika se izračunava koji bi mu poklon najviše odgovarao. Sustav pokazuje važnost i utjecaj obrade velikih količina podataka za dobivanje pretplatničkih informacija, a implementiran je u sklopu europskog S-CASE projekta koji je dio fp7 (7th Framework Programme for Research and Technological Development).

Razmislite o sljedećem pojednostavljenom primjeru – izvucite dvije informacije iz CDR-ova – vrijeme koje je korisnik proveo na mreži i količinu prenesenog prometa. Koristeći ove informacije moguće je klasificirati korisnike na dvije skupine: multimedijski pretplatnik – kratko vrijeme provedeno na mreži, a puno generiranog prometa, npr. gledanje videozapisa na YouTubeu; nemultimedijskii pretplatnik – dugo vrijeme provedeno na mreži, a malo generiranog prometa, npr. čitanje puno teksta na mreži.

Poznavanje vrste korisnika omogućuje predlaganje personaliziranog poklona; multimedijalni pretplatnik vjerojatnije će biti zadovoljniji filmom od knjige kao dar.

Potreba za smanjivanjem opterećenja sveučilišnih nastavnika, pravovremena povratna informacija studentima, točnost i dosljednost ocjenjivanja najčešći su razlozi za razvoj programskih sustava za automatiziranu procjenu (eng. Automated Programming Assessment Systems – APAS).

Nedavno razvijeni APAS-a na FER-u po obrascu “po malo ali često” koristili smo na predmetima računarske tematike za procjenjivanje znanja i napretka studenata tijekom semestra. Prikupljene podatke smo analizirali, korištenjem nekoliko tehnika dubinske analize podataka, s ciljem predviđanja prolaznosti i uspješnosti studenata na predmetima. Osim internih podataka, prikupljenih tijekom izvođenja kolegija, u obzir su uzete i dodatne vanjske varijable (poput težinskog prosjeka ocjena, spola studenata i sl.). Pokazalo se da točnost predviđanja nije jako pogođena ako su vanjske varijable nepoznate. Točnost predviđanja postotka prolaza je visoka, osobito nakon polovice semestra (~ 80%), što omogućuje pro aktivan pristup prema studentima za koje vjerujemo da neće uspjeti položiti predmet. Osim toga, došli smo do vrijednih spoznaja o strukturi i sadržaju provjera koje ćemo primjenjivati u sljedećim izvedbama predmeta, za unaprjeđenje nastave i optimiranje radnog vremena nastavnog osoblja.

Biti procesor kartičnih transakcija znači doslovno svake sekunde obraditi i pohraniti stotine podataka. Ti podaci, ako znate postaviti prava pitanja, vrijedan su prozor u potrošačke navike i potrebe klijenata – kako za financijske institucije, tako i za trgovce. Zato procesori sve više u mogućnostima monetizacije podataka vide pravi dragulj.

Međutim, ti podaci, s naročitim naglaskom na osobne podatke klijenata, osim što donose velike poslovne mogućnosti, u isto vrijeme postavljaju i značajne izazove pred svaku kompaniju. Podatke je potrebno štititi i to ne kao bilo kakve, nego kao krunske dragulje, dakle potreban je oprez pri klasificiranju, rukovanju i pohrani. Nova regulativa, GDPR, postavlja visoke benchmark-e pred sve kompanije, pa čak i pred one koje već posjeduju industrijske certifikate (PCI DSS) kao što su to procesori. Pokazat ćemo kako jedna međunarodna kompanija pristupa ovom izazovu.

U 2018. godini Data Science trendovi nastavljaju na one iz 2017. godine uključujući Big Data, umjetnu inteligenciju, strojno učenje te dodaju neka nova područja kao što su Blockchain, Edge Computing, Serverless Computing, Digital Twins itd…

U svijetu je teško pronaći veće tehnološko sveučilište koje ne nudi neki Data Science program?

Prati li Hrvatska svjetske trendove? Je li Data Science samo buzzword ili je to zaista najseksi posao 21. stoljeća?

U otvorenoj diskusiji na temu Data Science-a u edukaciji sudjelovat će predstavnici poznatih tehnički orijentiranih fakulteta u Hrvatskoj:
FER – Mirta Baranović
FERIT – Snježana Rimac-Drlje
TVZ – Jana Žiljak Gršić
Algebra – Lidija Šimrak

Primarna uloga logova je bilježenje stanja sustava i značajnih događaja na različitim kritičnim točkama kako bi se uspješno debugirale pogreške u sustavu te izvršila analiza njihova uzroka.

Logovi su važan i vrijedan izvor informacija za razumijevanje statusa sustava i problema s performansama stoga su logovi ključni za monitoring i otkrivanje anomalija u radu sustava. Detektiranje anomalija je jedan od ključnih koraka u izgradnji sigurnog i pouzdanog sustava.

Na ovom će se predavanju kroz primjere pokazati utjecaj podatkovne znanosti na područje monitoringa aplikacija i ublažavanja potencijalnih problema u radu sustava prije nego što oni utječu na korisnike.

Bakterije i arheje imaju vrlo visoku mogućost prilagodbe raznim okolišima. Velika količina informacija o ovakvim fenotipovima bakterija dostupna je u nestrukturiranom tekstu, međutim baza koja bi sadržavala sistematsku anotaciju do sada nije postojala.

Koristeći algoritme strojnog učenja razvili smo računalni sustav koji omogućuje automatsku i sistematičnu anotaciju fenotipova bakterija iz javno dostupnih znanstvenih i popularnih tekstova te genomskih podataka. Osim generiranja predikcija, razvijeni sustav također definira nove fenotipske koncepate iz teksta koristeći algoritme nenadziranog strojnog učenja.

Važna primjena sustava leži u otkrivanju gen-fenotip asocijacija tj. pronaženju gena čiji su homolozi statistički nadzastupljeni u organizmima koji iskazuju neki fenotip, a podzastupljeni u organizmima koji ga nemaju. Koristeći naš sustav uspjeli smo pronaći 7 puta više gen-fenotip asocijacija s visokom pouzdanošću nego što je to bilo moguće koristeći isključivo prijašnji skup anotacija.

Sustav za automatsko detektiranje incidenata (Automatic Video Incident Detection – AVID) najbrži je način detektiranja incidenata na cesti i značajno povećava sigurnost svih sudionika u prometu.

Dosadašnji AVID sustavi nisu bili dovoljno pouzdani zbog dojave velikog broja lažnih alarma, ali i zbog propuštanja ili prekasne dojave mnogih. Prevelike zahtjeve klijenata dosadašnji sustavi nisu mogli zadovoljiti, međutim razvojem novih tehnologija i računalnog vida navedena očekivanja nisu više tako nedostižna.

Predstavnik nove generacije AVID sustava – X-AID postiže veći postotak točnih detekcija uz smanjen broj lažnih detekcija. Sustav omogućuje praćenje i obradu podataka paralelno za stotine kamera u realnom vremenu. Evaluira i dojavljuje opasne i neregularne situacije na cesti kao dim, vatra, zaustavljeno vozilo, sporo vozilo, vožnja u krivom smjeru, pješak na cesti, teret na cesti, gužva. Korištenjem metode strojnog učenja omogućeno je prilagođavanje određenoj sceni i povećavanje točnosti sustava.

Prezentacija o projektu izvedenom tijekom 2017.g u AVL-u , u kojem se prikupljanjem i analizom velikih količina podataka s postrojenja u jednoj elektrani kreirala programska podrška temeljem koje je moguće raditi analizu zdravlja proizvodnje električne energije, kao i ostale bitne čimbenike za rad sustava elektrane.

Internet stvari (IoT) – koncept velike povezane mreže uređaja (i ljudi) koji mogu komunicirati međusobno – zvuči kao znanstvena fantastika.

I dok se divimo samoj mogućnosti komunikacije uređaja – vrlo malo se razmišlja o pravoj vrijednosti IoT-a a to je analitika. Posebno analitički zahtjevna skupina primjene IoT-a tiče se okoliša. Podaci pristižu s različitih izvora (senzora, kamera, dronova, satelita), na različitim prostornim skalama (mikro – makro, urbanim – ruralnim) ali i vremenskim skalama (svake sekunde do npr. svakih mjesec dana).

Kako usporediti takve heterogene podatke? Kako donijeti vrijedne zaključke na temelju tolike gomile informacija? S druge strane, koje sve informacije prikupljati da se može napraviti zadovoljavajuća analiza? Predavačica će podijeliti svoje iskustvo na primjeru precizne agrikulture.

Cantab Analytica razvija algoritme strojnog učenja i vizualizaciju koji pomažu nekim od vodećih svjetskih kompanija da donose bolje odluke u poslovanju. Prikazat ću naš rad na projektu koji radimo u hoteljerstvu.

Hoteljerska kompanija koja upravlja velikim brojem hotela donedavno je upravljala rezervacijama i kapacitetima koristeći Excel i e-mail. Kao posljedica javljao se veliki broj nepopunjenih kapaciteta usred visoke sezone (zbog last-minute otkazivanja) te često previsoke ili preniske cijene. Razvili smo i održavamo njihov Revenue management sustav. Opisat ću neke od naših algoritama koji optimiziraju ‘overbooking’, algoritme koji mijenjaju cijene u realnom vremenu tražeći optimalnu cjenovnu razinu te vizualizaciju koja pomaže menadžerima da donose brze odluke.

WiDS Zagreb

Organizatorice

Andrea Knez Karačić magistrirala je na Fakultetu elektrotehnike i računarstva, smjer Programsko inženjerstvo, kao Summa Cum Laude. Kroz svoju karijeru bavila se razvojem desktop i web aplikacija, arhitekturom softvera te osmišljavanjem novih inovativnih proizvoda na temelju korisničkih zahtjeva. Trenutno je zaposlena u Rimac automobilima.

Andrea je aktivna u podizanju svijesti o potrebi za edukacijom žena i djece u STEM-u kroz blog CodeWithCream te volontiranjem u udruzi Code Club.

Zanimaju je psihologija, posebno međuljudski odnosi, motivacija, kreativnost i korisničko iskustvo. Svoju neograničenu želju za učenjem, napredovanjem i podizanjem svojih granica želi usmjeriti prema drugima i potaknuti ih da krenu u istom smjeru.

Agencija Wanderlust Events nastala je kada smo odlučili spojiti posao i strast, kreativnu energiju i želju za putovanjem i istraživanjem nepoznatog. Kreiramo poslovne evente svih

oblika i veličina, od poticajnih programa, team buildinga, konferencija, korporacijskih događanja, pa sve do poslovnih putovanja i ostalih evenata.

Wanderlust nudi najbolja rješenja po pitanju organizacije: izbor lokacija za vaše evente, izbora destinacija za putovanja, organizacija smještaja, organizacije prilagođenih programa, aktivnosti, zabave…

Naši suradnici i partneri su profesionalci i entuzijasti a naš tim, dugogodišnje iskustvo, kreativnost, profesionalnost te pažnja usmjerena detaljima i kvaliteti garantira uspješnost svih programa.

Sponzori

-GENERALNI SPONZOR-

-POKROVITELJ PROSTORA-

-OSTALI SPONZORI-

-PRIJATELJI KONFERENCIJE-

-MEDIJSKI POKROVITELJI-

HUB385 je dom developerima, kreativcima, inovatorima i poduzetnicima s ciljem promicanja inovacija, suradnje i razmjene znanja. Zajednički sa stručnjacima i mentorima organiziramo konferencije, radionice, meetup-e, hackathone, panele i promocije.

Unutar HUB385 zajednice pronalazimo, podržavamo i usmjeravamo mlade talente, dajući zamah njihovim tvrtkama, proizvodima i snovima. Mi smo središte inovacija, coworking prostor, platforma za razmjenu znanja i networking za sve koji su spremni zakoračiti u budućnost.