Se strinjaš, da umetna inteligenca in strojno učenje sodita med ene najbolj vročih tehnologij tega časa? Po podatkih Fortune Business Insights bo globalni trg za strojno učenje do konca letošnjega leta vreden 21,17 milijard USD, medtem ko bo globalni trg za umetno inteligence do konca leta vreden več kot 387 milijard USD. Prav področju umetne inteligence in strojnega učenja pa smo se posvetili tudi na četrti delavnici pospeševalniškega programa Web 3.0., kjer nam je več o omenjeni tematiki razložil dr. Tomaž Curk in nas spoznal s programom Orange Data Mining. V nadaljevanju izveš še več o tem, kaj smo počeli.
Danes umetna inteligenca in strojno učenje pomembno vplivata na naša življenja. Ali veš, da je prav umetna inteligenca zaslužna za to, da ti Netflix priporoči serije, ki so najbolj primerne zate, ali da morda prav tvoj zdravnik s pomočjo umetne inteligence postavi diagnozo? Medtem strojno učenje predstavlja posebno podvrsto umetne inteligence, ki se nanaša na algoritme in tehnike, ki imajo sposobnost samostojnega učenja pri uporabi podatkov, opazovanju in komunikaciji s svetom.
Skozi četrto delavnico Web 3.0. nas je popeljal izredni profesor dr. Tomaž Curk, ki na Fakulteti za računalništvo in informatiko Ljubljana predava bioinformatiko in strojno učenje. Seznanil nas je z uporabo modelov umetne inteligence in strojnega učenja, tehnologijami, ki se uporabljajo za namene odkrivanja vzorcev v podatkih, razumevanju problema in za podporo pri odločanju. Prav tako smo se spoznali in preizkusili z uporabo odprtokodnega programa Orange Data Mining, s pomočjo katerega smo izvedli modeliranje podatkov, odkrivali vzorce ter trende na primeru podatkov o živalskih vrstah.
5 korakov za uspešno odkrivanje uporabnih vzorcev v podatkih
Odkrivanje uporabnih vzorcev v podatkih je lahko pravi trn v peti. Dr. Tomaž Curk nam je razkril 5 ključnih korakov, katerim moramo slediti, kadar delamo s podatki. Najdeš jih v nadaljevanju.
- Razumevanje problemske domene in procesa, ki “generira” podatke
Vse se začne s tem, da sploh razumemo, kaj je problem. Torej razumemo proces, ki se odvija, ga merimo in za tega zbiramo podatke. Če procesa ne razumemo, ne bomo prišli daleč in bomo za to, da dobimo iz podatkov nekaj uporabnega porabili res ogromno časa.
Dr. Tomaž Curk še nam je zaupal:
Sam se ukvarjam s področjem bioinformatike, torej zaporedjem genov, molekul… v osnovi, čeprav se sliši zelo daleč od računalništva, temu ni tako. Pri delu uporabljam metode umetne inteligence na vrsti primerov. Pri svojem delu velikokrat sodelujem s kolegi iz drugih področij, saj je potrebno celostno razumevanje področja, na katerem deluješ. Če nimaš tega razumevanja oziroma domenskega znanja, moraš nujno govoriti z ekspertom, ki ti to znanje da.
Ko podatke razumemo, sledi naslednji korak, in sicer pregled podatkov.
Udeleženec delavnice
- Enostavni vpogled v podatke – osnovne vizualizacije.
Sledi vpogled v podatke. Potrebno je razumeti, kakšne so vrednosti podatkov, distribucije, kaj določena vrednost predstavlja itd. Na tem mestu navadno začnemo z najbolj preprostimi vizualizacijami.
Če lahko že z vizualizacijo razumemo podatke in morda že razumemo problem, nam običajno ni treba iti naprej v neke bolj napredne metode strojnega učenja ali umetne inteligence. V tem primeru se lahko ustavimo že tu.
Najboljši model oziroma najboljše razumevanje podatkov je, kadar lahko na enem mestu, recimo na A4 listu naprintamo podatke in ko jih pogledamo, tudi razumemo ter uporabimo. Vendar so dandanes v večini primerov podatki bolj kompleksni in smo navadno primorani iti v neke globoke nevronske mreže ter kompleksne modele. Vedno moramo razumeti, kaj se dogaja v podatkih.
- Napredne metode opisovanja podatkov (modeliranje)
Če s pogleda podatkov ne vidimo dovolj jasno, za kaj gre, gremo na napredne metode in prav tukaj pride v igro strojno učenje ter metode umetne inteligence.
Dr. Tomaž Curk med predavanjem na delavnici
- Vrednotenje modelov
Na koncu je potrebno model oziroma naše razumevanje podatkov tudi objektivno ovrednotiti.
Zakaj? Ko bo prišlo do uporabe znanja v praksi, moramo vedeti, kaj pričakovati in kakšna bo uspešnost.
- Uporaba modelov v praksi
Zadnji korak, za katerega smo tudi najbolj zainteresirani, je uporaba tega modela v praksi. Lahko zgradimo še ne vem kakšen model, a če ga ne uporabimo v praksi, je bilo to delo zaman. Čas vržen proč.
Na voljo sta dve rešitvi. Prva rešitev se nanaša na to, če ta model uporabi človek v praksi. Temu rečemo podatkovno rudarjenje oziroma razumevanje in odkrivanje vzorcev v podatkih. Druga rešitev se nanaša na to, če ta model uporabi računalnik z razlogom, da vpliva na okolje. V tem primeru že prehajamo na umetno inteligenco in samostojne agende.
Eden takšnih primerov je tudi Google, ki se neprestano uči in iz naših interakcij gradi model, s katerim poskuša razumeti, kaj si želimo, kaj klikamo… to znanje nato uporabi in nam ob naslednjem obisku servira tiste oglase, ki jih želimo videti. Na podoben način delujejo tudi Facebook in ostala omrežja.
Udeleženci delavnice
Do lažje vizualizacije podatkov z Orange Data Mining
Orange Data Mining je odprtokodni program, namenjen predvsem podatkovnemu rudarjenju. Razvili so ga na Fakulteti za računalništvo in informatiko Ljubljana z namenom, da bi z njim na fakulteti poučevali strojno učenje in umetno inteligenco na prijazen način. S pomočjo programarišemo tokove, ki študentom pomagajo pri lažjem razumevanju konceptov. Program omogoča prikazovanje podatkov in modelov, vidnost, odkrivanje skupin ali gručenje, nadzorovano učenje ali modeliranje in vrednotenje.
Dr. Tomaž Curk med predavanjem na delavnici
Kmalu se je izkazalo, da je orodje zelo močno tudi v gospodarstvu, saj ga danes uporabljajo številna uspešna podjetja, kot so na primer Lek, in sicer za optimizacijo njihovih procesov. Nadalje pa se Orange uporablja tudi na številnih drugih področjih, kot je na primer raziskovanje alzheimerjeve bolezni, detekcija novih virusov z genomskimi podatki idr. primeri.
Tudi udeleženci delavnice smo se praktično spoznali z uporabo programa Orange Data Mining, s pomočjo katerega smo modelirali s podatki, odkrivali vzorce ter trende na primeru podatkov o živalskih vrstah.
Te zanimajo glavne prednosti programa Orange Data Mining, na katerih področjih ga lahko uporabljaš in kaj svetuje dr. Tomaž Curk? Poglej si spodnji video.
Več o programu najdeš tukaj.
3 ključna spoznanja z delavnice
Organizatorka delavnice Web 3.0. iz visokotehnološkega podjetja Arctur d.o.o. Tina Črnigoj Marc je izpostavila 3 ključna spoznanja z delavnice:
- Metode umetne inteligence oziroma strojnega učenja veljajo za nadvse zmogljiva orodja za odkrivanje vzorcev v podatkih in pridobivanje novega znanje, ki ga lahko uporabimo v praksi.
- Kljub raznolikosti podatkov in problemov, ki jih rešujemo z uporabo metod umetne inteligence in strojnega učenja, je osnovno zaporedje korakov gradnje napovednih modelov enako. Temelji na neprestanem pridobivanju novih kakovostnih podatkov in iterativnem izboljševanju modelov. Pridobivanje in predpriprava podatkov je navadno najbolj zahteven korak.
- Odprtokodno orodje Orange Data Mining razvijajo na Univerzi v Ljubljani, natančneje na Fakulteti za računalništvo in informatiko. Orodje omogoča vizualno intuitiven, hiter in interaktiven vpogled v podatke in modele. Glavne prednosti tovrstnih orodij so, da ključno pohitrijo proces izpopolnjevanja napovednih modelov in povečajo razumevanje problema.
Tina Črnigoj Marc, Arctur d.o.o.
Poglej posnetek in ugotovi, kaj o delavnici pravi Tina Črnigoj Marc. Posnetek pa poglej do konca, saj te Tina povabi tudi na zadnjo delavnico.
Delavnice se je udeležil tudi podjetnik Robert Dvoršek s startupa Znajdi Se Informatika, ki je v letošnjem letu prejel finančno spodbudo P2 Slovenskega podjetniškega sklada. V spodnjem video posnetku spoznaš, kaj pravi o delavnici.
6 delavnic, 3 srečanja, povezovanje in individualno svetovanje
Pospeševalniški program Web 3.0. izvaja visokotehnološko podjetje Arctur skupaj s podizvajalci Blockchain Alliance Europe z.o.o., Tecos, Razvojni center orodjarstva Slovenije, Yotta Advanced Computing d.o.o. in Dr. Urška Starc Peceny.
Program je namenjem prejemnikom finančnih spodbud Slovenskega Podjetniškega Sklada in vsem podjetjem v zgodnji fazi rasti, ki si želijo pridobiti nova znanja s področja uporabe tehnologij Web3 in uspešno pripraviti svoje podjetje na izzive prihodnosti.
Poglej spodnji video, v katerem ti vodja programa #Web3 Pospeševalnik iz podjetja Arctur Katarina Ceglar razkrije:
Program je sestavljen iz 6 delavnic:
- Uporaba in inoviranje z uporabo tehnologij veriženja blokov (»blockchain«).
- Podjetniške priložnosti, ki jih prinaša računalništvo v oblaku in »edge computing«.
- Metaverse in podjetniške priložnosti virtualizacije.
- Inoviranje z uporabo umetne inteligence in strojnega učenja.
- Priložnosti avtomatizacije, hiperavtomatizacije ter RPA v poslovnem svetu.
- Zbiranje in uporaba velikih podatkov za start-up podjetja. Več informacij in prijava.
POZOR! Prijave na delavnico Zbiranje in uporaba velikih podatkov za start-up podjetja so odprte. Delavnica poteka v četrtek, 15. decembra, med 9:00 in 13:00 v GZS. Izkoristi priložnost in se prijavi najkasneje do 14. decembra.
Program sestavljajo še tri srečanja za podjetja iz portfelja Sklada in neformalno druženje po končani izvedbi.
Termine srečanja najdeš tukaj:
- Aplikacija virutalizacije ter AR/VR tehnologij v poslovanje: 26.1.2023, ura: 9.00-14.00, lokacija: Arctur d.o.o., Industrijska cesta 1a, 5000 Nova Gorica
- Aplikacija blockchain tehnologij v poslovanje: 2.2.2023, ura: 9.00-14.00, lokacija: Gospodarska Zbornica Slovenije (GZS), Dimčeva 13, 1504 Ljubljana
- Uporaba velikih podatkov in AI/ML v poslovanju, 14.2.2023, ura: 9.00-14.00, lokacija: Gospodarska Zbornica Slovenije (GZS), Dimčeva 13, 1504 Ljubljana
Prav tako so udeleženci programa upravičeni tudi do individualnih svetovanj. Podjetjem, ki bodo izkazala največ potenciala ter potrebo po individualnem svetovanju bodo strokovnjaki na področju Web3 to tudi zagotovili. Individualno svetovanje zajema:
- Svetovanje pri razvoju novih produktov in poslovnih modelov,
- Svetovanje pri prototipiranju,
- Svetovanje pri apliciranju in uporabi tehnologij Web3.
Vsako podjetje, ki se bo odločilo za individualno svetovanje bo imelo na voljo od 5 do 30 ur svetovanja, ki ga bodo izvajali strokovnjaki na področju Web3.
Za prejemnike finančnih spodbud na voljo številni vrhunski Startup Plus programi
Slovenski podjetniški sklad pa za portfeljska podjetja organizira tudi številne druge vrhunske podjetniške programe, kot so Prodajni pospeševalnik, Startup klinika, SK GROWTH, konferenca Podim, HardwareSTART in mnoge drugi. Vsebinski programi učinkovito dopolnjujejo finančne produkte P2, SK75 in SI-SK, ki slovenskim zagonskim podjetjem zagotavljajo od 54.000 EUR do 600.000 EUR zagonskih sredstev.
###
Program sofinancirata Slovenski podjetniški sklad in Evropska unija, in sicer iz Evropskega sklada za regionalni razvoj. Izvaja se na podlagi programa Vsebinska podpora prejemnikov sredstev (MSP) v obdobju od 2018 do 2023 v okviru Operativnega programa za izvajanje evropske kohezijske politike v obdobju 2014-2020.