Bogdan Ichim: „Sunt din ce în ce mai mulți consumatori de Machine Learning, chiar dacă ei nu știu încă asta”
Machine Learning nu e tehnologia viitorului, spune Bogdan Ichim, conferențiar doctor la Facultatea de Matematică și Informatică din București și consultant Termene pe zona de Data Science. E de fapt tehnologia prezentului, aplicată deja în viața de zi cu zi a multora dintre noi, și chiar una a trecutului, având în vedere că rădăcinile sale se întind de-a lungul a 200 de ani.
Asistăm acum la o democratizare a acestei tehnologii, explică el: dacă înainte accesul era restrâns la o tranșă foarte selectă de companii, acum ea a devenit accesibilă și pentru companii mai mici sau chiar pentru publicul larg. Pe de altă parte, se poate spune că a avut loc și o adevărată revoluție: tehnologia asta e în spatele multor companii care au avut un succes extraordinar în ultimii ani.
Spune-mi te rog un pic despre backgroundul tău.
Am făcut studii în România, am obținut licența, care a fost urmată de un master, la Facultatea de Matematică si Informatică din cadrul Universității București. În paralel am urmat cursuri și la Facultatea de Automatică și Calculatoare din cadrul Politehnicii București. După care am plecat în Germania, unde am făcut un doctorat în matematică. Trebuie însă menționat că în toată această perioadă am lucrat la limita dintre matematică și informatică. Am făcut și două post-docuri în Germania, care au fost mult mai axate pe crearea de software matematic. Zona în care am lucrat atunci era mai degrabă de High Performance Computing (HPC). În 2009 m-am întors în România, unde am început să lucrez la Institutul de Matematică al Academiei Romane. Am rămas pentru multă vreme în zona asta, de matematică combinată cu scrierea de software. Eram, cred, printre foarte puținii din România care făceau așa ceva.
După care, în 2019, m-am mutat la Facultatea de Matematică și Informatică din cadrul Universității București, la Departamentul de Informatică, unde este principalul meu loc de muncă în prezent. De asemenea, din 2017 am început să am în paralel și colaborări cu diverse companii în zona de Data Science.
La Termene sunt consultant pe probleme de Data Science, lucrez part-time. Pot spune că această colaborare e printre cele mai reușite, e una dintre puținele din care se obțin niște rezultate clare și utile, cu impact. Nu tot timpul proiectele de cercetare dau și rezultate: se lansează multe proiecte, dar puține duc la ceva tangibil și concret, care să fie interesant pentru o clasă largă de potențiali utilizatori.
Ce faci, mai concret, pentru Termene? Încercăm să explicăm pentru un public larg.
În principiu, e vorba de un proiect de Data Science și aș sublinia asta. Un proiect în care folosim ca materie primă date și încercăm să extragem niște informații suplimentare din ele, informații care nu există în colecția de date primare. Una dintre activitățile Termene este colectarea de date publice, ce pot oferi informații și în forma lor brută, dar care de multe ori nu pot fi utilizate ca atare de către cineva care nu are experiența lucrului cu aceste date. Ca să fac o paralelă, este ca într-o rafinărie: ai la dispoziție petrolul brut pe care nu-l poți băga în rezervorul de la mașină. În situația noastră, datele sunt echivalentul petrolului. Și atunci intervine un proces de rafinare a acestor date, din care ies niște produse finite, echivalentul benzinei, care pot fi ulterior utilizate ușor de către publicul larg.
Rolul meu e atât de consiliere în legătură cu felul în care se poate face rafinarea asta și de a stabili cam care ar fi putea fi arhitectura sistemului utilizat. Deci inclusiv detalii în legătură cu felul în care trebuie procesată baza de date primare și ce algoritmi pot fi folosiți mai departe pentru a extrage informații utile din aceste date. Printre altele, am scris niște pachete software care sunt prototipuri funcționale pentru utilizarea concretă a acestor date. Eu fac în principiu o schiță funcțională și mai departe sunt programatori specializați care iau această schiță și o pun în producție, astfel încât în final să fie accesibilă pentru publicului larg. Aceasta se face în așa fel încât pe de o parte să poată fi integrată de sistemul Termene, iar mai departe accesată în mod simplu de către utilizatori.
Ce înseamnă pentru tine să lucrezi în zona de Machine Learning? E deja un stereotip să spunem că e „tehnologia viitorului”.
E o tehnologie a prezentului, de fapt. Istoric vorbind, tehnologia asta are vreo 200 de ani. Mari progrese s-au făcut însa în ultimii 30-40 de ani, pentru că a apărut și puterea de calcul necesară: calculatoarele au devenit mai puternice, am început să înțelegem mai bine cum funcționează lucrurile astea și s-au obținut niște rezultate cu adevărat spectaculoase în acest domeniu. Dar calcule de Machine Learning se făceau și în anii ’50-60, uneori chiar de mână: existau săli întregi cu oameni care nu făceau altceva decât să execute de mână astfel de algoritmi, acum însă toate aceste calcule sunt făcute de calculator.
Putem vorbi în ultima vreme de o democratizare a acestei tehnologii: ea a devenit accesibilă și pentru companii mai mici sau chiar pentru publicul larg, pe când înainte accesul era restrâns la o tranșă foarte selectă de companii. Pe de altă parte, se poate spune că a avut loc și o adevărată revoluție: tehnologia asta este în spatele multor companii care au avut un succes extraordinar în ultimii ani. Vorbim despre companii cum ar fi Google, Facebook, Amazon, Netflix sau Tesla. Folosind Machine Learning poți particulariza rezultate de căutare, recomandări sau produse pentru un anumit client, ceea ce se întâmplă la Amazon, de pildă. În cazul Amazon, totul a pornit de la un algoritm de Machine Learning: ei au început cu o librărie în care niște oameni scriau recomandări pentru cărți interesante de citit și folosind Machine Learning au înțeles cum pot particulariza recomandările pentru fiecare client sau carte. Pe scurt, au înțeles cum pot să folosească această tehnologie și restul a devenit istorie.
Deci cu certitudine nu e ceva nou. Mai degrabă noi am aflat de ea abia acum, pentru că ne aflăm în faza în care se democratizează tehnologia. Eu am o carte despre inteligența artificială publicată în România în 1996, pe care am cumpărat-o când eram student, în anul al II-lea de facultate. Problema era că noi nu prea știam cum să folosim tehnologia asta și nici nu aveam puterea de calcul necesară.
Prin 2009-2010 au apărut niște rezultate absolut spectaculoase obținute folosind algoritmi de Machine Learning care mie mi-au atras atenția, dar personal mi-a luat 4-5 ani până să mă prind despre ce-i vorba, atât de lipsiți de informații eram în realitate. Mai ales că la vremea respectivă nu prea aveam la dispoziție nimic instituțional. Cei care știau cum funcționează această tehnologie nu prea s-au grăbit să țină cursuri despre cum poate fi aplicată către publicul larg. De exemplu, abia în 2019 s-a lansat la Universitatea București un master de Data Science. Astfel, acest tip de informații a devenit acum accesibil pentru oricine dorește să afle despre ce-i vorba. Pe scurt, oricine vrea să afle mai mult se poate înscrie la acest master ca să înțeleagă dedesubturile acestei tehnologii și cum poate fi ea aplicată în Data Science.
Pe unde e Termene în momentul ăsta?
Pentru România sau pentru Sillicon Valley? Pe piața de la noi cred că sunt foarte puține companii care folosesc efectiv această tehnologie. Sunt companii care tatonează, care lansează mici proiecte, încearcă să facă ceva pe tema asta, dar nu prea cred ca au făcut ceva efectiv. Depinde însă cu cine te compari. Nu te poți compara, de pildă, cu Amazon, care a înțeles cum funcționează lucrurile astea acum 20-30 de ani.
Am vorbit despre trecut și prezent. Cam pe unde vezi tu viitorul Machine Learning?
În mod cert, sunt din ce în ce mai mulți consumatori de Machine Learning, chiar dacă ei nu știu încă asta. De fiecare dată când intri pe Facebook primești informații personalizate: e un algoritm de Machine Learning care-ți personalizează conținutul pe care-l citești. Multe dintre aplicațiile de pe telefoanele mobile folosesc diverși algoritmi de Machine Learning și chestia asta se va tot extinde.
Ca să dau un exemplu legat strict de ce face Termene: unul dintre produsele pe care le-am dezvoltat recent este o funcție de predicție a insolvenței companiilor. În principiu, acest produs încearcă să-ți spună dacă o companie va intra în insolvență în viitorul apropiat sau nu. În sine este gândit ca un produs business to business. Adică o firmă are o relație comercială cu o altă firmă și folosește produsul dacă vrea să verifice dacă firma partenera va da sau nu faliment. Dar produsul în sine este foarte interesant și pentru publicul larg în general, din punctul meu de vedere. Unul dintre lucrurile pe care le-am observat dezvoltând acest produs este că în România, între companiile care dau faliment sunt multe firme de construcții. Atunci eu mă gândesc la plătitorul de avans pentru un apartament, care este un personaj foarte des întâlnit prin România: sunt oameni care plătesc zeci de mii de euro pe niște desene frumoase. Acest potențial utilizator poate să verifice înainte firma căreia urmează să îi încredințeze banii, pentru a vedea dacă nu cumva ar putea da faliment peste o lună și să dispară astfel împreuna cu avansul încasat. Folosind acest nou produs Termene, utilizatorul se poate astfel proteja de un fenomen de altfel destul de răspândit în România. Cam așa cred că va arăta viitorul: vor exista tot mai multe asemenea produse si servicii foarte specializate, care îi vor permite utilizatorului să facă lucruri complet inaccesibile acum zece ani.
Tehnologia sperie, în general. Pe tine te sperie ceva în zona asta?
Orice tehnologie poate fi folosită într-un un scop pozitiv sau negativ. Tehnologia sta în mâna utilizatorului. De exemplu, una dintre cele mai vechi tehnologii care a fost folosită de către om este cuțitul; același cuțit poate fi folosit atât la tăierea unei pâini, cât și la uciderea unui om. Nu tehnologia în sine e rea sau bună, ci felul în care ea este folosită.
[shortcode_newsletter]