Notícies del la SocE
Crònica Jornada de primavera 2018 de la SoCE. Big Data Science
Els assistents, al voltant de 180 varen gaudir d’una jornada de reflexió sobre les oportunitats i els reptes estadístics que ens ofereix el Big Data.
La Jornada “Big Data Science” va comença amb la presentació per part de la presidenta de la SOCE, Rosa Lamarca, la Directora de l’ETSEIB, Neus Cónsul, que va acollir la Jornada i als assistents, la Sra. Cristina Rovira de l’Idescat, que va remarcar que “El fenomen BigData ha vingut per quedar-se. Tenim una nova cultura per fer front a les dades que ens demana canvis a l’organització. En l’estadística oficial com en altres àmbits, això no serà immediat” i el moderador Sr. Llorenç Badiella que fa fer èmfasi en les 3, 4 (Volum, Varietat, Veracitat i Valor) o 52 Vs del Big Data Science.
La introducció va donar pas als ponents Sr. Pau Tallada, Dra. Malu Calle, Sr. Josep Anton Sánchez-Espigares i Dra. Cristina Bellido, presentats i moderats per en Llorenç Badiella, qui va remarcar la importància dels reptes estadístics del Big Data.
En Pau Tallada va entomar la Gestió de dades estructurades massives amb Big Data, explicant com gestionar conjunts de dades massius estructurats amb tecnologies Big Data. Ens va parlar de les “traces” dins l’era digital que ens acaben donant un volum de dades. Va fer èmfasi del CosmoHub (aplicació Hive) que permet l’exploració i la visualització interactiva d’un catàleg de centenars-milions d’entrades, personalització de dades…També parlà d’Spark i APIs per Python, Java, Scala i R.
La Malu Calle va parlar del Big Data en Biomedicina. Va remarcar que és important saber en profunditat quines metodologies utilitzem i sobretot quines limitacions tenen, quines són les seves debilitats, on fallen: Perquè totes les metodologies fallen. Va remarcar la necessitat de combinar “statistical learning” i “machine learning” de Big Data en el camp biomèdic. La medicina de precisió i la metagenòmica són dos camps que necessiten la combinació de tècniques.
A continuació va tenir lloc un petita pausa cafè on va continuar la discussió sobre el BigDataScience de la SoCE.
En Josep Anton Sánchez-Espigares ens parlà de la Veracitat i Valor: Quan “Big Data” no implica “Good Data”. El primer que cal saber és si les dades són veraces. I després, si tenen valor. Afirma que les nostres dades es podrien veure afectades per soroll i biaix. En el BigDataScience no podem partir com si fossin dades experimentals, i sí aproximar-se a dades observacionals. A Data Analytics tenim analítica predictiva, prescriptiva i descriptiva. A més , darrerament s’està recuperant el terme d’IA (intel·ligència artificial) on la intencionalitat de l’estudi i el disseny ja hi estarien incorporats.
La Cristina Bellido va parlar de Ja tinc les dades, I ara què?. Va remarcar que en les grans empreses tothom necessita un estadístic o un datascientist per donar valor a dades. La gent sap que es pot treure alguna cosa de les dades però no sap ben bé què.Es necessita gent tant tècnica com de l’àmbit específic de treball: una oportunitat als dobles graus amb estadística. Va remarcar que els grans multinacionals estan incrementant el nombre d’estadístics (Rakuten, Amazon…) exemplificant dient que el petroli no té utilitat, només perquè algú es va inventar un cotxe. I qui condueix aquest cotxe? Aquesta és la clau de que les empreses no està invertint en professionals que posen valor i entenen les dades. VA fer èmfasi en que cal una aproximació ‘end to end’ i no enfocar-se només en un model.
La taula rodona que hi va haver a continuació va comptar amb els ponents i el moderador on es varen aprofundir i contrastar alguns dels temes tractats.
L’Àlex Sánchez va fer la cloenda donant Quatre idees. On va dir què faria i què no faria, va fer una recapitulació del que havíem sentit, va donar un parell d’ínputs i ens va parlar d’estratègies de futur. Es va aprofitar la cloenda per recordar als presents la presència de la SoCE en dos congressos que es realitzen properament a Barcelona, la borsa d’ajuts per a la formació, entre d’altres coses i agrair als ponents i als assistents la seva participació en la Jornada.
Podeu seguir el fil a Twitter amb el marcador #BigDataScience o al twitter @Socestadistica.