Campus d’Intel.ligència Artificial

IDEAI-UPC en col.laboració amb Fundesplai

 

Taller

El valor de la dada per la presa de decisions/seguretat de les dades

 

En aquest taller analitzarem com s’extreu valor a partir de dades de ciutadania sobre la base de la tecnologia INSESS que l’equip IDEAI d’aquest taller va desenvolupar durant la pandèmia

 

 

Part I: Projecte INSESS-COVID19

Tindreu una primera presentació del projecte de pandèmia que va generar aquesta tecnologia i les possibilitats que té per noves aplicacions. Si teniu interès a saber més de INSESS-COVID19 podeu consultar la web del projecte

Ateneu a la presentació que farà la directora del Campus d’IA (Karina Gibert)

 

 

Part II: Recollida de dades

Després connecteu-vos a aquesta web i accediu al següent qüestionari que s’ha cocreat amb vosaltres mateixos.

Cliqueu aquí per obrir el qüestionari

 

Espereu que la professora us mostri el fitxer que recollirà les vostres dades al núvol abans de respondre el qüestionari. Quan envieu les vostres respostes podreu veure en temps real com arriben al núvol

 

 

Part III: Anàlisi de les dades recollides i generació intel.ligent d’informes

 

El procés que iniciarem ara és una mica delicat i requereix de tota la vostra atenció

Seguiu amb cura les instruccions dels professors. Llegiu amb deteniment:

  1. Crear una carpeta a l’escriptori del PC que es digui “tallerINSESS”
  2. Baixeu-vos les dades a analitzar del següent enllaç
    ENLLAÇ A DADEs
    i guardeu-les a la carpeta tallerINSESS amb el nom
    dadesoriginals.csv
  3. Baixeu-vos la carpeta analisi de codi R i guardeu-la a la vostra carpeta “tallerINSESS” (ja conté el fitxer de metadades). ENLLAÇ a CodiR
  4. Decomprimiu el fitxer
  5. Executeu el fitxer de codi 2Recodifcacionsv2.R de la carpeta analisi,zip que farà una bona part del preprocessament de dades
  6. Verifiqueu que us ha creat un fitxer dadesPreprocessat.csv amb les dades del qüestionari
  7. Executeu el fitxer de codi 3TotaldescriptivaClean5Shortv10.Rmd de la carpeta analisi.zip que ha de generar el Word amb informació de totes les vostres dades
  8. Executeu el fitxer

Observeu el Word que ha creat automàticament l’script i quant detall podem tenir sobre el que diuen les dades

Part IV: Anàlisi territorial de les dades

El Xavi us mostrarà com amb aquestes mateixes dades i una variable territorial (el municipi) podem fer representacions geogràfiques i veure les dades des d’un altre punt de vista

 

Part V: Anem més enllà: Tipologia de ciutadans

Un cop entes com son les dades en termes generals, es pot anar més enllà amb una tècnica d’intel.ligència artificial no supervisada que es diu clustering i identifica grups de ciutadans similars i distingibles entre ells

El clustering és una tècnica que s’utilitza àmpliament en màrketing, per fer el que s’anomena “segmentació de clients”, però que resulta molt útil per tal que un govern, un hospital, o un parc natural entengui quin tipus de ciutadans, usuàris o visitants té.

L’script d’R que us donarà suport per a trobar aquesta agrupació de ciutadans que descriuen bé com ens comportem respecte del malbaratament de recursos és el següent: ClusteringCasalv2. R

En aquest script a més d’identificar quins són els grups s’hi afegeixen tècniques de Profiling que han de permetre entendre la naturalesa d’aquests grups i interpetar-los.

Baixeu-lo, deixeu-lo a la carpeta tallerINSESS i carregueu-lo a R i veieu què passa