Seguretat i privacitat, clau de la confiança


El camí cap a la smart city suposa una oportunitat de millora de la gestió, d’optimització de recursos, prevenció, seguretat, estalvi i eficiència, sens dubte. Si s’aprofita bé l’oportunitat, és un camí no només a nivell administratiu, si no també de gestió política i administrativa si es lliga bé amb govern obert, open data i transparència (de fet, no s’hauria d’entendre una cosa sense altra, donat que son dues cares de la mateixa moneda). En última instància, doncs, el camí cap a la smart city ens pot dur a un canvi social: una major participació en la presa de decisions, una major informació i per tant una major implicació de tota la societat en el govern de si mateixa (hom podria arribar a pensar en alguna mena de democràcia assembleària total mitjançant petits gests diaris, micro-revisions i aportacions d’informació).

Però aquest camí ni és curt, ni està exempt de desviacions ni perills.

Un amic em comenta que el perill de fer ciutats més connectades i més centralitzades és que aquestes siguin més vulnerables, i no li falta part de raó:

  • Els sistemes de captació de dades poden ser totalment passius, i poden emetre dades en obert (una mena d’open big data plà) o bé només donar-les a determinats centres receptors (es poden establir recol·leccions de dades des de determinats punts, o l’enviament de dades des dels sensors a recol·lectors identificats, per exemple)… sigui com sigui, només emetran dades. Quin perill pot haver-hi en l’emissió de dades de volum de trànsit, o d’intensitat lumínica, o consum d’aigua o contaminació? No gaire.
  • Els actuadors, per contra, poden obrir i tancar semàfors o vàlvules: caldrà doncs filar molt prim amb la seguretat d’aquests elements, i son tasques que ja s’estan fent. Sona apocalíptic? Potser… però si sistemes vitals com distribució d’aigua o electricitat s’automatitzen, poden ser accedits remotament, i per tant s’han de protegir, i de la mateixa manera s’ha de fer amb qualsevol actuador.

Es tracta doncs de veure la smart city com un sistema flexible, capaç de llegir el seu entorn i respondre a canvis, d’extreure patrons i proposar millores, però sense substituir la gestió sobre el terreny, en tot cas millorant-la i ampliant-la.

Les dades generades pels ciutadans (xarxes socials, interaccions, desplaçaments, geolocalització) també seran un conjunt molt important per estudiar, donat que reflecteixen el pols viu de la ciutat. I aquest, precisament, és un altre camp a tenir en compte: tant la seguretat com la privacitat de les dades dels “sensors ciutadans“:

  • Qualsevol enviament de dades des d’un dispositiu mòbil o xarxa social porta un conjunt de metadades que permet perfilar o identificar la persona que l’emet, i per tant caldrà disposar també de mecanismes que garanteixen l’anonimat de l’enviament, per tal de poder tractar les dades en brut sense identificar ningú (pensem en desplaçaments o el seguiment de tags en xarxes socials relacionats amb la ciutat, en entrades/sortides d’edificis públics o equipaments per valorar-ne l’ús…)
  • La interacció amb serveis i aplicacions on-line (apps, web mòbil, canals on-line diversos) o els sistemes de videovigilància poden acabar conformant un registre de desplaçaments i accions de caire sensible que ha de permetre ser ben custodiat, anonimitzat i esborrat, en funció de les circumstàncies (cal garantir la no traçabilitat horària o geogràfica per garantir la privacitat, per exemple).

Com? De nou, amb transparència i Open Data, per una banda; i d’altra, amb la publicació del codi font que es faci servir per recollir (1) i anonimitzar aquestes dades: només la revisió a nivell de codi font del software que s’estigui usant, i la seguretat que allò publicat és el que s’està usant pot donar garanties sobre el tractament de les dades.

Com dèiem, no és un camí curt, però si s’hi arriba serà un gran canvi, tant pel resultat final com pel que haurem après arribant-hi (a nivell tant tècnic com ciutadà, social).

(1) Per exemple, Sentilo és una plataforma de base per una estructura de smart city, amb el codi font publicat a GitHub, que permet la lectura i actuació dels sensors i és expansible modularment.

Big data: un doble repte per l’Administració

El big data és el següent pas de la xarxa per explorar i explotar comercialment. El conjunt immens d’informació de tot tipus que es genera i s’emmagatzema, i la possibilitat d’interconnexió de les diferents sitges i de recerca i extracció de dades, resultats i tendències és un mercat que ningú vol desaprofitar.

L’Administració, com a actor econòmic i social de primer ordre, també té interessos i és part en aquest terreny: d’una banda, com a impulsora de solucions que facin ús d’aquest concepte i de proveïdora de dades; de l’altra, actuant com a reguladora i aplicant lleis i controls per garantir la privacitat de la ciutadania.

En el primer cas, l’Administració Local (sobretot) comença a jugar un paper molt important com impulsora en projectes de smart cities, que fan un ús molt intensiu del big data: la sensorització dels aparcaments i del trànsit en viu, la il·luminació pública i el reg, per esmentar els exemples més habituals, necessiten de l’extracció de patrons de comportament i la deducció de necessitats dels grans conjunts de dades que es generaran, per poder millorar l’eficiència i els serveis als ciutadans i la seva gestió.

Sembla clar que un primer conjunt de dades com sensors d’aparcament per camp magnètic o per infraroigs, o bé sensors d’humitat o de llum no han de ser un gran risc a la privacitat de les persones, però també estar atents a l’ús de dades de les càmeres de trànsit en temps real, que si que poden identificar vehicles individualment, per exemple, i que també poden fer-se servir com solucions de smart city per avaluar la càrrega de trànsit en vies i redirigir el flux rodat mitjançant panells o semàfors, o l’ús de mòbils per buscar aparcaments, rutes o fer pagaments de serveis públics, dades que també es poden creuar posteriorment. Aquest segon conjunt de dades si necessita de processos d’anonimització, més si es té en compte que en molts casos aquests serveis estaran en mans d’empreses privades que poden no tenir tant clar el dret de privacitat.

En el segon cas, com a reguladora, la mateixa Administració ha de ser conscient del dret a la privacitat, i ha de vetllar per la seva aplicació, mitjançant la redacció de lleis i mesures protectores. Ho ha de fer amb l’aplicació de mesures de control a les empreses que tractin amb aquesta informació, i donant exemple aplicant-se ella mateixa aquesta regulació en els seus propis processos interns: gestiona immensos paquets de dades molt sensibles de les persones (personals, econòmics, sanitaris, socials) que ara per ara encara poden estar en sitges diferents (donant una falsa sensació de seguretat) però que a mesura que avancin les capacitats d’interconnexió entre administracions poden donar lloc a temptatives d’usar-les en conjunt, ja sigui ella o per part de tercers.

L’Administració, doncs, s’enfronta a un doble repte al món del big data: saber impulsar solucions i promoure el seu ús, generant valor econòmic i social, i alhora fer que tot això es desenvolupi dins del marc del respecte a la privacitat, davant de la temptació i la pressió de grups amb diferents interessos que puguin voler barra lliure de dades.

Qualitat i conservació de les dades

És suficient el tractament i les tècniques de la ciència informàtica per garantir la qualitat i la perdurabilitat de les dades que emmagatzemem?

Històricament s’han desenvolupat teories i mecanismes per garantir la certesa i la exactitud de les dades recollides, la no repetició de les mateixes, s’han estudiat les estructures més òptimes d’emmagatzematge per cada cas i la millor manera de reflectir diferents tipus d’informació. Les formes normals de les bases de dades, els arbres B, les bases de dades relacionals o orientades a objectes o les més modernes distribuïdes, l’estudi de les relacions entre les dades, etc., ja fa molts anys que està inventat i aplicat, cada vegada més refinat i més optimitzat.

A mesura que els volums de dades han anat creixent, s’han anat desenvolupant paral·lelament noves tècniques i motors de cerca, nous índexs i millors automatismes per millorar els temps de resposta, s’han implementat mecanismes per garantir la no pèrdua de les dades (backups, redundàncies, sistemes distribuïts, replicacions de sistemes, miralls on-line) i el ràpid accés a les mateixes, s’ha guanyat en flexibilitat d’accés i ens hem tret de sobre (fins a cert punt) la tirania dels bits, ens permetem el luxe de poder dissenyar bases de dades sense haver-nos de preocupar (en excés) de com s’emmagatzemaran.

Es dissenyen sistemes que capten molta informació per la gestió de determinats processos i sistemes, i que automatitzen cada vegada més feines repetitives i faciliten la optimització de la resta de tasques.

Però és suficient tot això? Tot el tractament de les dades del que parlo dalt és eminentment sintàctic: les dades son correctes a nivell de format, i s’emmagatzema allò que el sistema necessita per als seus processos actuals, si… però es dissenyen encara els sistemes pensant de manera aïllada, des d’un punt de vista eminentment tècnic i utilitari de la informació, però no es pensa (més enllà d’algunes metadades de registre) en complimentar i enriquir la informació amb metadades que donin informació semàntica sobre l’entorn d’aquell conjunt, de manera que facilitin la conservació en un futur de la mateixes dades, o millor dit, no tant la conservació com la comprensió d’aquelles dades i per tant facilitin la integració amb d’altres, o la generació d’encara més informació a partir d’aquestes dades, ja siguin documents, estadístiques o resultats estadístics a partir de mineria de dades. Exemples podrien ser registres de modificacions, generacions d’històrics, signatura de la informació, no-repetició de les dades ja existents en altres llocs…

En resum, cal anar una mica més enllà de la gestió pura i dura de la informació actual: què fem quan una aplicació es migra? Què passa amb les dades velles? Tenen alguna validesa, més enllà del que es passa al següent aplicatiu o versió? Els documentalistes arxivers/gestors de documents ja fa temps que parlen d’aquestes qüestions i que les apliquen a la qualitat de les dades com a documents, i de la preservació i la meta-informació que els mateixos ens poden donar en un futur (la preservació dels documents a llarg termini en entorns digitals és un problema complex)

Cal preguntar-se aleshores si aquests mateixos conceptes no s’haurien d’aplicar també al disseny de les bases de dades de suport a les aplicacions, pensar des d’un primer moment ja en els resultats posteriors i les explotacions que es faran (de ben segur) d’aquelles dades, i per tant no guardar només les dades estrictament necessàries per l’aplicació en aquell moment ans també metadades, informació de registres, disposar-les de manera que es faciliti el creuament posterior amb d’altres dades o es facilitin estudis històrics evolutius i que es garanteixi també la preservació de les dades a llarg termini d’una manera no estrictament tècnica, sinó també semàntica: de què ens serviria tenir tabletes en cuneïforme si no sabem desxifrar-les? de què ens serveix saber llatí si no entenem la societat on es parlava? De la mateixa manera, de què ens serviria tenir conjunts de dades dels quals no sabríem com han evolucionat perquè guarden només una instantània de la informació, no l’evolució històrica, per exemple?

Aquest, a més, és un problema diferent del fet de cercar en quantitats ingents d’informació (la tan actual big data, abans mineria de dades): cercar dades, creuar-les i extreure’n nous resultats, generar nova informació, és important, és clar. Però per tal que la informació resultant d’aquestes operacions tingui qualitat, la informació original, la que nosaltres estem deixant en aquest moment, també ha de tenir-la, el que vol dir tenir en compte alguns dels punts esmentats dalt.

Això, a més, implica un canvi en la cultura de treball de les organitzacions que treballen amb la informació com a principal actiu o eina de gestió:

  • implica crear equips multidisciplinaris en la creació inicial de les bases de dades: informàtics, documentalistes, el propi gestor tradicional de la informació
  • implica que tothom es faci seus els projectes i entengui el que es demana i el que es vol treballar
  • implica una visió no tancada en les pròpies necessitats del moment si no en pensar a llarg termini: emmagatzematge, reserva, utilitat
  • implica conèixer altres sistemes d’informació que treballin amb informació relacionada per veure si els podem enriquir o ens poden aportar quelcom

En definitiva, pensar en les dades de manera no només sintàctica sino també semàntica i de conservació és el camí per garantir una bona qualitat de les mateixes ja en origen i facilitar enormement tasques posteriors de neteja i enriquiment, conservació de documents i/o conjunts autocontinguts i robustos, i per tant en la obertura al públic de dades de més qualitat, ara que s’obre el camí de l’open data i la transparència.