Per studiare l'innovazione delle Piccole e Medie Imprese (PMI), di solito, si esaminano, come fonti di dati primari, i bilanci d’impresa o i risultati d’indagini che collezionano informazioni sui miglioramenti apportati ai processi e/o ai prodotti. Purtroppo, queste fonti d’informazione mostrano alcuni limiti quando applicate alle PMI.
Il gruppo di ricercatori dell’ Osservatorio WebSight, invece, esplora il codice HTML del sito web di un'impresa, partendo dal presupposto che il modo in cui l'HTML è impiegato nella creazione di un sito web aziendale fornisca indicazioni sulle capacità di innovazione dell'azienda.
A Caterina Liberati, docente di Statistica Economica del Dipartimento di Economia, Metodi Quantitativi e Strategie d’impresa e direttrice dell’Osservatorio, abbiamo chiesto di spiegarci il loro lavoro e quali vantaggi può avere.
Nella vostra ricerca più recente, avete monitorato un campione di PMI italiane del settore manifatturiero…
Sì, il campione iniziale era di oltre 42.000 imprese, che è stato ridotto a 680 imprese dopo le procedure di matching tra osservazioni che ci hanno permesso di poter effettuare la comparazione statistica robusta tra PMI innovative e PMI non innovative.
Come si è svolta nello specifico l’attività di monitoraggio?
Anzitutto recuperiamo le informazioni relative alle imprese dalla piattaforma AIDA-Moody’s che contiene, oltre agli indicatori basati sul bilancio, anche le informazioni relative alla struttura dell’impresa (locazione geografica, settore NACE, numero degli addetti) e l’URL del sito web aziendale (quando presente). Effettuiamo dei controlli di coerenza, per accertarci che i siti corrispondano effettivamente alle PMI monitorate. In seguito, scarichiamo i siti web e costruiamo una serie di indicatori che sintetizzano la struttura, la complessità e la tecnologia presente.
A differenza di altri che effettuano questa attività di scraping – e analizzano il testo (descrizioni, etc) del sito web – noi analizziamo il codice HTML. Il primo, infatti, ha una grande potenzialità in fase esplorativa ma presenta qualche insidia quando impiegato per costruire modelli predittivi. Il testo, infatti, è la parte del sito più variabile, in quanto viene aggiornato con grande frequenza. Ciò genera una instabilità nei dati che rende molto difficoltosa la costruzione di modelli predittivi efficaci. Il codice HTML, invece, proprio per le caratteristiche di un linguaggio di programmazione, è più standardizzato (ad esempio non cambia a seconda della lingua del sito web), computazionalmente è più gestibile e meno soggetto a volatilità.
Cosa avete riscontrato?
Il codice HTML del sito web di una impresa innovativa è differente da quello di un’impresa meno innovativa. Essendo la prima più orientata alla commercializzazione di nuovi prodotti e tecnologie, ci aspettiamo che abbia un sito sia ben indicizzato dai motori di ricerca e dai social network, un design del sito moderno (layout, complessità, tecnologia…) e rispondente alle richieste degli utenti. Tutto questo avviene grazie a un uso appropriato del codice HTML.
Siti web come quello descritto, inoltre, per essere visualizzati in modo efficace su dispositivi mobili, hanno necessità di particolari tag che definiscono le funzionalità tecniche inserite nel sito. Per esempio, abbiamo riscontrato che le imprese innovative usano maggiormente dei tag “più recenti” (HTML5), mentre le meno innovative usano tag deprecati o un layout molto più statico (maggior uso di tag per costruire tabelle). Il codice HTML racconta quindi anche la capacità dell’impresa di aggiornarsi rispetto ad un mondo tecnologico che cambia.
Oltre all’innovazione, l’Osservatorio si occupa anche dell’insolvenza delle PMI, creando modelli predittivi che possano “svelarci” la probabilità di fallimento di una PMI sempre dallo studio del sito web aziendale. In questo caso l’aggiornamento costante del sito è indice del fatto che l’impresa è viva e attiva.
Quale vantaggio ha, diversamente da altri strumenti di indagine, lo studio del codice HTML del sito web?
In primis, l’informazione raccolta da un sito web aziendale è più aggiornata rispetto a quella ottenibile da un bilancio o da un’indagine che per motivi di realizzazione necessita di tempi più lunghi. Inoltre, non secondario, l’obiettivo che ci siamo posti con queste attività di monitoraggio, è quello di coprire un vuoto informativo sulle imprese. Facciamo un esempio: la Community Innovation Survey, indagine sulle imprese innovative realizzata dall’Istat per conto di Eurostat, si basa su un campione che include tutte le imprese di media grandezza (da 50 a 249 dipendenti) mentre le piccole imprese (da 10 a 49 dipendenti) sono presenti a rotazione. Le micro-imprese (0-9 dipendenti), invece, sono sempre escluse da questa indagine per la difficoltà di reperire le informazioni.
Questo è un problema, soprattutto per il nostro Paese che ha un tessuto produttivo in cui le imprese dimensionalmente più piccole contribuiscono significativamente in termini di addetti e valore aggiunto. Le micro-imprese costituiscono oltre il 40 per cento del numero di PMI e producono più del 25 per cento del valore aggiunto del nostro Paese. Il monitoraggio che realizziamo non solo ci permette di coprirle, ma è anche pratico e diretto: non occorre attendere che le imprese rispondano a questionari e sondaggi perché le informazioni sono prese direttamente dai siti esistenti. Si ottiene un vantaggio sia temporale sia di completezza dell’informazione.