Il Web Semantico al servizio delle aziende!
Sicuramente sapete cosa è il Data Warehousing (anche io lo sapevo, ma una rinfrescatina può solo far bene, quindi vediamo come ce lo spiega wikipedia).
Questo post nasce dall’intelligente domanda di una lettrice del blog che mi ha sottoposto il seguente quesito: “il web semantico può essere utilizzato dalle aziende per ridurre i costi di data warehouse? Se si, attraverso quale procedimento?”.
Quando ho letto la domanda mi sono detto: “bella domanda!”. Ma soprattutto:
Cosa c’entra il Web Semantico con il Data Warehousing?
Ammettendo da subito la mia ignoranza su tale aspetto, ho ringraziato la lettrice e mi sono informato. E colgo l’occasione per ringraziare ancora Sara per avermi permesso di approfondire questo interessantissimo argomento.
Ieri e oggi: cambiano le tecnologie ma i problemi restano…
La prima considerazione importante da fare su questo argomento riguarda la prima fase del processo di Data Warehousing, ovvero la fase di ETL.
Ancora oggi le sorgenti di dati a disposizione di una azienda continuano ad essere eterogenee, nonostante l’alto grado di digitalizzazione raggiunto ai giorni nostri. In passato l’eterogeneità era generata dalla copresenza nelle realtà aziendali di dati memorizzati in Database e dati presenti su supporti non informatici (essenzialmente materiale cartaceo), e lo sforzo maggiore richiesto alle aziende per effettuare il data mining era proprio quello di estrarre i dati dalle sorgenti non informatizzate per caricarli in un database e renderli disponibili ai processi di data mining.
Oggi il problema è diverso; nonostante la quasi totalità dei dati sia presente all’interno dei database, l’evoluzione tecnologica e aziendale, oltre a portare miglioramenti, ha portato anche nuove “sfide”: la crescita delle aziende e le acquisizioni aziendali, i confini delle intranet che lentamente svaniscono e si integrano con internet, le architetture orientate ai servizi (SOA), hanno portato alla copresenza all’interno delle realtà aziendali di sorgenti di dati (essenzialmente database) eterogenee, in quanto realizzate con tecnologie differenti, a volte proprietarie, e sicuramente difficilmente integrabili ed accessibili ai processi di data mining.
Infatti bisogna ricordare che il modello relazionale (che è lo standard de facto nei database aziendali) priva le informazioni della loro natura trasformandole semplicemente in dati e li ritrasforma in informazioni solo attraverso opportune query.
Quindi nel momento in cui un’azienda si trova di fronte ad un insieme di database eterogenei avrà si una mole rilevante di dati, ma tali dati saranno privi di informazioni utili e le procedure di integrazione diventano lunghe, costose e soprattutto poco scalabili. Piccole modifiche alle basi di dati (aggiunta di tabelle, modifica del tipo di dati) possono portare ad avere informazioni inconsistenti, che per un’azienda che vuole essere competitiva sono un vero e proprio danno, il cui costo è incalcolabile.
Ho capito! La soluzione non può essere che il Web Semantico!
Esatto! In tale scenario il Web Semantico può venire in aiuto delle aziende.
Come visto in precedenza ( articolo introduttivo al Web Semantico), alla base dell’idea delle tecnologie semantiche c’è la realizzazione di una base di conoscenza che si basa sui linguaggi ontologici (vedi articoli sulle Ontologie e sulla Rappresentazione della Conoscenza). La base di conoscenza, a differenza di una base di dati, è pensata per memorizzare ed estrarre informazioni e non dati, è perfettamente scalabile e la tecnologia utilizzata (linguaggi ontologici, come RDF e OWL) è standardizzata e non proprietaria. Tutte caratteristiche di rilievo nel contesto appena esaminato.
Inoltre, in un contesto di Data Warehousing tradizionale, la fase di estrazione delle informazioni rilevanti (Data Mining) era riservata ad una stretta cerchia di “eletti” (gli esperti del settore), che ovviamente rappresentavano un costo rilevante per l’azienda, specialmente nel momento in cui la base di dati cambiava continuamente.
Con le tecnologie del Web Semantico le interrogazioni possono essere effettuate in linguaggio naturale (o quasi), per cui non è più necessario l’intervento continuo di esperti. Inoltre, alla base di un sistema di rappresentazione della conoscenza vi sono i servizi di reasoning, che permettono di estrarre, tramite semplici interrogazioni in linguaggio naturale, nuova conoscenza a partire dalla conoscenza presente. E questo può rappresentare ancora un beneficio per i management aziendali.
Riassumendo…
C’è un costo notevole in termini di tempo e denaro impiegati per codificare sistemi proprietari e per integrare sorgenti di dati eterogenee che possono essere ridotti notevolmente con le tecnologie del Web Semantico, standard e scalabili.
Per non parlare poi del costo che grava sull’azienda quando l’integrazione e/o la consistenza dei dati non vengono gestiti correttamente, portando alla mancanza di informazioni per il processo decisionale o, peggio, alla presenza di informazioni errate.
Il Web Warehousing: di cosa si tratta?
Qualche anno fa le aziende hanno intuito le enormi potenzialità del web ed hanno pensato che dal web si potessero estrarre dati e informazioni rilevanti per l’azienda. Nasceva così il concetto di Web Warehousing, un “magazzino” di dati raccolti sul web sul quale l’azienda può effettuare Web Mining e ottenere un vantaggio competitivo derivante dall’analisi di trend e pattern che sorgono ed evolvono sul web, quindi l’azienda può venire a conoscenza in maniera rapida dei bisogni dei propri clienti, che sono in continua evoluzione, ed usare tali informazioni per agire oculatamente sulle leve del marketing.
L’idea è semplice e valida, ma la sua implementazione lo è molto meno. La complessità di tale procedura è notevole (l’estrazione di dati consistenti dal web richiede tempo e competenze specifiche), così come il costo che grava sulle spalle dell’azienda.
Qaule potrà mai essere la soluzione a questo problema?
Il Web Semantico sembra sopperire perfettamente le carenze tecnologiche che rendevano il Web Warehousing complesso e costoso. Il Semantic Web, come abbiamo già visto, è un nuovo modo di concepire il web, in cui le informazioni sono comprensibili alle macchine (machine understandable) e tali capacità possono venire in aiuto alle aziende pronte a cogliere le opportunità.
Attraverso l’uso di agenti semantici, reperire le informazioni sul web 3.0 è semplice ed economico, e tali informazioni possono essere facilmente integrate con il Data Warehouse dotato di tecnologie semantiche, che è flessibile ed espandibile. Anche la stessa procedura di Web Mining può essere assorbita da quella di Data Mining in maniera semplice, in quanto, ribadiamolo, le interrogazioni possono essere fatte in linguaggio naturale e non sono più pre-programmate per operare su un set ben definito di dati.
È sottointeso che i processi di Data Warehousing e Web Warehousing possono essere mantenute separate.
Il Web Warehousing con strumenti semantici rappresenta quindi una risorsa a valore aggiunto per l’azienda e l’acquisizione di un vantaggio competitivo attraverso questi strumenti può portare un notevole beneficio economico che, anche in questo caso, non è calcolabile (n.d.r. è incalcolabile anche perché il vantaggio non si ottiene semplicemente avendo le informazioni migliori o più aggiornate, ma il vantaggio è proporzionale alla misura in cui l’azienda si serve di tali informazioni per intervenire sui processi aziendali al fine di migliorare la soddisfazione del cliente).
Antonio Cicirelli
Se il post ti è piaciuto, ti ha incuriosito o se non ha soddisfatto appieno la tua voglia di conoscenza lasciaci un commento, ci sarà d'aiuto per andare avanti e migliorare oppure sottoscrivi i feed e ricevi i prossimi articoli nel tuo RSS reader.
Comments
Non c'è ancora nessun commento.
Lascia un commento