-
.
Kira Radinsky, ricercatrice israeliana del “Technion–Israel Institute of Technology” di Haifa e Eric Horvitz, co-direttore del “Microsoft Research’s main Redmond lab”, in occasione della sesta conferenza “Web Search and Data Mining” a Roma, hanno presentato il progetto “Mining the Web to Predict Future Events“, un insieme di metodologie e tecniche che hanno lo scopo di prevedere alcune tipologie di eventi futuri sulla base di dati prelevati dall’archivio delle notizie del New York Times e di alcuni siti Internet.
In poche parole: Data Mining. Tale estrazione di un sapere o di una conoscenza a partire da grandi quantità di dati, attraverso metodi automatici o semi-automatici, è un sistema già utilizzato con successo, in ambito aziendale, per le ricerche di mercato o per la gestione delle relazioni con i clienti (CRM). Anche la ricerca scientifica si avvale da tempo di questo tipo di raccolta e analisi dei dati, con applicazioni che spaziano dal campo dell’informatica a quello della meteorologia.
Il software che i due ricercatori hanno progettato sfrutta proprio il data-mining e si articola in linea generale in due fasi: prima di tutto si è effettuata una classificazione di eventi attraverso la lettura e l’immagazzinamento digitale di 22 anni di articoli del giornale “New York Times”. In un secondo momento i dati sono stati aggregati e correlati a quelli che è possibile estrarre da siti come Wikipedia, FreeBase, OpenCyc, andGeoNames.
Mark Twain diceva che “il passato non si ripete, ma spesso fa rima con se stesso” ed è con questo spirito che i due studiosi hanno provato a fare un test del loro algoritmo, scoprendo che la previsione fornita dal software, si è poi avvicinata tantissimo alla realtà. Ad esempio, analizzando gli archivi del passato, il sistema è stato già in grado di prevedere grandi eventi, effettivamente avvenuti, con uno scarto di soli pochi giorni.
Horvitz e Radinsky, nella loro presentazione, asseriscono che i disastri, gli episodi di violenza e le stragi, sono i casi in cui la previsione del loro software viene confermata dalla storia il maggior numero di volte. Si tratta di un’affidabilità compresa tra il 70 e il 90 per cento.
Una fonte di dati che si è rivelata molto utile ai fini del progetto è stata DBpedia, che è la forma strutturata d’informazione di Wikipedia. Un progetto aperto e collaborativo per l’estrazione e il riutilizzo di informazioni semanticamente strutturate da parte di software e applicazioni. Oggi la versione inglese di DBpedia è al centro della Linked Open Data Cloud e costituisce un importante riferimento per il collegamento tra diversi insiemi di dati. Microsoft non ha dichiarato quando e se il software verrà messo in vendita anche se le potenzialità sono pressoché infinite così come i campi di applicazione e le finalità commerciali.
Forse lo scenario raccontato da Minority Report non è poi così lontano.
fonte. -
gineprone.
User deleted
mah ...sarà ...mi sembra comunque una mezza bufala . -
.
Praticamente è il principio delle previsioni del tempo...
Calcolano che una perturbazione si è comportata così tot volte e che la sua evoluzione sarà uguale alle precedenti, così ti dicono.. domani piove.. o c'è il sole ecc.... -
gineprone.
User deleted
appunto una mezza bufala!!!!! .