La semantica sta diventando sempre più importante per quello che è il mondo della comunicazione informatica. Sia per quanto riguarda studi sull'accessibilità e sistemi di interazione intelligenti, sia nella costruzione di motori di ricerca.
Google, esempio sopra a tutti, sta puntando e riscrivendo i suoi algoritmi, in modo da distaccarsi dal mondo statico e artificioso delle keywords. Attualmente il sistema di ricerca di Google fà valutazioni molto intelligenti perlopiù statistiche sui dati raccolti per ogni keyword.
Come affermano anche altre fonti nel web, la posizione di una keywords attualmente è data dallo storico dei dati presenti nell'indice dei motore di ricerca e del peso di un significato rispetto ad un altro nel Web.
Ecco uno pseudo algoritmo che Google potrebbe usare nel trattamento delle Keyword:
- Quando una frase o insieme di Keyword è già presente in archivio, google restituisce la pagina e viene e modificato l'indice.
- Quando una frase o insieme di Keyword non è presente in archivio, google realizza la keyword e aggiunge indice inibito.
- Quando una frase o insieme di Keyword è già presente in archivio e viene restituita, se è presente il click l'indice viene aggiornato con valori che tengono conto del click effettuato.
Un esempio tratto da http://www.seotopic.com che mostra come google ordina i link di una stessa keyword:
"La parola posizionamento in un contesto cosi combattuto, ha preso il significato di "posizionamento nei motori di ricerca" perchè Google, rispetto ad altri significati, ha trovato questo come predominante.
Nella parola "tasso", Google ha trovato, sia numericamete, sia qualitativamente, sia storicamente una quasi parità di argomentazioni per tutti i vari tipi di significato da lui citati; parità che si manifesta nel far apparire in prima pagina un pò di tutto."
La soluzione sopra indicata è lontana dal concetto di Semantica; ad esempio un motore di ricerca semantico è un motore in grado di desumere, dal contesto, che cosa l’utente intende quando effettua una query generica come “lancia”.
Un esempio del genere ora produce, come affermato sopra, in Google un risultato che mostra di tutto un pò: dalla nota casa automobilistica (in primo piano), al verbo che compare in alcune frasi.
Ma cosa ci riserva il futuro? Le proposte
- Stephen Wolfram creatore del potente e popolare software computazionale Mathematica: è un ingegnere del software che in vita sua ha raccolto molte lodi, ma anche qualche critica sulla sua tendenza a usare toni metafisici quando non ce ne sarebbe proprio necessità. Forte di questo suo progetto in seguito ha ideato Wolfram Alpha, o per meglio dire quello che viene definito il primo engine di conoscenza computazionale del web. Che sarà disponibile a partire da inizio Maggio.
- "Tutto ciò che occorre fare è prendere le domande che le persone pongono in un linguaggio naturale, e rappresentarle in una forma precisa che possa andar bene alle computazioni che è possibile fare" scrive Wolfram a proposito del suo ancora misterioso, nuovo progetto. Dando in pasto queste domande a "una mistura di algoritmi intelligenti e sistemi euristici, un bel po' di scoperte e curature linguistiche e quelli che probabilmente rappresentano dei seri avanzamenti teoretici" dice Wolfram, il sistema di computazione della conoscenza sarà pronto a processare "migliaia di miliardi di pezzi di dati curati" attraverso "milioni di linee di algoritmi".
- Expert System: la sua applicazione, chiamata Cogito, è costruita intorno ai principi delle capacità cognitive dell’uomo per consentire la comprensione di un’espressione nel modo in cui l’autore la intendeva. Qualcosa che il metodo delle parole chiave ignora.
"La ricerca di Google per la parola 'jaguar' può dare risultati sia riguardo l’animale sia riguardo la macchina (o il sistema operativo della Apple). La ricerca semantica dovrebbe porre attenzione non solo alla parola chiave, ma anche a quelle intorno, come giungla o salone, per separare i due significati”.
- Tale sistema però non è disponibile al pubblico, esso infatti non è un motore di ricerca (potrebbe diventarlo e l'algoritmo è già stato utilizzato in alcuni motori di ricerca di terze parti).
- Hakia Inc. : la sua applicazione è attualmente in fase beta ma "cade a fagiuolo" per esaminare le differenze tra elaborazione semantica o meno.
- Ne parleremo meglio nella prossima pagina.
In questo capitolo vedremo Hakia contro Google nella ricerca tra immagini della parola chiave "breaking point of glass" e le relative problematiche della ricerca con keywords.
Le potenzialità di un motore di ricerca semantico può trascendere dal testo, può entrare nel contenuto multimediale e nella fotografia:
Un sistema di classificazione semantica potrebbe ad esempio estrapolare le forme e i contenuti di una fotografia o di un'immagine, un albero, una sedia, il sole, codificando il risultato di tali estrapolazioni all'interno del contenuto stesso. In attesa della realizzazione di un motore di ricerca in grado di lavorare pienamente con i metadati, dicono i ricercatori, è necessario che il processo di estrapolazione e codifica divenga uno standard già adesso per preparare, oggi, i contenuti della Internet del futuro.
Le immagini esprimono bene le potenzialità di un motore di ricerca semantico, questo è solo un esempio ricercato ad hoc, difatti Google è ovviamente ancora migliore per l'uso quotidiano e la ricerca della maggior parte delle informazioni.
Per chi non notasse nulla dalle immagini possiamo vedere che la ricerca di "breaking point of glass" su Google porta alla visualizzazione di immagini apparentemente senza alcun senso rispetto alla parola chiave inserita, mentre Hakia riporta immagini di rotture di vetri-cristalli e bicchieri.Questo ci mostra a volte l'inaffidabilità di un motore di ricerca classico rispetto ad una più potente ricerca semantica.
La ricerca semantica e lo studio del linguaggio naturale rivoluzioneranno il web, facendoci entrare nel web 3.0, dove algoritmi sofisticati toglieranno molto del lavoro di ottimizzazione delle parole di ricerca che oggi fà la differenza tra un sito SEO o meno.
Indirizzi utili

Semantica di cosa si tratta? La semantica è una scienza vera e propria, oggigiorno si usa con questa parola esprimere il legame che cè tra un simbolo o un insieme di simboli (frasi, testi) e la loro realtà extralinguistica.
