Curiosità

Due schermi su un Netbook: Il cebit di ASUS

Asus presenta al Cebit due netbook dal design moderno, minimale, raffinato e tecnologico. Sono due esemplari, piccoli e bellissimi.Il primo si chiama Origami, come può spiegare il nome è sottilissimo, il secondo invece integra due schermi lcd, tastiera virtuale e un bel cartello non toccare. 

Il Manifesto

manifest

Una chiave e tante sfumature, il nostro manifesto. Le persone quando credono vivamente in qualcosa scrivono un Manifesto, un libero pensiero convincente e forte. Il Manifesto è l'essenza viva del nostro modo di agire...

Sabato 07 Novembre 2009 12:01

Semantica: I motori di ricerca diventano intelligenti

Written by Peppo1616
Rate this item
(0 votes)
Semantica: i Motori di ricerca diventano intelligenti Semantica: i Motori di ricerca diventano intelligenti www.interact.it

motori-ricerca-semantica_id232743_size485Semantica di cosa si tratta? La semantica è una scienza vera e propria, oggigiorno si usa con questa parola  esprimere il legame che cè tra un simbolo o un insieme di simboli (frasi, testi) e la loro realtà extralinguistica.
Un esempio concreto è il significato attribuibile alla luce verde di un semaforo, ai simboli dei cartelli stradali o ai gesti abituali delle persone.

Un ragazzo che vi porge il dito medio quando gli tagliate la strada in auto, ha appreso pienamente il concetto di semantica, molto più chiaramente di quello che voi e lui stesso possiate pensare!

La semantica sta diventando sempre più importante per quello che è il mondo della comunicazione informatica. Sia per quanto riguarda studi sull'accessibilità e sistemi di interazione intelligenti, sia nella costruzione di motori di ricerca.

Google, esempio sopra a tutti, sta puntando e riscrivendo i suoi algoritmi, in modo da distaccarsi dal mondo statico e artificioso delle keywords. Attualmente il sistema di ricerca di Google fà valutazioni molto intelligenti perlopiù statistiche sui dati raccolti per ogni keyword.

Come affermano anche altre fonti nel web, la posizione di una keywords attualmente è data dallo storico dei dati presenti nell'indice dei motore di ricerca e del peso di un significato rispetto ad un altro nel Web.

Ecco uno pseudo algoritmo che Google potrebbe usare nel trattamento delle Keyword:

  • Quando una frase o insieme di Keyword è già presente in archivio, google restituisce la pagina e viene e modificato l'indice.
  • Quando una frase o insieme di Keyword non è presente in archivio, google realizza la keyword e aggiunge indice inibito.
  • Quando una frase o insieme di Keyword è già presente in archivio e viene restituita, se è presente il click l'indice viene aggiornato con valori che tengono conto del click effettuato.

Un esempio tratto da http://www.seotopic.com che mostra come google ordina i link di una stessa keyword:

"La parola posizionamento in un contesto cosi combattuto, ha preso il significato di "posizionamento nei motori di ricerca" perchè Google, rispetto ad altri significati, ha trovato questo come predominante.

Nella parola "tasso", Google ha trovato, sia numericamete, sia qualitativamente, sia storicamente una quasi parità di argomentazioni per tutti i vari tipi di significato da lui citati; parità che si manifesta nel far apparire in prima pagina un pò di tutto."

La soluzione sopra indicata è lontana dal concetto di Semantica; ad esempio un motore di ricerca semantico è un motore in grado di desumere, dal contesto, che cosa l’utente intende quando effettua una query generica come “lancia”.

semantica3

Un esempio del genere ora produce, come affermato sopra, in Google un risultato che mostra di tutto un pò: dalla nota casa automobilistica (in primo piano), al verbo che compare in alcune frasi.

Ma cosa ci riserva il futuro? Le proposte

  • Stephen Wolfram creatore del potente e popolare software computazionale Mathematica: è un ingegnere del software che in vita sua ha raccolto molte lodi, ma anche qualche critica sulla sua tendenza a usare toni metafisici quando non ce ne sarebbe proprio necessità. Forte di questo suo progetto in seguito ha ideato Wolfram Alpha, o per meglio dire quello che viene definito il primo engine di conoscenza computazionale del web. Che sarà disponibile a partire da inizio Maggio.
  1. "Tutto ciò che occorre fare è prendere le domande che le persone pongono in un linguaggio naturale, e rappresentarle in una forma precisa che possa andar bene alle computazioni che è possibile fare" scrive Wolfram a proposito del suo ancora misterioso, nuovo progetto. Dando in pasto queste domande a "una mistura di algoritmi intelligenti e sistemi euristici, un bel po' di scoperte e curature linguistiche e quelli che probabilmente rappresentano dei seri avanzamenti teoretici" dice Wolfram, il sistema di computazione della conoscenza sarà pronto a processare "migliaia di miliardi di pezzi di dati curati" attraverso "milioni di linee di algoritmi".
  • Expert System: la sua applicazione, chiamata Cogito, è costruita intorno ai principi delle capacità cognitive dell’uomo per consentire la comprensione di un’espressione nel modo in cui l’autore la intendeva. Qualcosa che il metodo delle parole chiave ignora.

    "La ricerca di Google per la parola 'jaguar' può dare risultati sia riguardo l’animale sia riguardo la macchina (o il sistema operativo della Apple). La ricerca semantica dovrebbe porre attenzione non solo alla parola chiave, ma anche a quelle intorno, come giungla o salone, per separare i due significati”.

  1. Tale sistema però non è disponibile al pubblico, esso infatti non è un motore di ricerca (potrebbe diventarlo e l'algoritmo è già stato utilizzato in alcuni motori di ricerca di terze parti).
  • Hakia Inc. : la sua applicazione è attualmente in fase beta ma "cade a fagiuolo" per esaminare le differenze tra elaborazione semantica o meno.
  1. Ne parleremo meglio nella prossima pagina.

In questo capitolo vedremo Hakia contro Google nella ricerca tra immagini della parola chiave "breaking point of glass" e le relative problematiche della ricerca con keywords.

Le potenzialità di un motore di ricerca semantico può trascendere dal testo, può entrare nel contenuto multimediale e nella fotografia:

Un sistema di classificazione semantica potrebbe ad esempio estrapolare le forme e i contenuti di una fotografia o di un'immagine, un albero, una sedia, il sole, codificando il risultato di tali estrapolazioni all'interno del contenuto stesso. In attesa della realizzazione di un motore di ricerca in grado di lavorare pienamente con i metadati, dicono i ricercatori, è necessario che il processo di estrapolazione e codifica divenga uno standard già adesso per preparare, oggi, i contenuti della Internet del futuro.

googlesmall

hakiasmall

Le immagini esprimono bene le potenzialità di un motore di ricerca semantico, questo è solo un esempio ricercato ad hoc, difatti Google è ovviamente ancora migliore per l'uso quotidiano e la ricerca della maggior parte delle informazioni.

Per chi non notasse nulla dalle immagini possiamo vedere che la ricerca di  "breaking point of glass" su Google porta alla visualizzazione di immagini apparentemente senza alcun senso rispetto alla parola chiave inserita, mentre Hakia riporta immagini di rotture di vetri-cristalli e bicchieri.Questo ci mostra a volte l'inaffidabilità di un motore di ricerca classico rispetto ad una più potente ricerca semantica.

La ricerca semantica e lo studio del linguaggio naturale rivoluzioneranno il web, facendoci entrare nel web 3.0, dove  algoritmi sofisticati toglieranno molto del lavoro di ottimizzazione delle parole di ricerca che oggi fà la differenza tra un sito SEO o meno.

Indirizzi utili

Last modified on Venerdì 20 Novembre 2009 18:40
Peppo1616

Peppo1616

E-mail: Questo indirizzo e-mail è protetto dallo spam bot. Abilita Javascript per vederlo.

Add comment


News by Twitter

E oltre all'RFID per il pallone, mettiamoci anche quello per i tifosi... http://rfid.thebizloft.com/content/calcio-lrfid-scende-campo
http://www.pinobruno.it/?p=7063 l' ultima proposta mi sembra valida, si tratta di RFID per il calcio..
L'italia si allena qui : -25.859899,28.195493
#ita
Usb 3.0 e la corsa agli armamenti? Date un occhio alle limitazioni http://is.gd/cJVzs
RT @TomsHWItalia Dungeon Siege III nelle mani di Neverwinter Nights http://bit.ly/buB3PA Gran gioco!
RT @TomsHWItalia GPS sul manubrio e bici staffetta coast to coast tra Adriatico e Tirreno: http://bit.ly/aNw56g
E' arrivata anche la briscola on-line dopo il poker & co!
Che ne dite di questo acquisto ? 1TB SSD molto economico su PCI-E http://bit.ly/aMAxBz
Moovida Immersed Moovida Core will soon include this media center extension, optimized for remote control navigation on your HDTV.
Disponibile il nuovo moovida, non vedo l'ora di provarlo. Per ora in anteprima su windows http://www.moovida.com
FInalmente in Joomla 1.6 hanno introdotto un qualche help per gestire gli aggiornamenti in modo comodo..
Consiglio a tutti la visione del film : Basta che funzioni
Anche la spam al sabato sera non lavora :D
RT @TomsHWItalia HTML5 o Flash, il paradigma del web frammentato http://bit.ly/bhu7Mr -> HTML 5.0 rulez
RT @buffer Ops, Google ha raccolto dati dai Wifi http://ff.im/knl8M
WiGIG? Wifi retrocompatibile con gli attuali standard a 7Gbps http://bit.ly/aHbOsZ
Suite Adobe CS5, mi sembra molto più veloce delle precedenti. Sopratutto Photoshop e Illustrator
Ma comè un trojan che twetta quando un utente va su un sito porno? Attenzione :D
GOOGLE: Guida media center linux? Chi cè al secondo posto? IO http://bit.ly/91VM50

Ultime dal Forum

in Guide Windows by peppo1616, 09-10-09 15:27
in Guide Linux by CAbusivo, 07-08-09 16:10
in Hardware e How To by peppo1616, 22-07-09 15:37
in Networking by peppo1616, 21-07-09 16:37
in GNU/Linux e BSD by Zanco, 15-07-09 12:19