mardi 11 janvier 2011

Comment voyez-vous 100 Go de données textuelles Google?

Nouvelles intéressantes vu dans http://rss.slashdot.org/~r/Slashdot/slashdot/~3/lRQnkESVHZc/story01.htm:
Un lecteur anonyme écrit: «Il ya une étonnante série de tableaux qui permet de visualiser trigrammes et bigrammes, des parties de phrases qui ont été extraites à partir des données Web de Google fixés. Les courbes mettent en évidence des associations de mots et de la fréquence avec laquelle nous les utiliser sur des pages web. Chris Harrison de la Carnegie Mellon University a révélé, par exemple, que le mot «il» est souvent liée à «soutient», tandis que «elle» se trouve souvent avec le tag 'aime. " Il ya aussi des cartes mot-relation que les mots en évidence utilisé en combinaison avec leurs contraires, tels que les bons et les mauvais, la paix et la guerre, et PC et Mac. " Il ya beaucoup de ces choses, et ils sont vraiment intéressants à parcourir.

Lire la suite de cette histoire à Slashdot.




Aucun commentaire:

Enregistrer un commentaire