par Jean-Benoît | Déc 12, 2012 | Non classé
On le sait, Google est une entreprise de data. Elle mesure, track, observe, analyse tout ce qu’elle peut. L’une des applications est de proposer des résultats toujours plus personnalisés et pertinents pour un utilisateur donné (et de la publicité ciblée,...
par Jean-Benoît | Août 25, 2012 | Non classé
Lorsque l’on analyse des logs serveur, il est fréquent de devoir dé-dupliquer de très gros fichiers. A titre d’exemple, j’ai eu besoin récemment de dé-dupliquer un fichier de 51 millions de lignes (1,4 Go). Avec Excel, cela semble compromis…...