11 private links
Un datadump de StackExchange dans des fichiers SQLite. Ca pourrait m'être utile.
Un guide de référence sur les architectures orientées données. C'est très complet.
Une librairie (Python, évidement) de validation de la qualité des données.
Une pyramide des besoins qui va bien m'aider à discuter avec des gens qui ont besoin d'aide
Si vous pensez que votre date de naissance est une donnée privée (parce que c'est votre mot de passe), ce site ne risque pas de vous plaire ...
Si vous cherchez des bonnes grosses bases de données de tweets ou même d'utilisateurs Twitter, cette liste est pas mal.
Un outil de génération de schéma BigQuery à partir d'un document JSON. C'est toujours pratique ...
Un bon tour des différents projets Apache de data streaming ... Il y en a quand même un bon paquet (trop, en fait)
Très chouette site qui utilise le big data pour analyser la politique.
Très chouette exploitation big data des repositories GitHub. Ca fournit une de la popularité des langages assez peu biaisées (parce que Git est auourd'hui le standard)
Ok, donc il y a déja trop d'auteurs pour pouvoir tout lire ...
Cette impuissance est en un sens rafraîchissante, parce qu'elle valorise les choix de lecture : le fait de sélectionner tel ou tel roman a réellement une importance, puisqu'il est possible de ne jamais pouvoir relire un roman (ça m'arrive en ce moment dans la SF traduite en français et disponible en poche à cause d'une baisse de régime).
L'utilisation des statistiques en cette ère d'ultra-connexion donne des résultats toujours aussi évidents, mais toujoures aussi stupéfiants.