Délicieuses explorations
Friday, 30 November 2012
L’explorateur Canadensys va bientôt atteindre les 1M d’enregistrements. Cette étape se rapprochant rapidement, nous sommes conscients que la carte dynamique utilisée actuellement atteint sa limite d’utilisation optimale. La reconnaissance de patrons et la capacité de zoomer sur des zones spécifiques de collectes deviennent petit à petit des tâches ardues. Avec l’aide de Vizzuality, nous évaluons à présent des méthodes de regroupements dynamiques des points, actives seulement pour la vue globale des pays. La visualisation actuelle, un point par spécimen, resterait active pour les niveau de zooms plus précis.
Voici la visualisation actuelle sur l’explorateur :
À l’aide de différents critères (e.g. nom scientifique, nom du jeu de données, date), il est possible de filtrer les enregistrements, générant ainsi une nouvelle distribution des points sur la carte. Notre souhait est que l’Explorateur conserve ses capacités d’exécution, mais pas au détriment de sa rapidité d’action. Les techniques de regroupement que nous testons actuellement sont basées sur différents algorithmes : technique de grille, statistique du k-mean, ou délimitations par pays.
Regroupement par grille
Cet algorithme sépare le monde en carrés d’aires égales. Les points sont par la suite regroupés par carré. Cette technique est également utilisée pour générer des cartes de points chauds.
Regroupement selon le k-Means
Cet algorithme itérarif divise le monde en un nombre de groupement prédeterminé. L’appartenance à un groupement est determiné par la moyenne la plus proche. Le k-means a tendance a générer des groupements de taille égale, donnant parfois des resultats peu attrayants!
Regroupement par pays
Cet algorithme simple compte le nombre de points de collecte à l’intérieur des frontières de chaque pays. Cette technique est néanmoins limitée lorsque le
territoire d’un pays est divisé (e.g. USA) ou lorsque les spécimens ont été collectés dans l’océan (e.g. algues).
Autres solutions
D’autres algorithmes tels que DBSCAN ou Expectation-Maximization pourraient également être testés, mais nous pensons qu’ils pourraient être trop lents pour une utilisation sur une carte dynamique.
Travaux récents
L’équipe de CartoDB chez Vizzuality ont été très actifs et nous les remercions grandement pour leur aide technique et le logiciel open source qu’ils ont produit. Ils ont récemment développés une carte de densité hexagonale qui pourrait être très intéressante pour nos besoins.
Votre avis nous intéresse
Avant de consacrer notre temps et notre énergie à développer notre nouvelle visualisation, nous souhaitons obtenir votre avis. Êtes-vous satisfait de la
visualisation actuelle des spécimens sur l’Explorateur? Êtes-vous préoccupés par le fait que plus de 1M de points sur la carte non-zoomée puisse rendre la navigation difficile? Aimeriez-vous une présentation plus structurée et plus aérée? Si oui, quelle methode présentée ci-dessus vous plait le plus? Avez-vous de l’expérience avec les méthodes de regroupement? Si oui, n’hésitez pas à nous donner vos conseils!
Labels: | Explorer |
---|