A Maya predictive model
A study on the use of Geographic Information Systems in a multi-scale archaeological project
Previous page Table of content Next page

D. Conclusions for the local model

1. Reliability of the model

Il est remarquable de constater que les résultats fournis dans le tableau sont relativement similaires, ce qui prouve la fiabilité du modèle. Le niveau de confiance qui avait été décidé est satisfait dans la quasi-totalité des cas. Pour le problème surgissant pour la pente en entraînant au moyen des sites des transects et du masque local, il apparaît que les poids sont en effet différents pour la classe « pente supérieure à 33% ».

Pour ce qui est du drainage, les confiances sont proches du niveau fixé à l'origine. Il est bon de remarquer que les poids des couples (masque/site) transect/transect, cover/cover et local/local sont approximativement les mêmes (-0.14, -0.15, -0.19), alors que ceux obtenus grâce aux couples transects/local et cover/local sont différents (0.75, 0.15). Cela provient probablement du fait que la seconde classe de drainage est sur-représentée au niveau des zones des levers (cf. Illustration 11: ratios pour le drainage) : en utilisant le masque local avec ces points, les poids sont donc faussés. Pour la classe 2 du drainage, les poids acceptables sont donc ceux négatifs.

Le même phénomène apparaît pour la troisième classe, qui est cette fois sous-représentée et hérite d'un poids proche de -2 lors d'un entraînement au moyen du masque local pour les sites cover ou des transects, alors que celui-ci est environ égal à -1 pour les entraînements au moyen de masques adaptés aux sites.

2. Choice of the result to keep

Au vu de ces considérations, le résultat le plus satisfaisant apparaît être celui obtenu avec le couple masque cover – sites cover. Le masque d'entraînement correspond à la zone des levers effectués sur le terrain, ce qui enlève les problèmes de sur-représentation de certaines classes, et il comporte une plus grande diversité et population de sites que pour le masque des transects. Alors que toutes les efficacités de prédiction sont quasiment les mêmes, ce résultat remporte la meilleure efficacité de classification.

Un test d'indépendance conditionnelle peut maintenant être effectué avec ce résultat pour déterminer si les probabilités obtenues sont valides ou si seules les zones doivent être considérées. Dans le cadre de cette étude, l'outil de régression logistique ne pourra pas être utilisé dans ce dernier cas puisqu'il est limité à une taille de cellule unitaire d'au moins 1 km². Le résultat du test apparaît en Annexe 15 : test d'indépendance conditionnelle (local) : dans ce cas, il est passé avec succès.

3. Comparison with the result of 2004

Une première comparaison avec les résultats de 2004 peut être faite au niveau des aspects des cartes de probabilités (voir illustrations 15 et 16). Ces cartes sont également disponibles en plus grandes tailles avec les valeurs de probabilités en Annexe 16 : pour le nouveau modèle, et Annexe 17 : pour l'ancien. Les valeurs de probabilités ne sont pas les mêmes puisqu'elles dépendent des sites utilisés pour le calcul du résultat, il convient donc de s'intéresser plutôt aux zones pour effectuer la comparaison.

Les fortes probabilités apparaissent ici en rouge, les probabilités moyennes en jaune, et les faibles probabilités en vert. Il apparaît qu'en 2004 les rivières avaient un effet relativement important sur le résultat. La zone de poids négatif pour ce paramètre (moins de 500 m et plus de 1000 m de distance aux rivières) est très visible, notamment au niveau des classes de faible probabilité.

Les zones de forte probabilité sont beaucoup plus marquées dans le nouveau modèle, notamment au niveau de la rivière Bélize. Les sites du transect de Barton Ramie (précédemment présentés en Illustration 14 p.28) étaient ainsi majoritairement classés en classe intermédiaire dans le passé au lieu d'apparaître en classe supérieure. Plus généralement, le bandeau de forte probabilité entourant la rivière Bélize et ses sols de bonne qualité disparaît en grande partie dans le modèle de 2004, du fait de la zone de poids négatif entourant les cours d'eau.

Il convient ici de rappeler que ces probabilités indiquent des zones de présence plus ou moins importante de sites mayas. Les couleurs donnent une première idée de la répartition, mais un calcul des densités associées aux zones définies est nécessaire pour une approche quantitative.

Illustration 15: modèle de 2004
Illustration 16: nouveau modèle

Il est difficile de comparer plus précisément ces deux cartes à ce stade de l'étude. Celle de 2004 pourrait être considérée plus efficace en ce qu'elle est plus sélective, mais l'analyse de la reclassification de ses paramètres et de l'utilisation des rivières contrebalance ce jugement. La qualité du résultat sera donc évaluée en fonction de la répartition des sites et de la population qu'il permet d'effectuer après reclassification des probabilités.

Illustration 17: temples mayas dépassant de la canopée, Tikal
css Copyright © 2018 Sébastien Merlet (Sebeto) xhtml