A Maya predictive model
A study on the use of Geographic Information Systems in a multi-scale archaeological project
Previous page Table of content Next page

4. Detail of the calculation of the weights: mask of the transects

Dans le passé, le fait que le type ascending soit destiné à un nombre élevé de classes d'évidence avait été ignoré. Le choix du type de classification effectuée dépendra donc cette fois de la pertinence des poids : lorsqu'ils sont correctement ordonnés avec categorical il n'est pas nécessaire de recourir à ascending. Les poids calculés sont donnés en Annexe 13 : entraînement au moyen du masque et des sites des transects.

i. Drainage and fertility

La table 3 présente les résultats obtenus pour le drainage lors d'un entraînement au moyen du masque et des points des transects, W+ et W- étant les poids positifs ou négatifs calculés.

Drainage ascending
ClasseSitesW+W-ContrasteConfianceGénéralisationPoids
11131.01-0.431.4410.5120.26
22340.26-1.641.916.6220.26
32470.14-8.068.20.821-1.64
424702.46-2.46-0.171-1.64
Table 3: poids pour un drainage de type ascending

Dans cette étude, la confiance qui a été choisie vaut deux (valeur proposée par défaut par ArcSDM), soit environ 97,5%. Dans le cas du drainage, il apparaît donc qu'en choisissant un type ascending deux classes généralisées apparaissent, séparant « bon et très bon » avec un poids positif, et « lent et très lent » avec un poids négatif.

Si maintenant une classification de type categorical est prise en compte, le résultat est le suivant :

Drainage categorical
ClasseSitesW+W-ContrasteConfianceGénéralisationPoids
11131.01-0.431.4410.5111.01
2121-0.140.15-0.29-2.162-0.14
313-10.1-1.11-3.813-1
400000-99-8.06
Table 4: poids pour un drainage de type categorical

Dans ce cas, les quatre classes d'évidence sont conservées lors de la généralisation, et il apparaît que les poids sont ordonnés correctement. Trois des classes satisfont au niveau de confiance. Le cas de la classe 4 est intéressant : la confiance nulle n'est en fait pas dérangeante puisqu'elle vient tout simplement du fait qu'aucun site d'entraînement ne se trouve dans une zone de drainage très lent.

L'analyse des poids en gardant à l'esprit la signification des classes permet donc dans ce cas de choisir une classification categorical qui fera plus ressortir la réalité, avec un poids très négatif pour l'une des classes n'apparaissant pas aussi clairement dans l'autre cas. Le choix pour le drainage sera donc de prendre le type categorical, en conservant quatre classes.

Une analyse similaire conduit à choisir pour la fertilité le même type, avec cette fois trois classes.

ii. Rivers

Les classements des rivières en ascending ou en categorical ne sont pas satisfaisants (en ascending les niveaux de confiance sont trop faibles et ArcSDM ne peut pas calculer de généralisation valable, en categorical aucune organisation logique des poids n'apparaît), que ce soit pour celles utilisées en 2004 ou celles mises à disposition par le BERDS. Un entraînement utilisant les mêmes sites mais le masque local fait apparaître une reclassification avec le type ascending, la valeur de coupure se trouvant à 1100 m. Ainsi qu'il a été signalé lors de l'étude qualitative des paramètres, les classes d'évidences sont sous-représentées au niveau de la zone des transects à partir de cette valeur : il est donc préférable dans ce cas de ne pas utiliser ce paramètre. Les autres entraînements et essais de reclassifications effectués pour les distances aux rivières appuient cette décision : cette variable n'entre visiblement pas dans le choix de l'emplacement des sites.

Une reclassification satisfaisante consisterait à prendre d'une part le tampon de 100 m, et d'autre part les distances supérieures à 100 m. Dans ce cas, les valeurs de confiance sont bonnes, avec un poids négatif pour la première classe, positif pour la seconde. Cependant, il a été souligné que l'emplacement des rivières varie de plusieurs centaines de mètres selon les jeux de données. Cette zone de 100 m n'est donc pas significative et apparaît plus de nature à fausser le modèle qu'à l'améliorer.

Illustration 14: difficultés inhérentes à la position des rivières, dans le présent ou le passé

L'illustration 14 donne un exemple avec la zone du transect de Barton Ramie et de ses sites, avec en fond un résultat of the predictive model ne faisant pas intervenir le paramètre de distance aux rivières (les zones à fortes probabilités sont en rouge, celles à faibles probabilités sont en vert). La rivière du plan ne correspond pas totalement avec celle du masque (en bleu), et il apparaît d'après la répartition des sites et du relief sur le plan que dans le passé le tracé de celle-ci était différent.

Au vu de toutes ces considérations, le paramètre de distance aux rivières ne sera donc pas utilisé pour le calcul des probabilités.

iii. Topographic slope

Le calcul avec le type categorical ne fait apparaître aucun résultat intéressant, ce qui est logique au vu du très grand nombre de classes. En revanche, un classement ascending fait apparaître une coupure au niveau de 33% de pente, cette valeur servira donc pour la reclassification.

css Copyright © 2018 Sébastien Merlet (Sebeto) xhtml