banner
Heim / Blog / Maschinelles Lernen
Blog

Maschinelles Lernen

Jul 05, 2023Jul 05, 2023

Scientific Data Band 10, Artikelnummer: 558 (2023) Diesen Artikel zitieren

278 Zugriffe

1 Altmetrisch

Details zu den Metriken

In unserer Studie haben wir uns zum Ziel gesetzt, einen multimodalen annotierten Datensatz für die Fernerkundung der Maya-Archäologie zu sammeln, der für Deep Learning geeignet ist. Der Datensatz deckt das Gebiet um Chactún ab, eines der größten antiken Maya-Städtezentren auf der zentralen Halbinsel Yucatán. Der Datensatz umfasst fünf Arten von Datensätzen: Rastervisualisierungen und Überdachungshöhenmodelle aus luftgestützten Laserscanning-Daten (ALS), Sentinel-1- und Sentinel-2-Satellitendaten sowie manuelle Datenanmerkungen. Die manuellen Anmerkungen (als Binärmasken verwendet) stellen drei verschiedene Arten antiker Maya-Strukturen (Klassenbezeichnungen: Gebäude, Plattformen und Aguadas – künstliche Stauseen) innerhalb des Untersuchungsgebiets, ihre genauen Standorte und Grenzen dar. Der Datensatz ist bereit für die Verwendung mit maschinellem Lernen, einschließlich Convolutional Neural Networks (CNNs) zur Objekterkennung, Objektlokalisierung (Erkennung) und semantischen Segmentierung. Wir möchten diesen Datensatz bereitstellen, um mehr Forschungsteams dabei zu unterstützen, ihre eigenen Computer-Vision-Modelle für Untersuchungen der Maya-Archäologie zu entwickeln oder bestehende zu verbessern.

Luftgestützte Laserscanning-Untersuchungen (ALS) haben sich als entscheidend für die Weiterentwicklung des Wissens über die Verteilung archäologischer „Stätten“ erwiesen, insbesondere in den Waldregionen der alten Maya1,2,3, da sie traditionelle archäologische Landschaftsvermessungen erheblich beschleunigt und erweitert haben. Der Forschungseinsatz von ALS in der Landschaftsarchäologie umfasst typischerweise die Identifizierung, Lokalisierung, Aufzeichnung und Untersuchung natürlicher und kultureller Merkmale für eine Vielzahl von, normalerweise miteinander verbundenen Kontexten, einschließlich, aber nicht beschränkt auf die Kartierung und Analyse von Siedlungen, Städtebau, landwirtschaftlicher Produktion usw Wassermanagement4,5,6,7,8,9,10,11.

Archäologen untersuchen ALS-Daten typischerweise in Form von Rastervisualisierungen, die die Wahrnehmung von Oberflächenmerkmalen verbessern12,13,14. Die menschliche visuelle Analyse und Digitalisierung ist zeitaufwändig und die Untersuchung von Hunderten von Quadratkilometern kann je nach Detaillierungsgrad, Anzahl der Strukturen und Aufnahmemethode Monate dauern. Trotz des Mangels an groß angelegten, hochauflösenden, öffentlich zugänglichen ALS-Datensätzen der antiken Maya-Region ist es durch die verstreute private und öffentliche Finanzierung möglich geworden, nicht nur standortspezifische Landschaftsstudien über einige Quadratkilometer hinweg durchzuführen, z. B.7,15,16 ,17,18, aber auch groß angelegte Studien über mehrere hundert oder sogar mehrere tausend Quadratkilometer zB3,5,11,19,20,21,22,23. Die Datenmenge macht es schwierig, ganze Datensätze zu annotieren, insbesondere wenn nicht nur die Positionen von Objekten, sondern auch deren Form angegeben werden sollen. Die Subjektivität der visuellen Inspektion und Digitalisierung durch den Menschen sowie die Variabilität zwischen menschlichen Interpreten sind ebenfalls ein Problem24. Es besteht daher ein dringender Bedarf, Computer-Vision-Methoden einzusetzen, die archäologische Objekte finden und ihre Grenzen automatisch abgrenzen können25,26. Unter den verschiedenen Ansätzen des maschinellen Lernens sind Deep Convolutional Neural Networks (CNNs) der aktuelle Stand der Technik für Computer Vision, erfordern jedoch in der Regel eine große Anzahl bereits markierter Proben27 für das Training. Daher sind gekennzeichnete Datensätze für die Entwicklung und Erprobung der Methoden von entscheidender Bedeutung.

In einer unserer früheren Studien haben wir bereits gezeigt, dass CNNs antike archäologische Objekte der Maya anhand von DEM-Visualisierungen klassifizieren können und dabei eine Genauigkeit von bis zu 95 % erreichen28. Klassifizierungsmodelle haben jedoch nicht das Potenzial, die manuelle Inspektion und Kennzeichnung zu ersetzen, für die eine semantische Segmentierung erforderlich ist. Semantische Segmentierung lässt sich problemlos in der Fernerkundung anwenden (ein Überblick wird gegeben von27), vor allem aber in der medizinischen Bildgebung, wo CNNs oft Experten übertreffen29,30,31,32,33,34.

Die ursprüngliche Absicht der Sammlung der ALS-Daten in der Gegend um Chactún, einem der größten bisher bekannten antiken Maya-Städte im zentralen Tiefland der Halbinsel Yucatan, bestand darin, das Wassermanagement, die Landwirtschaft, die Siedlungsdynamik und die Gesellschaftspolitik besser zu verstehen Organisation der in diesem Gebiet lebenden alten Maya11,35.

Wir haben einen beschrifteten Datensatz erstellt, der für die Analyse der antiken Maya-Archäologie verwendet werden kann und mehr als 10.000 Objekte umfasst, unterteilt in drei verschiedene Klassen; Gebäude, Plattformen, Aguadas (künstliche Wasserbecken). Wir haben polygonisierte Umrisse von Objekten verwendet, um binäre Rastermasken zu erstellen. Der zugehörige multimodale Datensatz enthält Daten aus drei Fernerkundungsquellen:

ALS-Datenvisualisierungen mit einer Auflösung von 0,5 m28 (Himmelssichtfaktor, positive Offenheit, Neigung),

ALS-Überdachungshöhenmodell mit 1,0 m Auflösung,

Sentinel-1 Short Aperture Radar (SAR)-Satellitendaten mit einer Auflösung von 10 m (Jahresdurchschnitt Sigma0) und

Optische Sentinel-2-Satellitendaten mit einer Auflösung von 10, 20 und 60 m (12 Bänder + s2cloudless-Wolkenmaske, 17 Daten).

Die Erdbeobachtungsmissionen Sentinel-1 und 2 sind Teil des Copernicus-Programms der Europäischen Union. Eine Übersicht über den experimentellen Arbeitsablauf zur Generierung und Analyse der Daten ist in Abb. 1 dargestellt.

Ein Überblick über den experimentellen Arbeitsablauf zur Generierung und Analyse der Daten.

Die Anwendung von CNN-Methoden in der archäologischen Prospektion hat gerade erst begonnen, an Dynamik zu gewinnen, z. B.28,36,37,38,39,40,41; Derzeit gibt es jedoch nur wenige CNN-basierte Studien zur semantischen Segmentierung, die mit ALS-Daten durchgeführt wurden26,42,43,44,45,46 und noch weniger Instanzsegmentierungsmodelle, die in diesem speziellen Bereich veröffentlicht wurden47. Leicht zugängliche, archäologisch beschriftete Datensätze, die für maschinelles Lernen geeignet sind, sind daher äußerst selten. Wir glauben, dass die gemeinsame Nutzung eines großen beschrifteten Datensatzes, der eine semantische Segmentierung ermöglicht, einen großen Wiederverwendungswert hat, da er auf polygonisierten Objekten und nicht auf Schwerpunkten, Punkten oder einfachen Begrenzungsrahmen basiert. Dieser Datensatz ist auch deshalb einzigartig, weil er multimodal ist und bislang der einzige in der Maya-Region. Ein derart umfangreicher Datensatz ermöglicht es verwandten Forschungsgruppen, ihre eigenen Segmentierungsmodelle zu entwickeln oder zu verbessern. Dies hat bereits zu Verbesserungen der Erkennungsraten geführt, da der Datensatz im Rahmen des Wettbewerbs „Discovering the mysteries of the Maya“ für maschinelles Lernen verwendet wurde48,49. Die Teams, die an dieser maschinellen Lernherausforderung teilnahmen, erreichten beim Lernen aus ALS-Daten eine Segmentierungsleistung von mehr als 0,83 für den Schnittpunkt über der Vereinigung (IoU, auch bekannt als Jaccard-Index). Allerdings haben die meisten Teams keine Satellitendaten in ihr endgültiges Modell einbezogen. Deep Learning allein aus ALS-Visualisierungen führte zu besseren Ergebnissen mit viel weniger technischem Aufwand für maschinelles Lernen. Wir hoffen jedoch, dass andere Teams durch die Bereitstellung eines multimodalen Datensatzes für eine breitere Wiederverwendung neue Modelle entwickeln können, die auf Architekturen basieren, die die Informationen in den Satellitendaten besser nutzen können.

Das Gebiet um Chactún (Abb. 2) ist karstisch und daher mangelt es an ständigem Wasser und permanenten Wasserflüssen. Niedrige Hügel erheben sich typischerweise bis zu 30 m über die umliegenden saisonalen Feuchtgebiete (Bajos). Das Klima im Maya-Tiefland ist tropisch und isotherm50,51 und in der erhöhten Binnenregion sind die Niederschläge stark saisonal und räumlich variabel. Typischerweise fallen 90 % der Niederschläge während der Regenzeit9. Das gesamte Untersuchungsgebiet ist von natürlichen, unbewirtschafteten tropischen Halblaubwäldern und Büschen bedeckt, die selten eine Höhe von 20 m überschreiten. Der Wald kann als Primärwald klassifiziert werden, in dem es seit einem Jahrtausend keine landwirtschaftliche oder weidende Tätigkeit gibt. Vor der Gründung des Calakmul-Biosphärenreservats im Jahr 1989 war der selektive Holzeinschlag zur Gewinnung wertvoller Nutzholz- und Chicle-Sammlung die wichtigste Wirtschaftstätigkeit.

Lage des Untersuchungsgebiets mit abgegrenztem Bereich der luftgestützten Laserscanning-Mission. Die Datensätze wurden aus dem südlichen Teil (rot eingefärbt) extrahiert und angepasst von28.

Šprajc und sein Team entdeckten 2013 den städtischen Kern von Chactún, der aus drei Ansammlungen monumentaler Architektur besteht52. Tempelpyramiden, massive palastartige Gebäude und zwei Ballspielplätze umgeben die verschiedenen Plätze. Unmittelbar westlich der Hauptbauwerksgruppen liegt ein großes rechteckiges Wasserreservoir. Von der Erdoberfläche gesammelte Keramik, die architektonischen Merkmale und datierten Denkmäler deuten darauf hin, dass das Zentrum in der vorklassischen Zeit (ca. 1000 v. Chr.–250 n. Chr.) zu blühen begann und seinen Höhepunkt in der Spätklassik (ca. 600–1000 n. Chr.) erreichte. spielen eine wichtige Rolle in der regionalen politischen Hierarchie52,53. Südlich von Chactún liegen Lagunita und Tamchén, beides bedeutende städtische Zentren. Auf den sie umgebenden Hügeln sind zahlreiche kleinere Gebäudegruppen verstreut54,55.

Der gesamte Datensatz umfasst fünf verschiedene Arten von Datensätzen:

Rastervisualisierungen mit luftgestütztem Laserscanning (ALS),

ALS-Daten-abgeleitetes Überdachungshöhenmodell,

Sentinel-1-Radarsatellitendaten mit synthetischer Apertur,

Optische Sentinel-2-Satellitendaten und

Datenanmerkungen.

Der Hauptteil des Datensatzes besteht aus visualisierten luftgestützten Laserscanning-Daten, die mit dem Titan-System vom National Center for Airborne Laser Mapping (NCALM) am Ende (Höhepunkt) der Trockenzeit im Mai 2016 gesammelt wurden. Missionsplanung, Datenerfassung und Daten Die Verarbeitung erfolgte mit klaren archäologischen Zielen im Hinterkopf56,57. Die Dichte der endgültigen Punktwolke und die Qualität des abgeleiteten Höhenmodells mit einer räumlichen Auflösung von 0,5 m (Tabelle 1) erwiesen sich als hervorragend für die Erkennung und Interpretation archäologischer Merkmale mit sehr klar definierten winzigen Höhenunterschieden.

Die technische Qualitätskontrolle der Daten umfasste die Überprüfung der Scandichte, der absoluten horizontalen Genauigkeit (besser als 20 cm), der absoluten vertikalen Genauigkeit (besser als 15 cm) und der thematischen Genauigkeit des erstellten Höhenmodells.

Bodenpunkte wurden mit der Terrascan-Software (Version 016.013) klassifiziert, die einen adaptiven Verdichtungsalgorithmus für dreieckige unregelmäßige Netzwerke58 verwendet. Die Algorithmuseinstellungen wurden optimiert, um nur die Vegetationsdecke zu entfernen und die Überreste früherer menschlicher Aktivitäten so intakt wie möglich zu lassen (Tabelle 2). Zu den Bodenpunkten zählen daher Gebäudereste, Mauern, Terrassen, Hügel, Chultuns (Zisternen), Sacbeob (erhöhte gepflasterte Straßen) und Entwässerungskanäle (Abb. 3). Zu den seltenen Gebieten ohne Bodenrückfluss gehören Aguadas mit Wasser. Viele Landschaftsmerkmale wie Gräben und niedrige Feldmauern waren im Feld aufgrund der dichten Vegetation im Wesentlichen unsichtbar und wären bei der herkömmlichen Oberflächenkartierung höchstwahrscheinlich übersehen worden. Wie durch Ground-Truthing festgestellt wurde, enthält das Höhenmodell nur sehr wenige Datenerfassungs- und -verarbeitungsartefakte (Kommissions- und Auslassungsfehler). Unterlassungsfehler beschränken sich auf kleinere Objekte wie Altäre, Auftragsfehler betreffen meist größere Baumstämme. An einigen Stellen sind Teile von Gebäuden deformiert, beispielsweise werden Wände als Vegetation eingestuft, weil ein Baum aus einer Kammer auf einem Pyramidengebäude wächst.

Beispiele für Gebäude (a–g,i,j), Plattformen (a–j) und Aguadas (k–o), die mit Anmerkungen versehen wurden und im Datensatz enthalten sind. Andere von Menschenhand geschaffene Strukturen wie Mauern, Kanäle, Terrassen, Steinhaufen usw. wurden nicht kommentiert (p–t). Alle Panels haben den gleichen Maßstab und decken etwa ein Viertel eines einzelnen Datensatzbereichs ab (Abb. 5). Die Visualisierung dient nur zur Veranschaulichung; Es kombiniert ein farbig vereinfachtes lokales Reliefmodell mit einer kombinierten Visualisierung für die archäologische Topographie.

Wir verwendeten Raster-ALS-Datenvisualisierungen zur Unterstützung der menschlichen visuellen Interpretation von Objekten und als Dreiband-Datensatz für die Datensätze. ALS-Rasterdatenvisualisierungen sind berechnete Ableitungen eines digitalen Höhenmodells, die Informationen über die Landschaft liefern. Sie können einen reinen Darstellungswert haben oder sich auf physikalische Größen beziehen59. Tatsächlich erleichtern sie das „Lesen und Erkunden“ der Landschaft auf der Suche nach aussagekräftigen Informationen. Die primäre Visualisierung war eine kombinierte Visualisierung für die archäologische Topographie (VAT)13. Es kombiniert zwei Kombinationen von vier unterschiedlichen Visualisierungen: analytische Hügelschattierung, Neigung, positive Offenheit und Himmelssichtfaktor (SVF)12, berechnet mit Einstellungen für normales und flaches Gelände (Tabelle 3). Die einzelnen Visualisierungsmethoden ergänzen sich und stellen kleine topografische Variationen auf unterschiedliche Weise dar. Das kombinierte Bild behält ihre positiven Eigenschaften bei. Vor dem Mischen werden die Visualisierungen normalisiert und mit einer benutzerdefinierten Histogrammstreckung versehen. Die Betrachtung einer einzigen kombinierten Visualisierung hat Vorteile, darunter eine bessere Darstellung von Strukturen in einem größeren Spektrum von Geländetypen, die Einsparung von Speicherplatz und eine schnellere Anzeige. Die Mehrwertsteuer wurde in der Relief Visualization Toolbox (RVT; https://github.com/EarthObservation/RVT_py) erstellt. Die Berechnung dauert für Daten mit einer Auflösung von 0,5 m auf einem normalen Büro-Laptop etwa eine halbe Minute pro km2. Die Mehrwertsteuer wurde bereits für Fußgängererhebungen in einer Reihe von Umgebungen eingesetzt, von halblaubwechselnden Tropenwäldern Mexikos über das weitgehend offene Heide- und Buschland im Westen Schottlands bis hin zu den karstigen, zerklüfteten Gebieten des Mittelmeers. Die Visualisierung führt keine Artefakte ein und zeigt kleinräumige Merkmale unabhängig von ihrer Ausrichtung und Form gut an. Es ist jedoch nicht völlig orientierungsunabhängig, da die Schummerung als Basisebene verwendet wird. Es unterstützt die Interpretation des menschlichen Sehvermögens, verwendet jedoch eine gerichtete Lichtquelle und ist daher nicht für Datenerweiterungstechniken wie Drehung und Spiegelung geeignet. Daher wurden zur Erstellung von Dreiband-Datensätzen (RGB) nur der Himmelssichtfaktor, die positive Offenheit und die Neigung verwendet, die alle richtungsunabhängig sind. Diese rangierten auch in unserer Studie zur Leistung verschiedener Visualisierungen und Visualisierungskombinationen für die Klassifizierungsaufgabe mit CNNs28 am höchsten. Lokale Dominanz12 diente als zusätzliche Hilfe für die visuelle Interpretation der äußeren Grenzen von Aguadas, die normalerweise nur sehr schwach über das umgebende flache Gelände hinausragen.

Darüber hinaus stellen wir ein Überdachungshöhenmodell (CHM) mit einer Auflösung von 1 m bereit, das mit einem Spike-freien Algorithmus60 berechnet wird, der im LAStools-Tool las2dem (Version 230330) implementiert ist. Die Verarbeitungsparameter sind in Tabelle 4 aufgeführt. Basierend auf einer visuellen Inspektion haben wir alle Punkte entfernt, die mehr als 30 m über dem Boden (oder einem Gebäude) liegen, da sie eher Lärm darstellen als eine echte Messung der Baumhöhe.

Die ALS-Rohdaten wurden von ZRC SAZU im Rahmen einer Zusammenarbeit zwischen den Autoren dieses Papiers bereitgestellt. Da Chactún, Lagunita und Tamchén erst kürzlich (wieder)entdeckt wurden und abgelegen und schwer zugänglich sind, ist ihre genaue Lage der Öffentlichkeit nicht bekannt. Die Dichte an anthropogenen Strukturen und Geländeveränderungen der alten Maya in diesem Gebiet ist erstaunlich und erreicht das Niveau großer städtischer Zentren wie Tikal, ist aber archäologisch noch fast völlig unerforscht. Um Plünderungen vorzubeugen, sind die Standorte der Stadtkerne und der zahlreichen kleineren Siedlungsgruppen den Forschern vorbehalten. Die vollständigen ALS-Daten sind daher nicht öffentlich verfügbar. Forscher, die es jedoch für eine bestimmte Anwendung nutzen möchten, sollten sich direkt an ZRC SAZU wenden, indem sie den entsprechenden Autor kontaktieren und das Thema und die Ziele ihres Projekts beschreiben.

Die Sentinel-1-Satellitenkonstellation liefert C-Band-SAR-Daten (Synthetic Aperture Radar). Der erste Satellit, Sentinel-1A, wurde im April 2014 gestartet, gefolgt von Sentinel-2 im April 2016. Letzterer wurde außer Betrieb genommen, nachdem die Datenerfassung aufgrund eines Stromausfalls am 23. Dezember 2021 eingestellt wurde. Die Doppelkonstellation hatte eine Wiederholfrequenz von 6 Tagen und eine Wiederbesuchshäufigkeit (in aufsteigender und absteigender Umlaufbahn) von 3 Tagen am Äquator. Ein einzelner Satellit hat eine Wiederholungsfrequenz von 6 Tagen am Äquator.

Für diese Studie verwendeten wir Daten, die von beiden Satelliten im Interferometrischen Breitbandmodus (IW) erfasst wurden, da dies der primäre Erfassungsmodus über Land mit dem größten Datenarchiv ist. Wir haben das Level-1-Produkt Ground Range Detected (GRD) mit doppelter Polarisation (vertikales Senden – horizontale Empfangspolarisation (VV) und vertikales Senden – vertikale Empfangspolarisation (VH)) sowohl für aufsteigende (ASC) als auch absteigende (DES) Umlaufbahnen verwendet . Der verwendete Rückstreukoeffizient war Sigma0. Die Werte des Rückstreukoeffizienten wurden von der linearen Leistung in Dezibel (dB) umgerechnet, an ein Intervall von [−30, 5] dB angepasst und auf den Bereich [0, 1] normiert.

Wir verwendeten SAR-Daten für die Jahre 2017–2020 mit 114 Bildern aus der aufsteigenden Umlaufbahn (ASC) und 205 Bildern aus der absteigenden Umlaufbahn (DES), die vom Sentinel Hub61 gesammelt wurden. Im Untersuchungsgebiet wurden insgesamt 319 Sentinel-1-Bilder aufgenommen, die jeweils Daten zur VV- und VH-Polarisation mit einer räumlichen Auflösung von 10 m enthielten. Wir haben für jedes Pixel die folgenden zeitlichen Statistiken berechnet: Mittelwert, Median, Standardabweichung, Varianzkoeffizient sowie 5. und 95. Perzentil. Wir haben die Statistiken für jedes Jahr innerhalb des Beobachtungszeitraums und für den gesamten Zeitraum berechnet. Die Daten wurden als Multiband-Raster (120 Bänder) im Tagged Image File Format (TIFF)-Format gespeichert (Abb. 5 und Tabelle 8). Die gesamte Verarbeitung erfolgte mit unserem eigenen Code und den Python-Paketen eolearn (Version 1.4.2) und sentinelhub (Version 3.9.1).

Aufgrund des völligen Fehlens moderner anthropogener Objekte und gemessener permanenter Streuer in unserem Untersuchungsgebiet war es unmöglich, die Positionsgenauigkeit der SAR-Daten zu überprüfen. Laut Sentinel-1 Annual Performance Report62 beträgt die Geolokalisierungsgenauigkeit der IW-Schwadmodusprodukte ohne geometrische Korrekturen jedoch –3,5 m für die Reichweite und 2,1 m für den Azimut. Der absolute Lokalisierungsfehler liegt daher deutlich unter den Missionsanforderungen von 10 m bei einer Zuverlässigkeit von 95 %.

Die optische Satellitenmission Sentinel-2 begann mit dem Start von Sentinel-2A im Juni 2015, gefolgt von Sentinel-2B im März 2017. Beide Satelliten tragen ein einziges Multispektralinstrument (MSI) mit 13 Spektralkanälen im sichtbaren/nahen Bereich. Infrarot- (VNIR) und kurzwelliger Infrarot-Spektralbereich (SWIR). Die räumliche Auflösung beträgt 10 m für vier Bänder, 20 m für sechs Bänder und 60 m für drei Bänder (Tabelle 5).

Die geografischen und klimatischen Besonderheiten des Untersuchungsgebiets manifestieren sich in einem hohen Anteil wolkiger optischer Satellitenbilder. Von den 658 Level-2A-Bildern, die zwischen 2017 und 202061 aufgenommen wurden, weisen 78 eine Wolkenbedeckung von weniger als 5 % auf, in den meisten von ihnen sind jedoch kleine konvektive Wolken oder Dunst vorhanden. Wir haben für jedes Aufnahmedatum eine Wolkenmaske mit einer Auflösung von 10 m berechnet und eine manuelle visuelle Inspektion des Sets durchgeführt, um schließlich die 17 Bilder ohne Wolkendecke über dem Untersuchungsgebiet auszuwählen. Wir haben alle Bänder mit der Resampling-Methode des nächsten Nachbarn auf eine Auflösung von 10 m neu abgetastet. Der Datensatz umfasst daher 12 Spektralbänder (außer Band 10) und eine entsprechende Wolkenmaske, berechnet mit s2cloudless63 (verfügbar unter https://github.com/sentinel-hub/sentinel2-cloud-detector), angepasst an eine Auflösung von 10 m, für 17 Daten (Abb. 4) (insgesamt 221 Bänder), gespeichert im TIFF-Format (Abb. 5 und Tabelle 8). Wir haben das Spektralband 10 (auch als Cirrusband bekannt) ausgeschlossen, da es keine Oberflächeninformationen enthält. Es wird für atmosphärische Korrekturen verwendet und ist daher nicht im atmosphärisch korrigierten Level 2 A-Produkt enthalten. Die gesamte Verarbeitung erfolgte mit unserem eigenen Code und den Python-Paketen eolearn (Version 1.4.2) und sentinelhub (Version 3.9.1).

Die ausgewählten Sentinel-2-Aufnahmedaten über dem Untersuchungsgebiet mit Nahaufnahmen.

Ein einzelner Datensatz (z. B. 1469) enthält (a) binäre Masken von Strukturen, (b) eine Kachel mit ALS-Datenvisualisierungen, (c) eine Kachel mit einem Überdachungshöhenmodell, (d) eine Kachel mit Jahresstatistiken für Sentinel-1 Sigma0-Rückstreukoeffizienten und (e) eine Kachel mit Sentinel-2-Bändern für 17 wolkenlose Szenen.

Laut Sentinel-2 Annual Performance Report64 ist die absolute geometrische Genauigkeit der Sentinel-2 L2A-Daten besser als 6 m, die multitemporale Co-Registrierung desselben oder verschiedener Satelliten in derselben wiederholten Umlaufbahn ist besser als 5 m bei 95 % Konfidenz und multitemporale Co-Registrierung in verschiedenen Wiederholungsbahnen ist besser als 5 m.

Viele maschinelle Lern- und Deep-Learning-Studien in der archäologischen Prospektion verwenden ALS-Visualisierungen mit einfachen Anmerkungen, die nicht die genauen Grenzen von Objekten abgrenzen. Solche Studien verwenden meist Punkte und einfache Begrenzungsrahmen als Annotationen, weshalb sie sich vor allem für Aufgaben eignen, die sich mit der Klassifizierung oder Lokalisierung (Erkennung) von Objekten befassen, und nicht mit der semantischen Segmentierung. Für die Segmentierung sind die genauen Grenzen eines Objekts Voraussetzung.

Um einen für die überwachte Segmentierung geeigneten Datensatz zu erstellen, haben wir Polygone für archäologische Objekte abgegrenzt. Die Datenanmerkung wurde von einer einzelnen Person vorgenommen. Die manuelle Arbeit dauerte etwa 8 volle Arbeitsmonate und führte dazu, dass im südlichen Teil (130 km2) 9303 Gebäude und 2110 Plattformen sowie im gesamten Untersuchungsgebiet (220 km2) 95 Aguadas annotiert wurden (Tabelle 6). Bei den Plattformen handelt es sich offenbar um künstliche, ebene Flächen, die sich vom umgebenden Gelände abheben, andere Bauwerke tragen oder höchstwahrscheinlich diese Funktion hatten, auch wenn derzeit keine Gebäude sichtbar sind. Zu den Gebäuden zählen verschiedene Arten erhöhter Strukturen wie Tempelpyramiden, palastartige Gebäude, Ballspielplätze, Ein- oder Mehrzimmerhäuser und Wohnkomplexe. Aguadas sind größtenteils mit Lehm ausgekleidete Senken, die während der Trockenzeit Wasser halten können, siehe auch35.

Das Umfangspolygon um ein Gebäude oder eine Plattform wurde gezeichnet, wobei der Dolmetscher die Grenze zwischen künstlichem (modifiziertem) und natürlichem Gelände auf der Mehrwertsteuer definieren konnte. Wo immer möglich, repräsentiert ein einzelnes Polygon eine einzelne Instanz, eine einzelne Struktur. Da Gebäude architektonisch oder durch eingestürztes Material jedoch oft eng miteinander verbunden sind, ist es manchmal schwierig, eine genaue Grenze zwischen Bauwerken zu bestimmen. Daher enthält ein einzelnes Polygon oft mehr als ein Gebäude. Polygone von Gebäuden und Bahnsteigen überlappen sich regelmäßig, es gibt aber auch viele Beispiele von Bahnsteigen ohne Gebäude und von Gebäuden, die sich nicht auf einem Bahnsteig befinden.

Wir haben die Visualisierung der lokalen Dominanz (LD) verwendet, um die Mehrwertsteuer für die Kommentierung von Aguadas und größeren Wasserreservoirs zu ergänzen. LD eignet sich besonders für die Darstellung ihrer leicht erhöhten Böschungen.

Alle Polygone desselben Typs (Gebäude, Plattform oder Aguada) wurden als separate Vektorebenen gespeichert. Die Anmerkungen wurden von einem erfahrenen Archäologen mit umfassenden lokalen Kenntnissen der Region überarbeitet und kuratiert. In sehr unklaren Fällen, in denen es schwierig war, zu bestimmen, ob eine Formation natürlich oder anthropogen ist, z. B. ob es sich bei einem Objekt um eine kleine, erodierte Plattform oder ein natürlich eingeebnetes Gelände handelt, wurde innerhalb eines Expertengremiums ein Konsens erzielt. Wir haben die Themen einzeln besprochen oder uns auf eine neue Regelung geeinigt, wenn es viele ähnliche Beispiele gab.

Die veränderte Landschaft enthält viele andere Arten von anthropogenen Strukturen wie Terrassen, Steinbrüche, Mauern, Sacbeob (erhöhte gepflasterte Straßen), Chultunob (unterirdische Lagerkammern), Kanäle, Steinhaufen usw. Um Zeit zu sparen, haben wir diese zunächst nicht mit Anmerkungen versehen Uns interessierte in erster Linie die Anzahl und das Gesamtvolumen der Gebäude sowie die Menge des verfügbaren Wassers, um die Anzahl der in der Gegend lebenden Menschen und den für den Bau der betreffenden Bauwerke erforderlichen Arbeitsaufwand zu ermitteln. Da in der Studie landwirtschaftliche Aspekte nicht im Vordergrund standen, wurden Gebiete mit Kanälen in Bajos und Terrassen später abgegrenzt und diese Daten sind nicht in den Datensätzen enthalten. Andere kleinere und weniger ausgeprägte anthropogene Strukturen, wie zum Beispiel kurze Mauern, sind ebenfalls zahlreich und oft erodiert, was es schwieriger macht, sie von natürlichen Formationen zu unterscheiden. Mit den nun zur Verfügung gestellten unbeschrifteten Daten können zukünftige Forscher diese vorhandenen Aufzeichnungen für weitere Projekte, die sich mit der Landnutzung der alten Maya befassen, mit Anmerkungen versehen.

Vektorpolygone, die jede Objektklasse darstellen, wurden gerastert, um eine binäre Segmentierungsmaske für diese Klasse zu erstellen. Die Rasterung erfolgte mit der Geospatial Data Abstraction Library (GDAL). Die Masken wurden in TIFF-Dateien konvertiert und dienen als beschriftete Daten für Training, Validierung und Tests.

Die vollständig kommentierte Fläche von etwa 130 km2 wurde in Kacheln von 240 × 240 Metern aufgeteilt. Jeder Datensatz besteht aus Kacheln mit mehreren Schichten, mit Ausnahme des CHM, der nur eine Schicht hat (Abb. 5):

drei binäre Segmentierungsmasken (je eine für Gebäude, Plattform und Aguada-Klasse),

die ALS-Visualisierungen-Kachel mit drei Ebenen,

das Modell mit Baldachinhöhe,

die Sentinel-1-Bildkachel mit mehreren Ebenen und

die Sentinel-2-Bildkachel mit mehreren Ebenen.

Entsprechend der ursprünglichen DEM-Auflösung von 0,5 m haben Visualisierungen und binäre Maskenkacheln jeweils eine Größe von 480 × 480 Pixel, das CHM hat eine Größe von 240 × 240 Pixel, während die Sentinel-1- und 2-Daten 24 × 24 Pixel haben . Die benachbarten Kacheln berühren sich nicht und überlappen sich nicht, sondern sind durch einen Puffer von 20 Metern voneinander getrennt. Der geografische Standort der Kacheln wurde so gewählt, dass er dem 10-m-Raster der Sentinel-2-Daten entspricht.

Gekachelte Binärmasken, ALS-Visualisierungen, Sentinel-1- und Sentinel-2-Satellitendaten werden im Figshare-Online-Repository65 archiviert. Der Datensatz enthält 2094 Datensätze mit einem Objekt in mindestens einer der Segmentierungsmasken. Der zufällig ausgewählte Satz von 1765 Datensätzen (Kacheln 0–1764) wurde ursprünglich für die Teilnehmer der Online-Challenge Discover the mysteries of the Maya veröffentlicht, die wir im Rahmen der Europäischen Konferenz über maschinelles Lernen und Prinzipien und Praxis der Wissensentdeckung organisiert haben in Datenbanken (ECML PKDD 2021)48,49, während die restlichen 329 (Kacheln 1765–2093) zum Testen der eingereichten Deep-Learning-Modelle zurückgehalten wurden (Abb. 6). Das Dateiformat für alle Kacheln ist unkomprimiertes TIFF. Auf Geolokalisierungsdaten wurde bewusst verzichtet, um den genauen Standort der archäologischen Überreste nicht preiszugeben. Die Kacheln wurden zufällig nummeriert, um eine Rekonstruktion des gesamten Untersuchungsgebiets zu verhindern. Ein Beispiel für einen Datensatz mit Details zu jeder Kachel finden Sie in Abb. 5 und in den Tabellen 7, 8.

Die Dateinamenstruktur für jeden Datensatz lautet „tile__.tif“, wobei die Datenquelle eine Maske, ALS-Visualisierungen (Lidar), CHM oder Sentinel-Daten (S1 oder S2) angeben kann. Die fortlaufende Nummer ist eine eindeutige Kennung eines Datensatzes; Alle Dateien mit derselben fortlaufenden Nummer repräsentieren dasselbe geografische Gebiet, unterscheiden sich jedoch in der Anzahl der Pixel (480 × 480 Pixel, 240 × 240 Pixel oder 24 × 24 Pixel) und der Bittiefe (8-Bit-Ganzzahl oder 32-Bit-Float). (Tabelle 7).

Jede Sentinel-1-Kachel besteht aus 120 Bändern (5 Perioden × 24 Bänder), die wie folgt sortiert sind (Abb. 5 und Tabelle 8):

Die Daten werden zunächst nach Jahr geordnet, wobei der gesamte Zeitraum zuletzt (2017, 2018, 2019, 2020, 2017–2020) angegeben ist

geordnet nach der Umlaufbahn (aufsteigend – ASC, absteigend – DES),

geordnet nach der entsprechenden Polarisation (VV, VH) und schließlich

geordnet nach den berechneten Statistiken (Mittelwert, Median, Standardabweichung – Standard, Varianzkoeffizient – ​​Var, 5. Perzentil – p5, 95. Perzentil – p95).

Jede Sentinel-2-Kachel besteht aus 221 Bändern (17 Daten × 13 Bänder), geordnet nach Erfassungsdatum (vom neuesten zum ältesten), den entsprechenden Spektralbändern und der zugehörigen Wolkenmaske (Abb. 5 und Tabelle 8).

Ein einzelner Datensatz ist 2,35 MB groß, während die Gesamtgröße nach Typ wie folgt ist: 1.449 MB für Masken, 1.449 MB für ALS-Visualisierungen, 484 MB für CHM, 581 MB für Sentinel-1 und 1.070 MB für Sentnel-2 (insgesamt 5.033 MB). Das Repository speichert ZIP-komprimierte Daten, zusammengestellt nach Typ (Masken, Lidar, CHM, S1, S2). Die Gesamtgröße der komprimierten Dateien beträgt 2.214 MB.

Aufgrund der großen Vielfalt an Daten, die zur Erstellung der Datensätze verwendet werden, haben wir den Prozess zur Erlangung des bestmöglichen Inputs für jede der Quellen im entsprechenden Abschnitt des Kapitels „Methoden“ beschrieben. Als Ground Truth dienen die Objektgrenzen, die sich aus der Interpretation der ALS-Daten ergeben. Basierend auf dem 10-m-Puffer von Bodenschienen aus den Feldverifizierungskampagnen 2017 und 2018 haben wir 33,3 % der Aguadas, 22,4 % der Gebäude und 24,2 % der Plattformen im Feld überprüft (Abb. 6). Angesichts der extremen Schwierigkeit der Feldarbeit in dem abgelegenen und dicht bewachsenen Gebiet handelt es sich um sehr hohe Zahlen. Wir haben die Fehler nicht systematisch erfasst und können keine genauen Häufigkeiten für übersehene Objekte angeben. Die Qualität unserer ALS-Daten und die Art der untersuchten archäologischen Strukturen lassen jedoch darauf schließen, dass die Anzahl der Strukturen, die wir möglicherweise übersehen oder falsch gekennzeichnet haben, wahrscheinlich sehr gering ist. Die Erfahrung von Archäologen, die in der Neotropis arbeiten, zeigt, dass aus ALS-Daten abgeleitete Interpretationen sehr zuverlässig sind und dass die Überprüfung vor Ort über größere Gebiete weniger konsistent sein kann, da die Bedingungen eine effiziente Untersuchung unmöglich machen.

Lernen (Training und Validierung) und Testkacheln mit Bodenspuren von zwei Feldverifizierungskampagnen.

ALS-Visualisierungen wurden mit der Relief Visualization Toolbox (Version 2.2.1) berechnet, verfügbar unter https://github.com/EarthObservation/RVT_py.

Der Code zum Erstellen der Satellitendatensätze von Sentinel-1 und Sentinel-2 ist unter https://github.com/EarthObservation/Sentinel-S1-S2-ML-patches-workflow verfügbar.

Chase, AF, Reese-Taylor, K., Fernandez-Diaz, JC & Chase, DZ Fortschritte und Probleme in der mesoamerikanischen Geoinformatik-Revolution: Eine Einführung. Fortschritte in der archäologischen Praxis 4, 219–231 (2016).

Artikel Google Scholar

Beach, T. et al. Einschläge der alten Maya auf die Erdoberfläche: Ein Analogon zum frühen Anthropozän? Quartärwissenschaftliche Rezensionen 124, 1–30 (2015).

Artikel ADS Google Scholar

Canuto, MA et al. Die Komplexität der antiken Tiefland-Maya, wie durch luftgestütztes Laserscannen im Norden Guatemalas aufgedeckt. Wissenschaft 361, eaau0137 (2018).

Artikel ADS PubMed Google Scholar

Chase, AF et al. Luftgestütztes LiDAR, Archäologie und die alte Maya-Landschaft in Caracol, Belize. Journal of Archaeological Science 38, 387–398 (2011).

Artikel Google Scholar

Chase, AF et al. Der Einsatz von LiDAR zum Verständnis der alten Maya-Landschaft: Caracol und Westbelize. Fortschritte in der archäologischen Praxis 2, 208–221 (2014).

Artikel Google Scholar

Ebert, CE, Hoggarth, JA & Awe, JJ integrieren quantitative Lidar-Analyse und Siedlungserhebung im Belize River Valley. Fortschritte in der archäologischen Praxis 4, 284–300 (2016).

Artikel Google Scholar

Fisher, CT, Cohen, AS, Fernandez-Diaz, JC & Leisz, SJ Die Anwendung der luftgestützten Kartierung von LiDAR zur Dokumentation antiker Städte und Regionen in tropischen Regionen. Quaternary International 448, 129–138 (2017).

Artikel ADS Google Scholar

Beach, T. et al. Durch Laserscanning und Multiproxy-Beweise wurden alte Feuchtgebietsfelder der Maya unter dem Blätterdach des Tropenwaldes entdeckt. PNAS 116, 21469–21477 (2019).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Dunning, NP et al. Fehlerspielraum: Anthropogene Geomorphologie der Bajo-Ränder im Maya-Tiefland. Geomorphologie 331, 127–145 (2019).

Artikel ADS Google Scholar

Stanton, TW et al. „Struktur“-Dichte, -Fläche und -Volumen als ergänzende Werkzeuge zum Verständnis der Maya-Siedlung: Eine Analyse von Lidar-Daten entlang der großen Straße zwischen Coba und Yaxuna. Journal of Archaeological Science: Reports 29, 102178 (2020).

Google Scholar

Šprajc, I. et al. Wassermanagement, Landwirtschaft und Gesellschaft der alten Maya in der Gegend von Chactún, Campeche, Mexiko. Journal of Anthropological Archaeology 61, 101261 ​​(2021).

Artikel Google Scholar

Kokalj, Ž. & Hesse, R. Airborne Laserscanning-Rasterdatenvisualisierung: Ein Leitfaden für bewährte Verfahren. (ZRC-Verlag, 2017).

Kokalj, Ž. & Somrak, M. Warum nicht ein einziges Bild? Kombinieren von Visualisierungen zur Erleichterung der Feldarbeit und der Kartierung auf dem Bildschirm. Fernerkundung 11, 747 (2019).

Artikel ADS Google Scholar

Devereux, BJ, Amable, GS & Crow, P. Visualisierung von LiDAR-Geländemodellen zur Erkennung archäologischer Merkmale. Antike 82, 470–479 (2008).

Artikel Google Scholar

Horn, SW III & Ford, A. Jenseits des Zauberstabs: methodische Entwicklungen und Ergebnisse einer integrierten Lidar-Umfrage im alten Maya-Zentrum El Pilar. STAR: Science & Technology of Archaeological Research 0, 1–15 (2019).

Google Scholar

Hutson, SR Anpassung von LiDAR-Daten an regionale Unterschiede in den Tropen: Eine Fallstudie aus dem nördlichen Maya-Tiefland. Journal of Archaeological Science: Reports 4, 252–263 (2015).

Google Scholar

Inomata, T. et al. Monumentale Architektur in Aguada Fénix und der Aufstieg der Maya-Zivilisation. Natur 582, 530–533 (2020).

Artikel ADS CAS PubMed Google Scholar

von Schwerin, J. et al. Luftgestützte LiDAR-Erfassung, Nachbearbeitung und Genauigkeitsprüfung für ein 3D-WebGIS von Copan, Honduras. Journal of Archaeological Science: Reports ume 5, 85–104 (2016).

Google Scholar

Chase, AF & Chase, DZ Erkennung von Maya-Ruinen durch LiDAR: Anwendungen, Fallstudie und Probleme. in Sensing the Past: Vom Artefakt zur historischen Stätte (Hrsg. Masini, N. & Soldovieri, F.) 455–468, https://doi.org/10.1007/978-3-319-50518-3_22 (Springer International Publishing , 2017).

Hansen, RD et al. Entwicklungsdynamik, Energie und komplexe wirtschaftliche Interaktionen der frühen Maya des Mirador-Calakmul-Beckens, Guatemala und Campeche, Mexiko. in Pathways to Complexity (Hrsg. Brown, MK & Bey, GJ) 147–194, https://doi.org/10.2307/j.ctvx075hx.12 (University Press of Florida, 2018).

Inomata, T. et al. Archäologische Anwendung von luftgestütztem LiDAR mit objektbasierten Vegetationsklassifizierungs- und Visualisierungstechniken an der Tiefland-Maya-Stätte von Ceibal, Guatemala. Remote Sens. 9, 563 (2017).

Artikel ADS Google Scholar

Jantz, P., Goetz, S. & Laporte, N. Kohlenstoffbestandskorridore zur Eindämmung des Klimawandels und zur Förderung der Artenvielfalt in den Tropen. Nature Climate Change 4, 138–142 (2014).

Artikel ADS CAS Google Scholar

Ruhl, T., Dunning, NP & Carr, C. Lidar enthüllt mögliches Netzwerk alter Maya-Marktplätze im Südwesten von Campeche, Mexiko. Mexikaner 40, 83–91 (2018).

Google Scholar

Banaszek, Ł., Cowley, DC & Middleton, M. Auf dem Weg zur nationalen archäologischen Kartierung. Bewertung von Quelldaten und Methodik – Eine Fallstudie aus Schottland. Geowissenschaften 8, 272 (2018).

Artikel ADS Google Scholar

Verschoof-van der Vaart, WB & Lambers, K. Lernen, LiDAR zu betrachten: Die Verwendung von R-CNN bei der automatisierten Erkennung archäologischer Objekte in LiDAR-Daten aus den Niederlanden. Journal of Computer Applications in Archaeology 2, 31–40 (2019).

Artikel Google Scholar

Bundzel, M. et al. Semantische Segmentierung luftgestützter LiDAR-Daten in der Maya-Archäologie. Fernerkundung 12, 3685 (2020).

Artikel ADS Google Scholar

Neupane, B., Horanont, T. & Aryal, J. Deep Learning-basierte semantische Segmentierung städtischer Merkmale in Satellitenbildern: Eine Überprüfung und Metaanalyse. Fernerkundung 13, 808 (2021).

Artikel ADS Google Scholar

Somrak, M., Džeroski, S. & Kokalj, Ž. Lernen, Strukturen in ALS-abgeleiteten Visualisierungen antiker Maya-Siedlungen mit CNN zu klassifizieren. Fernerkundung 12, 2215 (2020).

Artikel ADS Google Scholar

Esteva, A. et al. Klassifizierung von Hautkrebs mit tiefen neuronalen Netzen auf Dermatologenebene. Natur 542, 115–118 (2017).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Tj, B. et al. Tiefe neuronale Netze sind Dermatologen bei der Klassifizierung von Melanombildern überlegen. European Journal of Cancer (Oxford, England: 1990) 119, (2019).

Rc, M. et al. Systematische Outperformance von 112 Dermatologen bei der Multiklassen-Klassifizierung von Hautkrebsbildern durch Faltungs-Neuronale Netze. European Journal of Cancer (Oxford, England: 1990) 119 (2019).

Eskreis-Winkler, S. et al. Brust-MRT-Hintergrund-Parenchym-Enhancement-Kategorisierung mithilfe von Deep Learning: Den Radiologen übertreffen. Journal of Magnetic Resonance Imaging 56, 1068–1076 (2022).

Artikel PubMed Google Scholar

Pei, L., Vidyaratne, L., Rahman, MM & Iftekharuddin, KM Kontextbewusstes Deep Learning für die Segmentierung von Hirntumoren, die Klassifizierung von Subtypen und die Überlebensvorhersage mithilfe radiologischer Bilder. Sci Rep 10, 1–11 (2020).

Artikel Google Scholar

Hirsch, L. et al. Leistung auf Radiologenniveau durch Verwendung von Deep Learning zur Segmentierung von Brustkrebs bei MRT-Scans. Radiologie: Künstliche Intelligenz, https://doi.org/10.1148/ryai.200231 (2021).

Šprajc, I. et al. Archäologische Landschaft, Siedlungsdynamik und gesellschaftspolitische Organisation im Chactún-Gebiet im zentralen Maya-Tiefland. PLOS ONE 17, e0262921 (2022).

Artikel PubMed PubMed Central Google Scholar

Caspari, G. & Crespo, P. Faltungs-Neuronale Netze zur Erkennung archäologischer Stätten – Suche nach „Fürstengräbern“. Journal of Archaeological Science 110, 104998 (2019).

Artikel Google Scholar

Bonhage, A. et al. Ein modifizierter, auf Maskenregionen basierender Convolutional Neural Network-Ansatz zur automatisierten Erkennung archäologischer Stätten anhand hochauflösender Lichtdetektion und aus Entfernungsmessungen abgeleiteter digitaler Höhenmodelle im Norddeutschen Tiefland. Archäologische Prospektion 28, 177–186 (2021).

Artikel Google Scholar

Davis, DS, Caspari, G., Lipo, CP & Sanger, MC Deep Learning enthüllt das Ausmaß der archaischen Praktiken des Muschelringbaus der amerikanischen Ureinwohner. Journal of Archaeological Science 132, 105433 (2021).

Artikel Google Scholar

Davis, DS & Lundin, J. Lokalisierung von Kohleproduktionsstandorten in Schweden mithilfe von LiDAR, hydrologischen Algorithmen und Deep Learning. Fernerkundung 13 (2021).

Verschoof-van der Vaart, WB & Lambers, K. Anwendung der automatisierten Objekterkennung in der archäologischen Praxis: Eine Fallstudie aus den südlichen Niederlanden. Archäologische Prospektion 1–17, https://doi.org/10.1002/arp.1833 (2021).

Verschoof-van der Vaart, WB & Landauer, J. Verwendung von CarcassonNet zur automatischen Erkennung und Verfolgung hohler Straßen in LiDAR-Daten aus den Niederlanden. Journal of Cultural Heritage 47, 143–154 (2021).

Artikel Google Scholar

Kazimi, B., Thiemann, F. & Sester, M. Semantische Segmentierung künstlicher Landschaftsstrukturen in digitalen Geländemodellen. ISPRS Annals of Photogrammetry, Remote Sensing and Spatial Information Sciences 42W7, 87–94 (2019).

Artikel Google Scholar

Soroush, M., Mehrtash, A., Khazraee, E. & Ur, JA Deep Learning in der archäologischen Fernerkundung: Automatisierte Qanat-Erkennung in der Region Kurdistan im Irak. Fernerkundung 12, 500 (2020).

Artikel ADS Google Scholar

Guyot, A., Lennon, M., Lorho, T. & Hubert-Moy, L. Kombinierte Erkennung und Segmentierung archäologischer Strukturen aus LiDAR-Daten mithilfe eines Deep-Learning-Ansatzes. Journal of Computer Applications in Archaeology 4, 1–19 (2021).

Artikel Google Scholar

Banasiak, PZ et al. Semantische Segmentierung (U-Net) archäologischer Merkmale beim luftgestützten Laserscanning – Beispiel des Białowieża-Waldes. Fernerkundung 14, 995 (2022).

Artikel ADS Google Scholar

Küçükdemirci, M., Landeschi, G., Ohlsson, M. & Dell'Unto, N. Untersuchung alter landwirtschaftlicher Feldsysteme in Schweden anhand luftgestützter LIDAR-Daten mithilfe eines Faltungs-Neuronalen Netzwerks. Archäologische Prospektion 30, 209–219 (2023).

Artikel Google Scholar

Kazimi, B., Thiemann, F. & Sester, M. Objektinstanzsegmentierung in digitalen Geländemodellen. in Computer Analysis of Images and Patterns (Hrsg. Vento, M. & Percannella, G.) 488–495, https://doi.org/10.1007/978-3-030-29891-3_43 (Springer International Publishing, 2019) .

Simidjievski, N. et al. Entdecken Sie die Geheimnisse der Maya: ECML PKDD 2021 – Discovery Challenge. (2021).

Entdecken Sie die Geheimnisse der Maya. Ausgewählte Beiträge aus der Machine Learning Challenge und dem Discveory Challenge Workshop, ECML PKDD 2021. (Jožef Stefan Institut, 2022).

Dunning, NP & Beach, T. Bauernhöfe und Wälder: Räumliche und zeitliche Perspektiven auf antike Maya-Landschaften. in Landscapes and Societies: Selected Cases (Hrsg. Martini, IP & Chesworth, W.) 369–389, https://doi.org/10.1007/978-90-481-9413-1_23 (Springer Niederlande, 2011).

Beach, T. et al. Stabilität und Instabilität auf tropischen Hügelböden des Maya-Tieflandes. Geomorphologie 305, 185–208 (2018).

Artikel ADS Google Scholar

Šprajc, I. Einleitung. in Archäologische Erkundungen in Chactún, Campeche, Mexiko (Hrsg. Šprajc, I.) 1–3 (Založba ZRC, 2015).

Šprajc, I., Flores Esquivel, A. & Marsetič, A. Beschreibung der Website. in Archäologische Erkundungen in Chactún, Campeche, Mexiko (Hrsg. Šprajc, I.) 5–24 (Založba ZRC, 2015).

Šprajc, I. et al. Chactún, Tamchén und Lagunita: erste archäologische Vorstöße in eine unbekannte Region. Mexican Archaeology 24, 20–25 (2015).

Google Scholar

Archäologische Erkundung im Osten von Campeche, Mexiko: Chactun, Tamchen und Lagunita. (Tulane University, 2021).

Fernandez-Diaz, JC, Carter, WE, Shrestha, RL & Glennie, CL Jetzt sehen Sie es ... jetzt sehen Sie es nicht: Grundlegendes zur LiDAR-Erfassung und Datenproduktgenerierung für die Luftkartierung für die archäologische Forschung in Mesoamerika. Remote Sens. 6, 9951–10001 (2014).

Artikel ADS Google Scholar

Fernandez-Diaz, JC et al. Fähigkeitsbewertung und Leistungsmetriken für das Titan Multispectral Mapping Lidar. Remote Sens. 8, 936 (2016).

Artikel ADS Google Scholar

Axelsson, P. DEM-Generierung aus Laserscannerdaten mithilfe adaptiver TIN-Modelle. in International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences – ISPRS Archives vol. 33, 110–117 (Internationale Gesellschaft für Photogrammetrie und Fernerkundung, 2000).

Kokalj, Ž. & Oštir, K. Lidar-Datenvisualisierung und -verarbeitung. in The Encyclopedia of Archaeological Sciences 1–6, https://doi.org/10.1002/9781119188230.saseas0347 (John Wiley & Sons, Ltd, 2018).

Khosravipour, A., Skidmore, AK & Isenburg, M. Generierung spitzenfreier digitaler Oberflächenmodelle mithilfe von LiDAR-Rohpunktwolken: Ein neuer Ansatz für forstwirtschaftliche Anwendungen. International Journal of Applied Earth Observation and Geoinformation 52, 104–114 (2016).

Artikel ADS Google Scholar

Modifizierte Copernicus Sentinel-Daten (2017–2020). Sentinel Hub https://apps.sentinel-hub.com/eo-browser (2023).

Sentinel-1-Missionsleistungszentrum. S-1 Jährlicher Leistungsbericht für 2022. 117, https://sentinel.esa.int/documents/247904/4889382/DI-MPC-APR-0588-1-2-track-Annual+Performance+Report+2022.pdf /a683c9d2-06c2-9143-b456-4a9c8e30e449?t=1678771841042 (2023).

Aleksandrov, M. et al. Der Wolkendetektor von Sentinel Hub für Sentinel-2-Bilder. (2020).

Sentinel-2 MSI Expert Support Laboratory-Team. Sentinel-2 Annual Performance Report – Jahr 2022. 132, https://sentinels.copernicus.eu/documents/247904/4893455/OMPC.CS.APR.001+-+i1r0+-+S2+MSI+Annual+Performance+Report +2022.pdf (2023).

Kokalj, Ž. et al. Für maschinelles Lernen geeignete Fernerkundungsdaten für die Maya-Archäologie: Masken, ALS-Daten, Sentinel-1, Sentinel-2. figshare https://doi.org/10.6084/m9.figshare.22202395 (2023).

Europäische Weltraumorganisation. Sentinel-2-Spektralantwortfunktionen (S2-SRF). 5, https://sentinels.copernicus.eu/documents/247904/685211/S2-SRF_COPE-GSEG-EOPG-TN-15-0007_3.1.xlsx (2022).

Referenzen herunterladen

Für die beschriebene Studie wurden alle erforderlichen Genehmigungen eingeholt und alle relevanten Vorschriften eingehalten. Die Forschung wurde vom Instituto Nacional de Antropología e Historia (INAH), Mexiko, genehmigt (Consejo de Arqueología genehmigt 401.1 S.3-2017/117 vom 30. Januar 2017 und 401.1 S.3-2018/132 vom 30. Januar). , 2018) und vom Biosphärenreservat Calakmul genehmigt (Genehmigungen D-RBC-029/2017 vom 17. März 2017 und D-RBC-039/2018 vom 22. März 2018). Die Forschung wurde von der slowenischen Forschungsagentur durch das Chactún-Regionalprojekt (J6-7085; 2016-18) und die Forschungsprogramme Anthropologische und räumliche Studien (P6-0079; 2015-21), Erdbeobachtung und Geoinformatik (P2-0406; 2019) finanziert -24) und Wissenstechnologien (P2-0103; 2022-27) sowie vom Projekt der Europäischen Weltraumorganisation Artificial Intelligence Toolbox for Earth Observation (AiTLAS 2020-21). Die Feldforschung wurde von der KJJ Charitable Foundation unter dem Vorsitz von Ken und Julie Jones (USA) mitfinanziert und zusätzlich unterstützt von Hotel Río Bec Dreams (Mexiko), Ars longa, Adria Kombi, Abanka, Zavarovalnica Triglav, Rokus Klett, Parka Group, GKTI, BSL, Klemen Fedran, Martin Hobel und Aleš Obreza (Slowenien).

Forschungszentrum der Slowenischen Akademie der Wissenschaften und Künste (ZRC SAZU), Novi trg 2, 1000, Ljubljana, Slowenien

Žiga Kokalj, Ivan Šprajc, Jasmina Štajdohar, Andrej Draksler & Maja Somrak

Informations- und Kommunikationstechnologien, Jožef Stefan International Postgraduate School, Jamova cesta 39, 1000, Ljubljana, Slowenien

Sašo Džeroski & Maja Somrak

Jožef-Stefan-Institut, Jamova cesta 39, 1000, Ljubljana, Slowenien

Sašo Džeroski

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Ž.K. konzipierte und gestaltete die Forschung, lieferte die für die Vermessung benötigte ALS-Datenspezifikation und verarbeitete die gesammelten ALS-Daten zur Erstellung digitaler Höhenmodelle, führte die technische Validierung durch, analysierte die Satellitendaten und entwarf die Abbildungen. IST. konzipierte und gestaltete die Felduntersuchungen, führte die technische Validierung vor Ort durch und lieferte als wichtigster archäologischer Experte für Maya-Kultur und -Siedlungen unschätzbares Fachwissen und Anleitung zur Kommentierung künstlicher Strukturen. J.Š. war für den manuellen Beschriftungsprozess verantwortlich und kommentierte über 12.000 Strukturen. MS generierte ALS-Visualisierungen, erstellte entsprechende Binärmasken aus Polygonanmerkungen, führte Bodenbearbeitung durch, anonymisierte die Daten und teilte den Datensatz auf. AD hat die Sentinel-Zeitreihe verarbeitet. SD beriet bei der Erstellung des Datensatzes. Alle Autoren waren an der Erstellung und Bearbeitung des Textes beteiligt. Alle Autoren haben die veröffentlichte Version des Manuskripts gelesen und ihr zugestimmt.

Korrespondenz mit Žiga Kokalj.

Die Autoren geben an, dass kein Interessenkonflikt besteht. Die Geldgeber spielten keine Rolle bei der Gestaltung der Studie, bei der Erhebung, Analyse oder Interpretation von Daten, beim Verfassen des Manuskripts oder bei der Entscheidung zur Veröffentlichung der Ergebnisse.

Anmerkung des Herausgebers Springer Nature bleibt hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten neutral.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative-Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht durch gesetzliche Vorschriften zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Kokalj, Ž., Džeroski, S., Šprajc, I. et al. Für maschinelles Lernen geeignete Fernerkundungsdaten für die Maya-Archäologie. Sci Data 10, 558 (2023). https://doi.org/10.1038/s41597-023-02455-x

Zitat herunterladen

Eingegangen: 08. März 2023

Angenommen: 08. August 2023

Veröffentlicht: 23. August 2023

DOI: https://doi.org/10.1038/s41597-023-02455-x

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt