GIS-Grundlagen: Raster-Operationen und Datenmodelle

Eingeordnet in Informatik

Geschrieben am in mit einer Größe von 18,14 KB

Funktionen der Raster-Analyse

Fokale Operationen (Focal)

Fokale Summe: Weist jeder Position der Ausgabeschicht die Summe der Werte zu, welche die Variable in den Zellen einer Umgebung um diese Position im Input-Layer annimmt. Der Input-Layer sollte ein Mindestabstand und die Ausgangsgröße ein Anteil sein. Dies dient als Zwischenschritt bei der Bestimmung lokaler Dichten eines Phänomens.

Fokales Perzentil: Weist jeder Zelle in der Ausgabeschicht den Anteil der Zellen in der Umgebung dieser Position im Input-Layer zu, die einen niedrigeren Wert aufweisen. Es ist mindestens auf ordinale Variablen anwendbar und ermöglicht es, lokale Maxima und Minima einer Variablen zu finden.

Fokale Vielfalt (Brennweite): Weist jeder Zelle in der Ausgabeschicht die Anzahl der unterschiedlichen Werte der Variablen in ihrer unmittelbaren Umgebung im Input-Layer zu. Diese Funktion ist auf alle Arten von Variablen anwendbar und passt zwischen die Funktionen der unmittelbaren Umgebung. Sie kann zur Angleichung der Grenzen von Zonen im Input-Layer verwendet werden.

Fokales Perzentil (Wiederholung): Weist jeder Zelle in einer Ausgabeschicht den Anteil der Zellen in ihrer unmittelbaren Umgebung mit einem geringeren Wert als dem eigenen Wert im Input-Layer zu. Die Variable muss mindestens ordinal sein, da ein Vergleich der Minderwertigkeit stattfindet. Mit dieser Funktion können lokale Maxima des Input-Layers gefunden werden.

Fokale Nähe (Focus): Weist jeder Zelle in der Ausgabeschicht die euklidische Distanz zur nächsten Zelle mit einem Wert ungleich Null im Input-Layer zu. Die Variable des Input-Layers kann von jedem Typ sein; sie steht in keinem festen Verhältnis.

Nachbarschaftsfokus: Weist jeder Zelle in der Ausgabeschicht den Wert der nächsten Zelle mit einem Wert ungleich Null im Input-Layer zu. Die Themenvariable kann jedem der vier Typen angehören.

Insularitätsschwerpunkt: Zuweisung einer eindeutigen Kennung für jede Gruppe von verbundenen Zellen, die den gleichen Wert der Themenvariable in einer Schicht haben. Es kann mehrere Gruppen von benachbarten Positionen geben, die disjunkt voneinander sind, aber alle den gleichen Wert der Variablen haben. Die Positionen der einzelnen Gruppen entsprechen dem gleichen Bereich in der Ausgangsschicht, aber verschiedenen Bereichen in der Zielschicht.

Fokale Gravitation: Weist jeder Position in der Ausgabeschicht den gewichteten Durchschnitt der Werte der Nicht-Null-Brennpunkte des Input-Layers zu. Der Gewichtungsfaktor ist das inverse Quadrat der Entfernung zu jedem Schwerpunkt ungleich Null. Dies gilt nur für numerische Variablen (Intervall- oder Verhältnisskala). Die Umgebung ist nicht auf die acht unmittelbar angrenzenden Positionen beschränkt, sondern erweitert.

Lokale Operationen (Local)

Lokaler Mittelwert (Lokale Medien): Berechnet den Wert jeder Zelle in der Ausgabeschicht aus den Werten der gleichen Zelle in den Eingabeschichten unter Verwendung der Operation „Average“ (Mittelwert). Die Variablen der Input-Schichten müssen numerisch sein (Mindestabstand), und die Output-Schicht muss vom gleichen Typ sein.

Lokales Maximum: Berechnet den Wert jeder Zelle in der Ausgabeschicht aus den Werten der gleichen Zelle in den Eingabeschichten unter Verwendung der Operation „Maximum“. Die Variablen der Eingabeschichten müssen ordinal sein, und die Output-Schicht muss vom gleichen Typ sein.

Lokaler Modus: Berechnet den Wert jeder Zelle in der Ausgabeschicht aus den Werten der gleichen Zelle in den Eingabeschichten unter Verwendung der Operation „Modal“. Die Variablen der Eingabeschichten müssen nominal sein, und der Output-Layer ist vom gleichen Typ.

Weitere räumliche Analysen

Inkrementeller Gradient: Berechnet, wie der Wert einer räumlich variierenden Variable aus einer Schicht variiert. Dies betrifft die unmittelbare Umgebung jeder Zelle, um die expliziten Werte der Variablen mit dem impliziten Abstand zum Fokus zu konzentrieren.

Zonale Operationen (Zonal)

Zonale Summe (Add zonal): Alle Zellen in jeder Gruppe der Ausgabeschicht erhalten den Wert, der sich aus der Addition der Werte der entsprechenden Eingabeschicht ergibt.

Zonaler Mittelwert (Zonal mean): Alle Zellen in jeder Gruppe der Ausgabeschicht erhalten den Durchschnittswert der entsprechenden Eingabeschicht. Dies ist anwendbar auf Schichten mit Intervall- oder Verhältnisvariablen. Beispiel: Durchschnittliche Höhen.

Zonales Maximum, Minimum und Modus: Alle Zellen in jeder Gruppe der Ausgabeschicht erhalten den resultierenden Wert (Maximum, Minimum oder Modus) der Werte der entsprechenden Gruppe der Eingangsschicht.

Variablentypen im thematischen Rastermodell

  • Verhältnisvariablen (Anteil): Werte bezogen auf eine geeichte Skala mit festem Nullpunkt, sodass das Verhältnis zwischen zwei Werten wesentlich für das Phänomen ist.
  • Intervallvariablen: Werte auf einer geeichten Skala ohne festen Nullpunkt, sodass die Differenz zwischen zwei Werten wesentlich ist.
  • Ordinalvariablen: Werte auf nicht-geeichten Skalen, sodass der Vergleich von Überlegenheit oder Unterlegenheit wesentlich ist.
  • Nominalvariablen (Ratings): Werte repräsentieren Qualitäten als Mengen, ohne Zusammenhang mit einer numerischen Messskala.

Theoretische Grundlagen der Geoinformatik

Eigenschaften zonaler Operationen

Die Schicht der Ergebnisse einer zonalen Operation behält unbedingt die gleiche Anzahl von Zonen bei, die als Eingangs-Schicht verwendet wurden. Das Ergebnis der Operationen mit den Daten aus der Schicht oder den Schichten wird nach Zonen eingeteilt. Schichtbereiche können in zwei oder mehr Fällen übereinstimmen, sodass die Anzahl der Zonen in der Ausgabeschicht höchstens gleich der Ebene der Regionen ist, aber auch geringer sein kann.

Rolle von Data Dictionaries

Datenwörterbücher ermöglichen es, Datenstrukturen zu schaffen, aufzubauen und die Datendateien in einer GIS-Umgebung, die in dieser Art von Einheit organisiert ist, angemessen zu interpretieren.

Speicherung von Geodaten in relationalen Datenbanken

Datentypen: In jeder Spalte und jeder Zeile wird der Wert einer einzigen Koordinate gespeichert. Punkt-Tabellen können durch die Bindung relationaler Tabellen mit spezifischen Objekten oder polygonalen Tabellen verbunden werden. Diese sind wiederum mit Tabellen für lineare Funktionen oder Polygone verknüpft, welche wiederum mit Flächentabellen verbunden sind.

Spalten als „Bitstream“ (BLOB): Die vollständige Sequenz von Koordinaten eines Objekts wird in jeder Zeile in einer Spalte gespeichert. Dies kann in derselben Tabelle wie die restlichen Daten oder in speziellen Tabellen ausschließlich für Positionsdaten erfolgen, die über relationale Verknüpfungen mit den Attributen verbunden sind. Konzeptionell wird die Position als Ganzes behandelt, um die 1. Normalform nicht zu verletzen.

Sliver-Polygone (Fiktive oder Fetzen-Polygone)

Polygone entstehen durch geometrische Missverhältnisse zwischen Linien, die übereinstimmen sollten. Dies geschieht, wenn die primitive Topologie-Ebene nicht exakt mit der Null-Level-Topologie übereinstimmt. Sie entstehen oft bei der Integration von Daten aus verschiedenen Quellen oder durch Fehler im Scan-Prozess. Es handelt sich um sehr schmale und längliche Polygone, bei denen das Verhältnis der Fläche zum Quadrat des Umfangs sehr klein ist. Über einen Schwellenwert für dieses Verhältnis kann das System solche potenziell fiktiven Polygone identifizieren.

Definition grundlegender Raum-Operatoren

Ein räumlicher Operator ist elementar, wenn er einen kompletten Satz von Operatoren auf kleinstem Raum umfasst, da für jede räumliche Lage ein spezifischer Satz von Operatoren gilt.

Das Entity-Relationship-Modell (ERM)

Eigenschaften von Beziehungen

  • Rollen: Funktion der einzelnen Mitglieder in der Beziehung.
  • Kardinalität: Maximale Anzahl der Entitäten, die zueinander in Beziehung stehen (1:1, 1:M, M:M).
  • Optionalität (Need-Unvorhergesehen): Notwendigkeit der Beziehung für jedes Mitglied (vollständige oder teilweise Teilnahme).

Räumliche Indizes

Räumliche Indizes basieren auf dem Aufbau einer umfassenden Zellen-Beschichtung und der Assoziation der Kennungen jeder Zelle mit den Positionsdaten (Geometrie, Primitive) über eine Tabelle. Ihr Zweck ist die Beschleunigung von Prozessen wie:

  • Auffinden eines Punktes (Locate).
  • Suchen einer Campus-Einheit (Suchen auf der Baustelle).
  • Lage eines Objekts durch die räumliche Beziehung zu anderen (Link räumliche Beziehung).

Diskriminanzanalyse und topologische Primitive

In welcher Funktion erfolgt die Diskriminanzanalyse von Raum-Operatoren mit topologischen Primitiven? Innerhalb der Sätze von primitiven Einheiten, deren räumliche Lage analysiert wird, und unter Berücksichtigung der Anzahl der Ergebnisse in den Transaktionen zwischen diesen Sets.

Zusammengesetzte Entitäten

Eine Entität ist eine Gruppe von Unternehmen, die rekursiv (Komponenten können einfach oder zusammengesetzt sein) zusammengefasst sind. Gründe für ihren Einsatz sind:

  • Repräsentation von Objekten, die verschiedene Geometrietypen benötigen.
  • Repräsentation von Objekten, die mehrere Objekte desselben Geometrietyps benötigen.
  • Darstellung von Objekten, bei denen einige Attribute konstant sind, während andere variieren.
  • Bequemlichkeit beim Aufbau eines Benutzermodells.

Datenbankstrukturen und Normalisierung

Einheiten der Aktualisierung und Löschung

Die kleinste Einheit von Daten, die in einer Tabelle aktualisiert oder ausgewählt werden kann, ist die Spalte, da sonst gegen die erste Normalform (atomare Werte) verstoßen würde. Die kleinste Einheit, die eingefügt oder gelöscht werden kann, ist die Zeile, da die Anzahl der Spalten in allen Zeilen einer Tabelle identisch sein muss.

Elemente des ER-Modells und ihre Entsprechungen

  • Entität (Bank): Darstellung eines realen Phänomens. Entspricht einer Zeile in der Tabelle.
  • Attribut: Information über eine Eigenschaft der Entität. Entspricht einer Spalte.
  • Domäne: Wertebereich, den ein Attribut annehmen kann. Entspricht dem Datentyp der Spalte.
  • Beziehung: Verbindung zwischen Entitäten.
  • Entitätsklasse: Menge von Entitäten gleicher Art. Entspricht einer Tabelle.

Vertretung: 1:1 und 1:M Beziehungen werden durch direkte Verbindungen (Fremdschlüssel) zwischen Tabellen dargestellt. M:M Beziehungen erfordern eine zusätzliche Verknüpfungstabelle.

Vektor-Topologie und Orientierung

Die Spaltenorientierung wird in Tabellen verwendet, die lineare Einheiten (Bögen) und topologische Flächen (Arc-to-Face) definieren. In der Arc-Tabelle werden Bögen positiv orientiert, wenn ihre Richtung mit der Scan-Richtung übereinstimmt, andernfalls negativ. In der Flächentabelle muss die äußere Grenze im Uhrzeigersinn und die innere Grenze (Inseln) gegen den Uhrzeigersinn verlaufen.

Integration von Geodaten

Prozesse der Datenintegration

  • Format-Konvertierung: Nutzung von Übersetzern und Vereinheitlichung des Klassifikationssystems.
  • Punktdichte: Anpassung der Punktdichte auf Linien bei Projektionstransformationen.
  • Projektionstransformationen: Umrechnung von Kartenprojektion, Ellipsoid und Datum. Diese Transformationen sind nicht-linear; sie als linear zu bezeichnen, ist ein schwerwiegender konzeptioneller Fehler.
  • Koordinatentransformation: Vereinheitlichung des Referenzsystems (affin, Helmert oder nicht-linear bei verformten Dokumenten).
  • Geometrische Bearbeitung: Korrektur von Unstimmigkeiten durch Digitalisierungsfehler.
  • Reorganisation: Anpassung horizontaler und vertikaler Partitionen.

Matrix-Klassifikation (9-Intersection-Modell)

Kriterien für den Bau von Matrizen für spezielle Situationen umfassen Schnittpunkte zwischen Untergruppen der räumlichen Lage: Verschlüsse, Grenzen, Innen- und Außenbereiche. Die 4-Schnitt-Matrix betrachtet Grenze und Inneres; die 9-Schnitt-Matrix zusätzlich das Äußere. Werte können binär (leer/nicht leer) oder nach der maximalen Dimension (-1 für leer, 0 für Knoten, 1 für Bögen, 2 für Flächen) kodiert werden.

Notwendigkeit von Werten im Rastermodell

Warum ist es notwendig, im Rastermodell Werte in allen Zellen zu registrieren? Die räumliche Verteilung wird aus der geordneten Abfolge der Werte abgeleitet. Ohne Werte für jede Position wäre diese Schlussfolgerung unmöglich. Daher muss jede Position kodiert werden, gegebenenfalls mit Null.

Topologische Primitive im Vektor-Modell

„Die topologischen Primitive schließen sich im Vektor-Modell der kompletten Topologie gegenseitig aus.“ Was bedeutet das? Im Rastermodell (hier scheint ein Textfehler vorzuliegen, der Text wiederholt die Raster-Erklärung): Die räumliche Verteilung wird aus der geordneten Abfolge abgeleitet. Es ist notwendig, jeden Wert zu kodieren.

Harmonisierung von Positionsdaten

Harmonisierung ist die Lokalisierung, Vereinheitlichung und Verschmelzung von Daten für Objekte, die dieselbe reale Person/Sache darstellen. Man unterscheidet:

  • Vertikale Harmonisierung: Zwischen überlappenden Datensätzen.
  • Horizontale Harmonisierung (Anpassung der Grenzen): Zwischen angrenzenden Regionen.

Fehlererkennung bei Flächenelementen

  • Allgemeiner Bereich: Vergleich nach Teilung der Schnittmenge durch die Vereinigungsmenge.
  • Dehnung: Vergleich des Verhältnisses von Fläche zum Quadrat des Umfangs (sollte nahe 1 sein).
  • Lineare Diskrepanz: Maximal erlaubter Abstand zwischen den Perimetern zweier Oberflächenentitäten.

Kriterien für die horizontale Harmonisierung

  • Winkel: Maximale Abweichung von der geraden Linie.
  • Maximale Entfernung: Maximale Trennung zwischen Linienenden.
  • Minimale Länge: Mindestlänge der Entitäten beim Ausgleich der Abweichung.

Datenbank-Theorie und Normalformen

Determinanten und funktionale Abhängigkeit

Determinante: Wenn für jeden Wert von A in einer Tabelle T genau ein Wert von B existiert, ist A eine Determinante von B. In der Boyce-Codd-Normalform sollten alle Determinanten Kandidatenschlüssel sein.

  • Funktionale Abhängigkeit: B ist abhängig von A, wenn jede Kombination von A genau eine Kombination von B bestimmt.
  • Volle funktionale Abhängigkeit: B hängt voll von A ab, wenn A eine Determinante ist und keine echte Teilmenge von A ebenfalls eine Determinante für B ist.

Schritte zur Beseitigung systematischer Unterschiede

  • Vereinheitlichung des Bezugssystems (Kartenkoordinaten zu geodätischen Koordinaten).
  • Änderung des Datums.
  • Koordinatentransformation zur Beseitigung von Materialisierungsfehlern.

Probleme der Vektor-Topologie bei Null-Level

Im Null-Level-Vektormodell werden Positionsdaten direkt als Eigenschaften geografischer Einheiten gespeichert. Bei räumlicher Koinzidenz führt dies zu unnötiger Redundanz und Inkonsistenzen. In Modellen höherer Ebenen werden Positionsdaten mit Primitiven (Knoten, Bögen) verknüpft, was Duplikate vermeidet.

Die Normalformen

  • Erste Normalform (1NF): Keine doppelten Zeilen, atomare Werte (unteilbar), Reihenfolge der Zeilen/Spalten ist irrelevant.
  • Zweite Normalform (2NF): Erfüllt 1NF; jede Nicht-Primärschlüssel-Spalte ist voll funktional abhängig vom Primärschlüssel.
  • Dritte Normalform (3NF): Erfüllt 2NF; keine transitiven Abhängigkeiten zwischen Primärschlüssel und anderen Spalten.
  • Boyce-Codd-Normalform (BCNF): Erfüllt 3NF; jede Determinante ist ein Kandidatenschlüssel.

Räumliche Operatoren

Ein räumlicher Operator formalisiert die Bedingungen, die zwei Entitäten erfüllen müssen, um in einer bestimmten räumlichen Lage zueinander zu stehen. Er entscheidet, ob und wie Einheiten die räumliche Lage teilen.

Kardinalität und Kandidatenschlüssel

Die Anzahl der verschiedenen Werte eines Kandidatenschlüssels ist gleich der Kardinalität der Tabelle (Anzahl der Zeilen), da ein Kandidatenschlüssel jede Zeile eindeutig identifizieren muss.

Fremdschlüssel-Constraint und Differential

Fremdschlüssel: Eine Spalte in Tabelle T1, die dem Primärschlüssel in T2 entspricht. Sie dient der Verknüpfung (1:1, 1:M) und sichert die referenzielle Integrität (Differential).

GIS-Implementierungsumgebungen

  • Unitäre Umgebung: Alle Daten (Position und Attribute) sind in derselben Struktur (Dateien oder Datenbanken) gespeichert.
  • Unitäre Umgebung auf Dateibasis: Erfordert Wörterbücher. Nachteile: Nutzer muss Speicherorte kennen, Konflikte bei Mehrfachzugriff, maximale Dateigrößen des Betriebssystems.
  • Unitäre Umgebung auf Datenbankbasis: Effiziente Lösung für Datenprobleme, aber oft nicht für das große Volumen von Positionsdaten optimiert (Reaktionszeiten).
  • Hybride Umgebung: Positionsdaten werden in Dateien (grafische Pakete) gespeichert, beschreibende Daten in relationalen Datenbanktabellen.

Verwandte Einträge: