Referenzspezifikation

Offizielle Protokollspezifikation

Invarianter deterministischer Vertrag für die strukturelle Scoring-Äquivalenz von SIAS SEO.

Überblick über die Spezifikation

I. Mathematische Kern-Engine

Um Auditergebnisse auf Binärebene äquivalent zu halten, müssen Implementierungen das folgende gewichtete Modell anwenden:

$$S_{Gesamt} = \sum_{i \in \{D, C, F, V, SC\}} w_i \cdot s_i$$ Gewichtung: $w_D=0.25, w_C=0.20, w_F=0.30, w_V=0.15, w_{SC}=0.10$ D-Score (Hierarchie): Ein fester Abzug von 0.35, wenn $H1 \neq 1$. Bonus von 0.98, wenn $H2 \ge 2$. C-Score (Dichte): Logarithmische Skalierung basierend auf 300 Wörtern. Untergrenze bei 0.1. V-Score (Sicherheit): Absolute Voraussetzung für TLS. Unsichere Endpunkte werden auf 0.30 limitiert.

II. Kanonischer DOM-Snapshot (CDS)

Der Kanonische DOM-Snapshot gewährleistet strukturelle Äquivalenz ohne heuristische Abweichungen:

1. Normalisierung: Unicode NFC → Case Folding → Whitespace-Reduktion.
2. Hierarchie-Wahrung: Sequentielle Ordnung muss verifiziert werden (H1 > H2 > H3).
3. Dichtebasis: Mindestens 300 Token für vollständige Sättigung erforderlich.
4. Entity-Signale: Obligatorische Prüfung von favicon.ico und lang-Attributen.

III. URI-Integrität und Autorität (F-Score)

- Kanonisierung: Erzwungene rel="canonical" Prüfung.
- Schema-Extraktion: Unterstützung für application/ld+json mit verschachtelter @graph Auflösung.
- Soziale Signale: Prüfung auf OpenGraph Titel, Beschreibung und Bild-Äquivalenz.

IV. Status- und Fehlerregister

Code Konstante Diagnostische Erklärung
0x00 STATUS_OK Erfolg mit Nullabweichung. Strukturelle Integrität verifiziert.
0x01 ERR_SEC_TLS Unsicherer Endpunkt. V-Score wurde limitiert.
0x02 ERR_MATH_DOMAIN Unzureichende Wortzahl oder ungültiges Logarithmus-Argument.
0x03 ERR_DOM_HIERARCHY Verletzung der H1-Anzahl oder nicht-sequentielle Überschriften-Sprünge.
0x04 ERR_CANON_MISSING Fehlendes rel="canonical" in autoritativen Dokumenten.
0x05 ERR_HASH_FAIL Fehler bei der Integritätsprüfung gegen den Master Core.