Überblick über die Spezifikation
- Gewichtetes zusammengesetztes strukturelles Scoring-Modell
- Deterministische Hierarchie-Validierung
- Sicherheits- und Canonical-Autoritätsanforderungen
- Standardisiertes Diagnoseregister
I. Mathematische Kern-Engine
Um Auditergebnisse auf Binärebene äquivalent zu halten, müssen Implementierungen das folgende gewichtete Modell anwenden:
$$S_{Gesamt} = \sum_{i \in \{D, C, F, V, SC\}} w_i \cdot s_i$$
Gewichtung: $w_D=0.25, w_C=0.20, w_F=0.30, w_V=0.15, w_{SC}=0.10$
D-Score (Hierarchie): Ein fester Abzug von 0.35, wenn $H1 \neq 1$. Bonus von 0.98, wenn $H2 \ge 2$.
C-Score (Dichte): Logarithmische Skalierung basierend auf 300 Wörtern. Untergrenze bei 0.1.
V-Score (Sicherheit): Absolute Voraussetzung für TLS. Unsichere Endpunkte werden auf 0.30 limitiert.
II. Kanonischer DOM-Snapshot (CDS)
Der Kanonische DOM-Snapshot gewährleistet strukturelle Äquivalenz ohne heuristische Abweichungen:
1. Normalisierung: Unicode NFC → Case Folding → Whitespace-Reduktion.
2. Hierarchie-Wahrung: Sequentielle Ordnung muss verifiziert werden (H1 > H2 > H3).
3. Dichtebasis: Mindestens 300 Token für vollständige Sättigung erforderlich.
4. Entity-Signale: Obligatorische Prüfung von favicon.ico und lang-Attributen.
III. URI-Integrität und Autorität (F-Score)
- Kanonisierung: Erzwungene rel="canonical" Prüfung.
- Schema-Extraktion: Unterstützung für application/ld+json mit verschachtelter @graph Auflösung.
- Soziale Signale: Prüfung auf OpenGraph Titel, Beschreibung und Bild-Äquivalenz.
IV. Status- und Fehlerregister
| Code |
Konstante |
Diagnostische Erklärung |
| 0x00 |
STATUS_OK |
Erfolg mit Nullabweichung. Strukturelle Integrität verifiziert. |
| 0x01 |
ERR_SEC_TLS |
Unsicherer Endpunkt. V-Score wurde limitiert. |
| 0x02 |
ERR_MATH_DOMAIN |
Unzureichende Wortzahl oder ungültiges Logarithmus-Argument. |
| 0x03 |
ERR_DOM_HIERARCHY |
Verletzung der H1-Anzahl oder nicht-sequentielle Überschriften-Sprünge. |
| 0x04 |
ERR_CANON_MISSING |
Fehlendes rel="canonical" in autoritativen Dokumenten. |
| 0x05 |
ERR_HASH_FAIL |
Fehler bei der Integritätsprüfung gegen den Master Core. |