Alte Metriken versagen

Eine starke Marke generiert 79% ihres Traffics organisch und 3% über Meta-Ads. Das Meta-Pixel sieht trotzdem 100% des Nutzerverhaltens und liefert es an die Plattform zurück. Meta nutzt diese Daten, um ihre Targeting-Modelle zu verbessern, und verkauft diese Modelle danach über ihre Werbeprodukte an Konkurrenzmarken: Die Marke zahlt für ihre eigene Demontage. Im Dashboard sieht alles grün aus. Dieses Beispiel trifft den Kern dessen, was in der Werbe-Messung seit langer Zeit passiert.

Mit den vier vorangegangenen Trends hat sich strukturell verschoben, was Werbe-Messung überhaupt erfassen kann. Last-Click ist da nur das auffälligste Beispiel.

Reichweite wandert in KI-Antworten, die kein klassisches Tracking erlauben. Werbung läuft in Chat-Interfaces, in denen MRC-Viewability nicht definiert ist – kein DOM, keine Scroll-Tiefe. Conversion-Pixel funktionieren auch hier (ChatGPT Ads erlauben das via CAPI), aber sie messen den Klick, nicht die Wirkung dazwischen. Agenten kaufen Werbeflächen, ohne dass die Briefing-Qualität sichtbar bleibt. Konsumenten verschwinden hinter Einkaufs-Agenten, ohne Click-Pfad, ohne Pixel-Anker.

Das ist nicht ganz neu. TV-Reichweite war immer Panel-Schätzung, Print-Auflage seit 1914 ein Verhandlungs-Wert, Out-of-Home nie pixelgenau. Die zwanzig digitalen Jahre mit Cookies und Pixeln waren die Ausnahme – eine kurze Epoche, in der Werbewirkung scheinbar eindeutig zählbar war. Diese Ausnahme zerfällt und führt zurück zu dem, was klassische Mediengattungen schon immer kannten: eine Zahl, die per Konsens entsteht, nicht per Messung.

Vier Verschiebungen, eine gemeinsame Eigenschaft: Sie entziehen sich der Mess-Infrastruktur, mit der die Branche seit zwanzig Jahren operiert. Cookies sind nicht der Kern. Der Kern ist, dass die Reise vom Impuls zum Kauf nicht mehr durch ein Tracking-fähiges Interface läuft. Das Übereinkommen darüber, welche Zahl als Wahrheit gilt, zerfällt – und braucht eine neue Form.

Wer schreibt die Zahlen – drei Lager, eine Bühne

Im Markt bauen heute drei Akteure unterschiedlich an Werbe-Messung. Ihre Interessen widersprechen sich.

Drei Hände aus drei Richtungen drücken drei verschiedene Stempel auf ein Dokument mit der Überschrift "Werbewirkung" – jede Hand trägt einen anderen Ärmel (Tech-Hoodie, Anzugmanschette, Industriehemd), jeder Stempel zeigt ein anderes Muster. Annotationen am Rand benennen die drei Lager: Platforms, JICs, Coalitions. Editorial-Pencil-Sketch.

Plattformen messen schnell, fein abgestuft und parteiisch. Sie sind gleichzeitig Inventar-Anbieter, Targeting-Maschine und Mess-Instanz. OpenAI bringt das Modell in Reinkultur: ChatGPT-Werbung läuft seit Frühjahr 2026 ohne Drittverifizierung, ohne MRC-Akkreditierung, ohne JIC-Anbindung. Niemand kann unabhängig nachprüfen, was für sein Geld passiert. Aber jeder möchte dabei sein, wenn eine neue Werbegattung entsteht. Man könnte ja was verpassen.

Joint Industry Committees (JIC): Publisher, Agenturen und Werbeauftraggeber finanzieren gemeinsam eine neutrale Instanz und akzeptieren ihre Zahlen als Branchenwährung. Das funktioniert seit Jahrzehnten im TV (BARB UK, AGF Deutschland, Mediapulse), im Print (WEMF) und im Radio. Im Digitalen funktioniert es schlechter, weil die Plattformen nicht alle Daten liefern. Bewegung gibt es: Das US-JIC zertifizierte für die Upfronts 2025/26 drei Währungen parallel – Comscore, iSpot und VideoAmp. AGF Deutschland integrierte im Oktober 2025 als erste JIC weltweit Amazon Prime Video, BARB UK misst seit Anfang 2025 YouTube auf dem TV-Gerät. Aber JICs messen Gattungs-Reichweite, nicht Kampagnen-Wirkung. Für einen CMO, der wissen will, ob Kampagne X den Markenwert bewegt hat, ist eine Mediapulse-Zahl ein Anfang, kein Ende.

Werbeauftraggeber-Koalitionen versuchen, beides zu lösen: plattformübergreifend messen, ohne JIC-Latenz, mit Brand-Outcome statt Reichweite. Die WFA hat dafür das North-Star-Framework definiert und die Halo-Technologie als Open-Source verfügbar gemacht. Umsetzungen gibt es in USA und UK: ISBA Origin deckt seit Mitte 2025 über 30 britische Werbeauftraggeber ab, ANA Aquila ging im April 2026 in den USA live, mit 27 Marken zum Start. Im deutschsprachigen Raum sind keine Initiativen aktiv.

Aquila zeigt das eingebaute Paradox dieser Koalitionen: Google, Meta, Amazon und TikTok finanzieren das System und sitzen im Steuerungsgremium. Wer die Daten liefert, sitzt am Tisch, an dem die Massstäbe gesetzt werden.

Wie zerbrechlich solche Koalitionen sind, hat 2024 das Ende von GARM gezeigt. Die Global Alliance for Responsible Media war eine WFA-Initiative für Brand-Safety-Standards – sieben Jahre Aufbau und als Resultat eine dominante Branchen-Taxonomie. Im August 2024 löste die WFA GARM auf, nachdem Elon Musks X eine Kartell-Klage einreichte. Die Klage wurde später with prejudice abgewiesen – juristisch haltlos. Die WFA konnte die Prozesskosten trotzdem nicht tragen. Jede neue Branchen-Koalition operiert seitdem unter diesem Schatten.

Das alles ist nicht neu. Seit 1914 vertraute die Werbe-Industrie auf Auflagenzahlen, die Verleger selbst meldeten. Viele waren übertrieben. Werbetreibende zahlten für Reichweite, die nicht existierte. Die Antwort war ein gemeinsamer Vertrag – das erste Audit Bureau of Circulations, gegründet von Werbetreibenden, Agenturen und Verlagen. Die Werbe-Messung in der AI-Welt kämpft mit demselben strukturellen Problem. Der Unterschied: ABC hatte zwanzig Jahre Zeit. AI-Inventar wartet keine zwanzig Jahre.

Die Werkzeuge – Renaissance der ungeliebten Methoden

Während sich die Akteure positionieren, kehren die methodischen Werkzeuge zurück, die Last-Click-Optimierung jahrelang verdrängt hat.

Marketing Mix Modeling – die Rückkehr des Unfashionablen. MMM war lange unbeliebt: aufwendig, quartalsweise, keine User-Level-Daten. Genau das ist jetzt sein Vorteil. MMM funktioniert ohne Cookies, ohne Pixel, ohne personenbezogene Daten – die Methode modelliert Werbewirkung auf aggregierter Ebene. Dass Google Meridian open-sourced hat und Meta Robyn anbietet, ist kein Altruismus: Beide Plattformen wissen, dass ihre eigene Attribution in einer Privacy-first-Welt unter Beweisdruck steht. Wer genauer hinsieht, findet in Meridian Default-Annahmen für Reach und Frequency, die auf Google-Inventar zugeschnitten sind – das Modell ist offen, die Eingangsparameter sind es nicht. Das Currency-Problem stellt sich hier eine Ebene tiefer wieder: nicht wer rechnet, sondern wessen Annahmen rechnen mit. Wer einen plattform-unabhängigen Ansatz sucht, baut auf PyMC-Marketing auf: dasselbe Bayesian-Framework, ohne eingebaute Plattform-Sicht.

Attention Metrics – Aufmerksamkeit statt Sichtbarkeit. Viewability war ein Fortschritt gegenüber reinen Messung von Kontakten, zum Teil ins Nichts. Aber Viewability misst, ob eine Anzeige sichtbar war, nicht ob jemand hingeschaut hat. IAB und MRC haben im November 2025 die Attention Measurement Guidelines finalisiert – ein Branchenstandard, wo bisher jeder Anbieter eigene Definitionen nutzte. Neue Pricing-Modelle entstehen: Cost Per Second, QualityCPM. Für Publisher in Premium-Umfeldern ein lange ersehntes Argument – Aufmerksamkeit lässt sich nachweisen, nicht nur behaupten. Das Limit ist bekannt: Chat-Interfaces haben keinen DOM, keine Scroll-Tiefe, keine Viewable Area. Das Werkzeug stösst an seine Grenze, bevor AI-Inventar es ernsthaft testet.

Incrementality Testing – die richtige Frage. “Welcher Touchpoint hat konvertiert?” ist die falsche Frage. “Hat diese Kampagne das Ergebnis verändert?” ist die richtige. Geo-Experiments, Holdout-Tests, Causal AI – die Methoden sind nicht neu, aber die Rechenleistung macht sie für mittelgrosse Werbeauftraggeber erstmals zugänglich. Google senkte im November 2025 die Schwelle für Incrementality-Tests auf 5’000 Dollar. Das ist kein Altruismus: Die Plattform räumt damit ein, dass ihre eigene Attribution wackelt.

Synthetic Data – Lückenfüller, kein Ersatz. Privacy-Regulierung reisst Löcher in Datensätze, die für MMM-Kalibrierung und A/B-Tests gebraucht werden. AI-generierte Datensätze füllen diese Lücken – mit statistisch validen, nicht personenbezogenen Daten. Laut Forrester nutzen 42% der Unternehmen weltweit solche Datensätze für Marketing-Analysen; die tatsächliche Durchdringung liegt vermutlich darunter. Das Limit ist eingebaut: Synthetic Data erbt die Verzerrungen ihrer Trainingsdaten. Wer die Realität schlecht erfasst hat, bekommt schlechte Synthese zurück: Shit in, Shit out.

Alle vier Methoden sind Werkzeuge, keine Antwort. Welche Glaubwürdigkeit ihre Zahlen tragen, hängt davon ab, wer sie betreibt. Dasselbe MMM-Modell liest sich anders, wenn eine Plattform es rechnet, als wenn ein Projekt eines Industrie-Gremiums wie Halo es rechnet.

Was die Schweiz fehlt

Mediapulse ist im TV-Bereich solide, im Radio auch. Out-of-Home hat mit SPR+ eine etablierte Reichweitenmessung – Anbieter-getragen, aber als Branchenstandard akzeptiert. Online hat Mediapulse die Reichweiten-Messung mittlerweile eingestellt – die Schweiz hat damit kein eigenes Online-Mess-System mit Branchenwährungs-Status mehr. Dazu kommen drei strukturelle Lücken: kein Cross-Media-Bild, kein Retail Media, kein AI-Inventar.

Matrix mit neun Mediengattungen (TV, Radio, Print, OOH, Search & Social, Display/Open Web, Retail Media, AI-Inventar, Cross-Media) gegen drei Mess-Dimensionen (Reichweite, Performance, Wirkung). Status pro Zelle farbcodiert: dunkelgrau für abgedeckt, hellgrau für teilweise, Coral für Lücke. Die Wirkungs-Spalte ist fast komplett Coral – Werbewirkung wird in der Schweiz heute nirgends verbindlich gemessen.

Ich habe das Projekt damals mit begleitet: 2023 lag ein Schweizer Versuch auf dem Tisch, eine Cross-Media-Kampagnenreichweite zu bauen – genau das, was die WFA heute mit Halo international macht. Mediapulse und Publisher arbeiteten an einer plattformübergreifenden Mess-Struktur. Werbeauftraggeber hiessen den Ansatz gut und signalisierten Zahlungsbereitschaft – blieben beim konkreten Mitwirken aber Zuschauer. Publisher wollten Medienreichweite messen, das passt zu ihrem Vermarktungsmodell. Werbeauftraggeber hätten Kampagnenreichweite gebraucht, das passt zu ihrer Wirkungsfrage. Niemand legte das Geld auf den Tisch. Mediapulse hat sich danach aus der Online-Messung weitgehend zurückgezogen. Die Frage, an der das Projekt scheiterte, ist heute schärfer – und international gibt es Lösungsansätze, in der Schweiz leider nicht.

Im Halo-Aktivierungsdokument der WFA vom Januar 2026 tauchen Deutschland, Österreich und die Schweiz nicht auf. Nestlé ist als WFA-Mitglied strukturell drin, ob die Schweizer Marken-Häuser aktiv mitspielen, ist nicht öffentlich dokumentiert. Wo niemand verbindlich misst, optimiert jeder im eigenen Interesse.

Eine Konsequenz hat jede Marke heute selbst in der Hand. Aus dem Pixel-Lock-in herauszukommen ist ein operativer Hebel, der nicht auf eine Branchen-Lösung wartet: Server-side Tracking statt Browser-Pixel, eigene Incrementality-Tests, First-Party-Datensouveränität. Das löst die Currency-Frage nicht – aber es verhindert, dass jede Kampagne den eigenen Wettbewerb mitfinanziert. Wie das in den Plattform-Defaults aufgeht, haben wir in Maschinen steuern die Werbemaschine ausführlicher beschrieben.

Wo die Zahl entsteht, sitzt die Macht

Die Werbe-Industrie sucht gerade eine neue Sprache für Werbewirkung. Drei Lager schreiben gleichzeitig daran. Plattformen werden weiter ihre eigenen Zahlen liefern, weil sie es können und niemand sie zwingt, sie aussen prüfen zu lassen. JICs werden sich öffnen, aber langsam – in der Schweiz noch langsamer. Werbeauftraggeber-Koalitionen werden methodisch besser, politisch verwundbar. Welche Sprache am Ende gilt, entscheidet sich an einer Frage: Wer hat den Hebel, andere zu zwingen, sie zu sprechen?

Die Branche hat zwischen 1914 und den 1930er-Jahren rund zwanzig Jahre gebraucht, um sich auf einen gemeinsamen Auflagen-Massstab zu einigen. Das AI-Inventar wartet keine zwanzig Jahre.

Diese Serie auf fumu.ch: Dieser Text greift einen von fünf Trends aus dem Rahmen-Artikel Das doppelte Unbundling heraus. Dort erkläre ich, warum diese Entwicklungen kein Zufall sind – und was das strukturelle Muster dahinter ist.

Whitepaper herunterladen →