markdown-stage-llms

llms.txt markdown Google Search Console. 3 Tage später wurde die datei für AI Antworten genutzt

Zum Fazit springen

Veröffentlicht: 23. Februar 2026
Lesezeit: ~8 Min

Dies ist keine Geschichte über einen Zaubertrick. Es ist eine Geschichte über eine einfache `.txt`-Datei, ein ehrliches Experiment und ein Ergebnis, mit dem wir nicht vollständig gerechnet hatten.

 

Wir hatten bereits eine `llms.txt` live - eine einfache Markdown-Datei im Domain-Root, gepflegt und automatisch aktualisiert über unsere Magnolia-DXP-Pipeline. Nicht glamourös. Wenn ein echter Nutzer darauf klickt, sieht er Rohtext, kein Styling, keine Navigation, keinen CTA. Es sieht aus wie 1994.

 

Aber wir wurden neugierig: Was macht das KI-Web tatsächlich mit dieser Datei?

 

Wir haben dieses gesamte Experiment durchgeführt, um zwei Fragen zu beantworten:

 

1. Wird eine indexierte Markdown-Textdatei die Google-Rankings beeinflussen?
2. Wird sie KI-Zitierungen (z.B. Google AI Mode-Quellen) für Marken-/Service-Anfragen steigern?

 

Wir haben bewusst `llms.txt` für den Test verwendet, weil wir sie bereits live hatten, wir sie bereits pflegen und unsere Magnolia-DXP-Pipeline sie automatisch aktuell halten kann - das heißt, wir haben nicht "Content für das Experiment erstellt", sondern den *Einfluss des Formats + der Einreichungs-Pipeline* mit einer Datei getestet, die wir ohnehin behalten würden.

 

Am 2. Februar 2026 haben wir also eine Sache getan: Wir haben `https://www.dev5310.com/llms.txt` direkt bei der Google Search Console eingereicht. Kein Sitemap-Eintrag. Keine internen Links. Nur die URL und ein Klick auf einen Button.

 

- 2. Feb, 10:19 Uhr - Google hat sie gecrawlt. Am selben Tag.
- 3. Feb - Google AI Mode zitierte sie als #1 Quelle bei der ersten Anfrage
- 5. Feb - Immer noch die führende Zitierung. Andere Sitzung.
- 14. - 18. Feb - 6 bestätigte KI-Bots griffen in 4 Tagen auf die Datei zu
- 20. Feb - Zitiert in 3 von 4 Anfragen, über verschiedene Themen hinweg

 

Hier ist, was die Logs zeigen, was es bedeutet - und was nicht.

Was ist llms.txt?

`llms.txt` ist ein vorgeschlagener Webstandard (Jeremy Howard, 2024) - eine Markdown-Datei im Domain-Root, die KI-Systemen einen strukturierten, token-effizienten Überblick über die Inhalte Ihrer Website gibt.

Das Setup

Screenshot 2026-02-23 at 12.22.08

Wir, dev5310 GmbH & Co. KG, eine Hamburger Technikagentur, spezialisiert auf Enterprise Digital Experience Platforms (DXP) und Magnolia Gold Partner mit 18 zertifizierten Entwicklern, sind für Implementierungen und KI-Integration zuständig. Wir hatten eine `llms.txt` live auf unserer Website - eine strukturierte Markdown-Datei, die beschreibt, wer wir sind, was wir tun und welche Seiten am wichtigsten sind.

 

Am 2. Februar 2026 haben wir `https://www.dev5310.com/llms.txt` direkt über das URL-Prüftool in der Google Search Console eingereicht.

 

Was folgte, war schneller als erwartet.

Die vollständige Chronologie

Screenshot 2026-02-23 at 13.34.39

2. Feb., 10:19:42 Uhr - Google crawlt die Datei am selben Tag wie unsere Einreichung. Gecrawlt als Googlebot Smartphone. Seitenabruf: erfolgreich. Indexierung: erlaubt.

 

Die Discovery-Daten der Search Console zeigen etwas Wichtiges: **keine verweisenden Sitemaps, keine verweisende Seite erkannt.** Google fand diese URL ausschliesslich durch unsere direkte Einreichung - keine Sitemap, kein interner Link, keine bestehende SEO-Infrastruktur.

 

Google Search Console Crawl-Details mit Indexierung am 2. Feb. ohne verweisende Seite Screenshot 2026-02-23 at 13.34.39

Screenshot 2026-02-03 at 11.36.13

3. Feb., 11:34 Uhr - Search Console bestätigt: "URL ist bei Google. Seite ist indexiert."

 

3. Feb., 11:36 Uhr - Erste KI-Zitierung. Einen Tag nach dem Crawl fragen wir Google AI Mode mit "Dienstleistungen von dev5310." Die Antwort ist detailliert, strukturiert und korrekt - sie umfasst unseren Magnolia Gold Partner Status, DXP 360° AI Services und wichtige Angebotsdetails. Im Quellenbereich: "llms.txt - dev5310" ist die Hauptquelle.

 

Google AI Mode zitiert llms.txt am 3. Feb. Screenshot 2026-02-03 at 11.36.13

 

5. Feb., 09:59 Uhr - Zweite KI-Zitierung. Drei Tage nach dem Crawl fragen wir Google AI Mode erneut mit "Dienstleistungen von dev5310." "llms.txt - dev5310" ist wieder die Hauptquelle.

 

Google AI Mode zitiert llms.txt am 5. Feb. Screenshot 2026-02-05 at 09.59.13

Screenshot 2026-02-20 at 20.50.08

14.-18. Feb. - Erneute Prüfung zur Bestätigung der Persistenz. Unsere Cloudflare-Logs zeigen eine anhaltende Welle von Bot-Aktivität. In nur vier Tagen: Googlebot/2.1 (Cloudflare-verifiziert "Search Engine Crawler"), Google Web Rendering Service zweimal, OAI-SearchBot/1.3 (OpenAIs Indexer, Cloudflare-verifiziert "AI Search"), ChatGPT-User/1.0 (OpenAIs Live-Browsing-Bot, Cloudflare-verifiziert "AI Assistant"), Barkrowler (Babbar.tech) und BrightEdge. Sechs bestätigte KI- und Such-Bots in vier Tagen - keiner davon über eine Sitemap eingeladen.

 

Cloudflare Observability Screenshot 2026-02-20 at 20.50.08

Screenshot 2026-02-20 at 23.01.10

20. Feb., 22:04 Uhr - Abfrage "Dienstleistungen von dev5310" erneut, 18 Tage später. `llms.txt - dev5310` wurde nicht im Quellenbereich angezeigt, also nach allen Quellen gefragt - und dort wird es zitiert, die Zitierung hat also innerhalb von Google AI Mode Bestand.

 

20. Feb., 22:58 Uhr - Abfrage mit neuem Inkognito-Fenster "Magnolia projects." Andere Frage, gleiches Ergebnis: `llms.txt - dev5310` erscheint in den zitierten Quellen. Die Datei wird nicht nur für Unternehmensübersichten verwendet, sondern auch für spezifische Projekt- und Service-Abfragen.

 

Google AI Mode Zitierung am 20. Feb. - Abfrage: Magnolia projects Screenshot 2026-02-20 at 23.01.10

Screenshot 2026-02-20 at 22.58.05

20. Feb., 23:01 Uhr - Erneute Abfrage "alle Quellen für dev5310.com." Google AI Mode listet `llms.txt - dev5310` als erste und primäre Quelle - über allen Website-Seiten - und erklärt unaufgefordert:

 

Englische Übersetzung:
"Ja, dev5310 hat eine indexierte llms.txt-Datei unter dev5310.com/llms.txt. Diese Datei dient als strukturierte Datenquelle für KI-Modelle und Crawler. Sie enthält eine maschinenlesbare Markdown-Zusammenfassung der Unternehmensidentität und Kernkompetenzen."

 

Originale deutsche Antwort:
> "Ja, dev5310 hat eine llms.txt Datei unter der Adresse dev5310.com/llms.txt indexiert. Diese Datei dient als strukturierte Informationsquelle für KI-Modelle und Crawler. Sie enthält eine Zusammenfassung der Identität und Kernkompetenzen des Unternehmens in einem maschinenlesbaren Markdown-Format."

 

Googles KI zitiert unsere `llms.txt` nicht nur. Sie erklärt Nutzern, was die Datei ist und warum sie wichtig ist. Das ist ein Integrationsniveau, das wir nicht erwartet hatten.

 

Google AI Mode erklärt llms.txt als primäre Quelle Screenshot 2026-02-20 at 22.58.05

Was Googles KI tatsächlich mit der Datei macht

Die Abfrage "alle Quellen" zeigt den Mechanismus deutlich. Google AI Mode nutzt `llms.txt` als autoritative Identitätsschicht für das Unternehmen - den strukturierten Anker, um den andere Quellen organisiert werden.

 

Wenn ein Nutzer nach Magnolia-Projekten fragt, referenziert es Projektseiten *und* die `llms.txt` für Kontext darüber, wer dev5310 ist. Wenn ein Nutzer nach Dienstleistungen fragt, rahmt die `llms.txt` die Antwort. Wenn explizit nach Quellen gefragt wird, führt sie mit `llms.txt` vor jeder anderen Seite.

 

Die Datei funktioniert genau wie in ihrer Spezifikation vorgesehen: als kuratierter, token-effizienter Index für KI-Systeme - einer, der die Notwendigkeit reduziert, Dutzende einzelner Seiten zu crawlen und zu parsen, um zu verstehen, was ein Unternehmen tut.

Zwei OpenAI-Bots, zwei verschiedene Aufgaben

Neben Google zeigen die Cloudflare-Logs, dass OpenAI zwei völlig unterschiedliche Bots geschickt hat.

`OAI-SearchBot/1.3` ist der Hintergrund-Indexer - er baut die Wissensbasis auf, aus der ChatGPT Search schöpft. Er kam von Microsoft Azure (Atlanta) und folgte einem internen Link von unserer Leistungsseite, um die Datei zu finden.

`ChatGPT-User/1.0` ist während Live-ChatGPT-Sitzungen aktiv, ausgelöst wenn ein Nutzer das Web-Browsing während einer Abfrage aktiviert. Er kam zwei Tage später von einem anderen Azure-Rechenzentrum - ein separates System, separate Infrastruktur, dieselbe Datei.

Die Datei wurde nicht nur für die zukünftige Nutzung katalogisiert. Sie wurde während einer sehr wahrscheinlich Live-Nutzerabfrage über dev5310 abgerufen.

Warum es funktioniert hat: Schema.org + llms.txt Markdown als Stack

Was wir als Nächstes vorhaben

Dies war ein Proof-of-Concept mit einer einzigen Datei für die gesamte Website. Wir sind nun gespannt zu sehen, wie die Seiten performen, wenn wir sie als Markdown und Schema.org an KI-Bots ausliefern.

Mit unserer Magnolia Schema.org-Automatisierungspipeline werden wir individuelles Markdown für jede relevante Seite generieren - Leistungen, Case Studies und Personenseiten - und diese zu einem umfassenden Markdown zusammenstellen.

Ende März 2026 werden wir diesen Test für das llms.txt-Markdown in Google wiederholen: gleiche Abfragen, vollständige Cloudflare-Log-Analyse und ein direkter Vorher/Nachher-Vergleich der KI-Zitierungsraten und Antwortqualität. Wir werden alles hier veröffentlichen.

Wenn die Hypothese zutrifft, sollte ein schema-getriebenes, seitenbezogenes Markdown deutlich reichhaltigere KI-Quellenattributionen und genauere Antworten liefern als eine einzelne Zusammenfassungsdatei - und die strukturierte Datenpipeline unseres CMS in einen direkten Feed für das generative Web verwandeln. Da Cloudflare überall auf meinem LinkedIn-Kanal und sogar in den Nachrichten war, Anerkennung für ihre Idee: https://developers.cloudflare.com/workers-ai/features/markdown-conversion/ - es funktioniert als Toggle-Schalter, aber wir wollen zuerst sehen, wie es sich auswirkt, bevor wir es nutzen.

Die ehrlichen Vorbehalte

Eine Agentur, vier Abfragen, ein 18-Tage-Fenster. Wir behaupten kein universelles Ergebnis, und es hat nichts damit zu tun, wofür llms.txt eigentlich gedacht ist.

Peter Müller

Warum wir keine separaten Markdown-Seiten erstellt haben (und warum llms.txt anders ist)

Ein echter Nachteil: Eine .txt-Datei ist keine angenehme Nutzererfahrung. Wenn ein Mensch https://www.dev5310.com/llms.txt aufruft, sieht er Rohtext im Browser – keine Navigation, kein Design, kein CTA.

Außerdem wichtig: Wir haben keine „Markdown-Webseiten für Bots“ erstellt. Googles John Mueller hat sich öffentlich gegen die Idee ausgesprochen, Markdown-Seiten speziell für LLM-Crawler bereitzustellen (er nannte es eine „stupide Idee“ und stellte die Frage, warum Bots eine Seite bräuchten, die kein Nutzer sieht), und die breitere Diskussion berührt das Risiko, dass Bot-only-Versionen in Cloaking-Muster abdriften. Hier der Link.

Deshalb haben wir llms.txt verwendet: Es ist eine einzige, ehrliche, öffentlich zugängliche Datei, die wir bereits pflegen, und sie ist als kompakte Index-/Zusammenfassungsebene gedacht – nicht als separate, versteckte Version unserer Website.
Ein weiterer Nachteil ist: Wenn Sie eine mehrsprachige Website betreiben, zeigt unsere Studie, dass Englisch gegenüber allen anderen Sprachen bevorzugt wird.

Was die Forschung sagt

Die breitere Forschungslage ist gemischt. Search Engine Land verfolgte 10 Websites nach der llms.txt-Implementierung und stellte fest, dass 8 von 9 keine messbare Veränderung im KI-gesteuerten Traffic zeigten. Google erklärt ausdrücklich, dass es kein Ranking-Signal für die Google-Suche ist. Weder OpenAI noch Anthropic haben Dokumentation veröffentlicht, wie genau sie diese Datei in generierten Antworten gewichten.

Was unsere eigenen Daten bestätigen:

- Google hat llms.txt innerhalb von Stunden nach einer direkten Search-Console-Einreichung indexiert – kein Sitemap oder interner Link erforderlich
- Erste KI-Zitierung erschien 1 Tag nach der Indexierung
- Zitierung blieb konsistent über 4 verschiedene Abfragen über 18 Tage
- llms.txt wurde als #1-Quelle eingestuft, als Google AI nach allen Quellen für unsere Domain gefragt wurde
- 6 bestätigte KI- und Suchmaschinen-Bots griffen innerhalb von 4 Tagen auf die Datei zu
- Google AI Mode beschrieb den Zweck der Datei – unaufgefordert – den Endnutzern

Die Pipeline funktioniert. Die Variable ist die Inhaltsqualität und wie gut Ihre strukturierten Daten das stützen, was die Datei behauptet.

Quellen

- Google / John Mueller über „Markdown-Seiten für LLM-Crawler“: Google’s Mueller Calls Markdown-For-Bots Idea ‘A Stupid Idea’ / Google On Serving Markdown Pages To LLM Crawlers

- Zusammenfassung der Google- + Bing-Warnungen zu Bot-only-Markdown-Versionen und Richtlinien-/Cloaking-Risiko: Google and Bing say no: separate markdown pages for AI violate search policies

Die zwei Fragen beantwortet

### 1. Wird eine indexierte Markdown-Textdatei die Google-Rankings beeinflussen?

Nein. Unsere verfolgten Keywords blieben während des gesamten 18-Tage-Testfensters in identischen Positionen. Die Datei erscheint nicht in den Standard-Google-Suchergebnissen – nur bei direkter Abfrage über site:dev5310.com/llms.txt.

Google hat ausdrücklich erklärt, dass llms.txt kein Ranking-Signal ist und es mit dem alten keywords-Meta-Tag verglichen – technisch lesbar, aber ohne algorithmische Gewichtung.

Fazit: Null SEO-Auswirkung.

### 2. Wird es KI-Zitierungen für Marken-/Dienstleistungsabfragen steigern?

Ja, in unserem Fall. llms.txt wurde als #1-Quelle in Google AI Mode innerhalb von 24 Stunden nach der Indexierung zitiert, hielt diese Position konsistent über 4 Abfragen über 18 Tage und wurde von Google AI selbst als „strukturierte Datenquelle für KI-Modelle und Crawler“ beschrieben.

Sechs bestätigte KI-Bots (Googlebot, OAI-SearchBot, ChatGPT-User und andere) griffen innerhalb von 4 Tagen auf die Datei zu.

Fazit: Starkes GEO/AEO-Signal – in Kombination mit bestehender schema.org-Infrastruktur.

Was wir tatsächlich gelernt haben

### Zuerst die ehrlichen Einschränkungen

Eine .txt-Datei ist keine Webseite. Wenn ein Nutzer dev5310.com/llms.txt aufruft, bekommt er rohes Markdown in einem Browser-Tab – kein Design, kein CTA, kein Kontext. Sie kann keine richtige Über-uns-Seite, Leistungsseite oder strukturierte Landingpage ersetzen. Bauen Sie Ihre digitale Präsenz nicht auf einer Textdatei auf.

Und die SEO-Auswirkung? Null, laut Googles eigener Aussage. llms.txt ist kein Ranking-Signal. Eine groß angelegte Studie über 300.000 Domains fand keine messbare Korrelation zwischen llms.txt und besseren KI-Zitierungen oder organischen Rankings. Ihre Rankings stehen und fallen mit Inhaltsqualität, technischem SEO und Backlinks – nicht mit Dateiformaten.

### Warum wir es trotzdem für lohnenswert halten

Wir hatten die Datei bereits. Unsere Magnolia DXP-Integration generiert und pflegt sie automatisch – es kostet uns nichts, sie aktuell zu halten. Das verändert die Kalkulation vollständig.

Für Teams in der gleichen Situation: Wenn Ihr CMS bereits strukturiertes JSON-LD generiert und Sie ein sauberes Content-Modell haben, ist llms.txt eine schnelle Implementierung mit möglicherweise positivem Effekt.

Nicht weil der Dateiname magisch ist. Sondern weil eine gut strukturierte, token-effiziente Zusammenfassung Ihrer Marke – an einem vorhersehbaren Pfad bereitgestellt – genau das ist, was KI-Crawler wollen. Unsere haben sie gefunden, gelesen und begonnen, sie zu zitieren. Über Google AI Mode, OAI-SearchBot und ChatGPT-User.

### Was dieses Experiment war – und was nicht

+ Ein echter Test einer Datei, die wir bereits pflegten
+ Beweis, dass die Pipeline von Einreichung → Crawl → KI-Zitierung funktioniert
+ Nachweis, dass llms.txt als autoritative Identitätsebene in AI Mode fungiert

- Kein Beweis für universelle Ergebnisse
- Keine Ranking-Strategie
- Kein Ersatz für starke Inhalte auf echten Seiten

### Was wir empfehlen würden

1. Wenn Sie llms.txt bereits haben → reichen Sie es heute bei der Search Console ein
2. Wenn nicht → schreiben Sie eines nur, wenn Ihr Content-Modell sauber genug ist, um ehrlich zusammengefasst zu werden
3. In beiden Fällen → kombinieren Sie es mit Schema.org JSON-LD auf Ihren Schlüsselseiten
4. Beobachten Sie Ihre Logs auf OAI-SearchBot, ChatGPT-User, Googlebot

llms.txt ist kein SEO. Es ist auch kein GEO, zumindest nicht offiziell. Es ist KI-Infrastruktur, die fast nichts kostet – und in unserem Fall innerhalb von 24 Stunden funktionierte.

Unser Experte für das Thema

1548669244941edit

Peter Müller

Founder, Consultant & DXP AI Experte

Technischer Projektleiter bei dev5310 mit 15+ Jahren Erfahrung in Digital Experience Platforms. Magnolia Certified und Spezialist für AI-Integration in Enterprise-Umgebungen.

FAQ

Nachfolgend die häufigsten Fragen, die wir zu unserem Setup und unseren Ergebnissen erhalten haben.

Wie haben wir es in die DXP integriert?

llms.txt wurde direkt im Root-Pfad als First-Shot-Version platziert – die erste Implementierung war bewusst minimal. Eine statische Datei, bereitgestellt über Cloudflare Worker im Root-Pfad, kein Sitemap-Eintrag, keine Weiterleitungen.

Unser Magnolia DXP Custom Integration Stack generiert schema.org-strukturierte Daten via JSON-LD vollautomatisch, mit dem Kontext, den wir eingeben (Inhalte und Kontext werden manuell kuratiert – wir nutzen Automatisierung für Struktur, nicht für Substanz), assembliert Kontextdaten und wiederverwendbare Fragmente über die gesamte Plattform. Jede Schlüsselseite trägt maschinenlesbare Annotationen: Organisationsdaten, Webseitendatum und zusätzliche strukturierte Metadaten, wo anwendbar.

Beeinflusst llms.txt die Google-Rankings?

Wir haben keinen Hinweis darauf, dass sich unser Ranking verändert hat. Unsere verfolgten Keywords befinden sich weiterhin in derselben Position und haben sich innerhalb des 18-Tage-Testfensters nicht verändert. Wir werden dies genau beobachten. Die Datei erscheint nicht in den Standard-Google-Suchergebnissen – nur bei direkter Abfrage über site:dev5310.com/llms.txt.

Wie schnell indexiert Google llms.txt?

Am selben Tag. In unserem Fall: Google hat die Datei innerhalb weniger Stunden nach einer direkten Search-Console-Einreichung gecrawlt. Die URL wurde am selben Tag als indexiert bestätigt (2. Februar, 10:19 Uhr Crawl). Keine vorherige SEO-Infrastruktur erforderlich.

Welche KI-Bots lesen llms.txt?

In unserem Fall haben wir folgende Bots gefunden, die im Zeitraum 14.–18. Februar auf die Datei zugegriffen haben:

| Bot-Name | Cloudflare-Kategorie | Hinweise |
|---------|---------------------|--------|
| Googlebot/2.1 | Suchmaschinen-Crawler | Primärer Google-Crawler |
| Google Web Rendering Service | Suchmaschinen-Crawler | Zweimal erschienen |
| OAI-SearchBot/1.3 | AI Search | OpenAIs Indexer für ChatGPT Search |
| ChatGPT-User/1.0 | KI-Assistent | Live-Browsing-Bot während Nutzersitzungen |
| Barkrowler | - | Babbar.tech-Crawler |
| BrightEdge | - | SEO-Plattform-Bot |

Sechs bestätigte KI- und Such-Bots in vier Tagen – keiner davon über eine Sitemap eingeladen.