# #248 Data as a Product: Die Struktur & Skalierung von Data-Teams mit Mario Müller von Veeva Page: https://stenobird.com/podcast/engineering-kiosk-4681279/248-data-as-a-product-die-struktur-skalierung-von-data-teams-mit-mario-m-ller-von-veeva Text version: https://stenobird.com/podcast/engineering-kiosk-4681279/248-data-as-a-product-die-struktur-skalierung-von-data-teams-mit-mario-m-ller-von-veeva.md Podcast: [Engineering Kiosk](https://stenobird.com/podcast/engineering-kiosk-4681279) Published: 2025-12-30T02:00:15+00:00 Episode link: https://engineeringkiosk.dev Audio file: https://audio1.redcircle.com/episodes/da2e59d7-bb82-48b0-b130-6fffa5784f1c/stream.mp3 Processing state: not_requested JSON: https://stenobird.com/v1/public/podcasts/engineering-kiosk-4681279/episodes/248-data-as-a-product-die-struktur-skalierung-von-data-teams-mit-mario-m-ller-von-veeva Duration seconds: 4724 ## Resource Data as a Product: Was steckt dahinter? Warum ist AI überall, aber der Weg von der Datenbank zu "Wow, das Modell kann das" wirkt oft wie ein schwarzes Loch? Du loggst brav Events, die Daten landen in irgendwelchen Silos, und trotzdem bleibt die entscheidende Frage offen: Wer sorgt eigentlich dafür, dass aus Rohdaten ein zuverlässiges, verkaufbares Datenprodukt wird. In dieser Episode machen wir genau dort das Licht an. Gemeinsam mit Mario Müller, Director of Data Engineering bei Veeva Systems, schauen wir uns an, was Datenteams wirklich sind, wie "Data as a Product" in der Praxis funktioniert und warum Data Engineering mehr ist als nur ein paar CSVs über FTP zu schubsen. Wir sprechen über Teamstrukturen von der One-Man-Show bis zur cross-functional Squad, über Ownership auf den Daten, Data Governance und darüber, wie du Datenqualität wirklich misst, inklusive Monitoring, Alerts, SQL-Regeln und menschlicher Quality Control. Dazu gibt es eine ordentliche Portion Tech: Spark, AWS S3 als primärer Speicher, Delta Lake, Athena, Glue, Airflow, Push-Pull statt Event-Overkill und die Entscheidung für Batch Processing, obwohl alle Welt nach Streaming ruft. Und natürlich klären wir auch, was passiert, wenn KI an den Daten rumfummelt: Wo AI beim Bootstrapping hilft, warum Production und Scale tricky werden und wieso Verantwortlichkeit beim Commit nicht von einem LLM übernommen wird. Wenn du Datenteams aufbauen willst, Data Products liefern musst oder einfach verstehen willst, wie aus Daten verlässlicher Business-Impact wird, bist du hier genau richtig. Bonus: Batchjobs bekommen heute mal ein kleines Comeback. Unsere aktuellen Werbepartner findest du auf https://engineeringkiosk.dev/partners Das schnelle Feedback zur Episode: 👍 (top) 👎 (geht so) Anregungen, Gedanken, Themen und Wün… ## Actions - request_transcript: `POST https://stenobird.com/v1/public/podcasts/engineering-kiosk-4681279/episodes/248-data-as-a-product-die-struktur-skalierung-von-data-teams-mit-mario-m-ller-von-veeva/transcription-requests` — Idempotently request low-priority transcript generation for this episode. - read_markdown: `GET https://stenobird.com/podcast/engineering-kiosk-4681279/248-data-as-a-product-die-struktur-skalierung-von-data-teams-mit-mario-m-ller-von-veeva.md` — Read the agent-friendly Markdown representation of this episode resource. A page view does not enqueue transcription. Agents should invoke `request_transcript` explicitly when they need this episode processed. ## Transcript Full transcripts are not published on public pages unless there is a clear rights basis.