{"podcast":{"title":"Engineering Kiosk","slug":"engineering-kiosk-4681279","podcast_index_feed_id":4681279,"rss_url":"https://feeds.redcircle.com/0ecfdfd7-fda1-4c3d-9515-476727f9df5e","website_url":"https://redcircle.com/shows/engineeringkiosk","image_url":"https://media.redcircle.com/images/2023/12/4/23/49a92c4b-3cca-41e5-bd4a-563ac4b750eb_-bb2d-a0503507eb03_newspaper-kiosk-svgrepo-com.jpg","author":"Wolfgang Gassler, Andy Grunwald","episode_count":270,"summary":"Der Engineering Kiosk ist der deutschsprachige Software-Engineering-Podcast mit Wolfgang Gassler und Andy Grunwald rund um die Themen Engineering-Kultur, Open Source, Menschen, Technologie und allen anderen Bereichen, die damit in Verbindung stehen.Wir, Wolfgang Gassler und Andy Grunwald, sind beide Software Engineers und Engineering Manager, die sich bei ihrer beruflichen Laufbahn bei @trivago kennengelernt haben.Zusammen bringen sie über 30 Jahre Tech-Erfahrung an das Mikrofon und lassen dabei zwei Welten aufeinander prallen: Die Österreichische und akademische Welt von Wolfgang mit der praktischen und deutschen Ruhrpottschnauze von Andy.Ziel des Podcasts ist der Austausch zu (Senior) Engineering Themen und ggf. etwas Selbsttherapie 🙃Dieser Podcast ist für alle Software Engineers und -Enwickler, Teamleads, Open-Source- und Indie Hacker, Leute aus dem Tech-Sektor (Product Manager, Data Scientist, etc.) und alle weiteren Engineering-Interessierten.Feedback an stehtisch@engineeringkiosk.dev oder über Twitter @EngKiosk ( https://twitter.com/EngKiosk )","last_synced_at":null,"page_url":"https://stenobird.com/podcast/engineering-kiosk-4681279"},"episode":{"title":"#255 Die DB skaliert nicht! OLTP vs. OLAP, Row vs. Column Stores, Parquet, CSV, Iceberg, DuckDB","slug":"255-die-db-skaliert-nicht-oltp-vs-olap-row-vs-column-stores-parquet-csv-iceberg-duckdb","published_at":"2026-02-17T02:00:14+00:00","page_url":"https://stenobird.com/podcast/engineering-kiosk-4681279/255-die-db-skaliert-nicht-oltp-vs-olap-row-vs-column-stores-parquet-csv-iceberg-duckdb","show_page_url":"https://stenobird.com/podcast/engineering-kiosk-4681279","url":"https://engineeringkiosk.dev","audio_url":"https://audio1.redcircle.com/episodes/4c83fb64-05d0-43e7-9a8f-9a2ea59f8483/stream.mp3","summary":"Kennst du diese Situation im Team: Jemand sagt \"das skaliert nicht\", und plötzlich steht der Datenbankwechsel schneller im Raum als die eigentliche Frage nach dem Warum? Genau da packen wir an. Denn in vielen Systemen entscheidet nicht das nächste hippe Tool von Hacker News, sondern etwas viel Grundsätzlicheres: Datenlayout und Zugriffsmuster. In dieser Episode gehen wir einmal tief runter in den Storage-Stack. Wir schauen uns an, warum Row-Oriented-Datastores der Standard für klassische OLTP-Workloads sind und warum \"SELECT id\" trotzdem oft fast genauso teuer ist wie \"SELECT *\". Danach drehen wir die Tabelle um 90 Grad: Column Stores für OLAP, Aggregationen über viele Zeilen, Spalten-Pruning, Kompression, SIMD und warum ClickHouse, BigQuery, Snowflake oder Redshift bei Analytics so absurd schnell werden können. Und dann wird es file-basiert: CSV bekommt sein verdientes Fett weg, Apache Parquet seinen Hype, inklusive Row Groups, Metadaten im Footer und warum das für Streaming und Object Storage so gut passt. Mit Apache Iceberg setzen wir noch eine Management-Schicht oben drauf: Snapshots, Time Travel, paralleles Schreiben und das ganze Data-Lake-Feeling. Zum Schluss landen wir da, wo es richtig weh tut, beziehungsweise richtig Geld spart: Storage und Compute trennen, Tiered Storage, Kafka Connect bis Prometheus und Observability-Kosten. Wenn du beim nächsten \"das skaliert nicht\" nicht direkt die Datenbank tauschen willst, sondern erst mal die richtigen Fragen stellen möchtest, ist das deine Folge. Bonus: DuckDB als kleines Taschenmesser für CSV, JSON und SQL kann dein nächstes Wochenend-Experiment werden. Unsere aktuellen Werbepartner findest du auf https://engineeringkiosk.dev/partners Das schnelle Feedback zur Episode: 👍 (top) 👎 (geht so) Anregungen, Gedanken, Themen…","meta_description":"Kennst du diese Situation im Team: Jemand sagt \"das skaliert nicht\", und plötzlich steht der Datenbankwechsel schneller im Raum als die eigentliche Frage…","key_points":[],"chapters":[],"topics":[],"duration_seconds":4574,"processing_state":"not_requested","actions":[{"name":"request_transcript","method":"POST","url":"https://stenobird.com/v1/public/podcasts/engineering-kiosk-4681279/episodes/255-die-db-skaliert-nicht-oltp-vs-olap-row-vs-column-stores-parquet-csv-iceberg-duckdb/transcription-requests","description":"Idempotently request low-priority transcript generation for this episode."},{"name":"read_markdown","method":"GET","url":"https://stenobird.com/podcast/engineering-kiosk-4681279/255-die-db-skaliert-nicht-oltp-vs-olap-row-vs-column-stores-parquet-csv-iceberg-duckdb.md","description":"Read the agent-friendly Markdown representation of this episode resource."}]}}