# Optimizing for efficiency with IBM’s Granite

Page: https://stenobird.com/podcast/practical-ai/optimizing-for-efficiency-with-ibm-s-granite
Text version: https://stenobird.com/podcast/practical-ai/optimizing-for-efficiency-with-ibm-s-granite.md
Podcast: [Practical AI](https://stenobird.com/podcast/practical-ai)
Published: 2025-03-14T13:28:22+00:00
Episode link: https://share.transistor.fm/s/fb39a0d8
Audio file: https://pscrb.fm/rss/p/dts.podtrac.com/redirect.mp3/media.transistor.fm/fb39a0d8/fd368e57.mp3
Processing state: failed
JSON: https://stenobird.com/v1/public/podcasts/practical-ai/episodes/optimizing-for-efficiency-with-ibm-s-granite
Duration seconds: 2618

## Resource

We often judge AI models by leaderboard scores, but what if efficiency matters more? Kate Soule from IBM joins us to discuss how Granite AI is rethinking AI at the edge—breaking tasks into smaller, efficient components and co-designing models with hardware. She also shares why AI should prioritize efficiency frontiers over incremental benchmark gains and how seamless model routing can optimize performance. Featuring: Kate Soule – LinkedIn Chris Benson – Website , GitHub , LinkedIn , X Daniel Whitenack – Website , GitHub , X Links: IBM Granite IBM Granite on Hugging Face IBM Expands Granite Model Family with New Multi-Modal and Reasoning AI Built for the Enterprise

## Actions

- request_transcript: `POST https://stenobird.com/v1/public/podcasts/practical-ai/episodes/optimizing-for-efficiency-with-ibm-s-granite/transcription-requests` — Idempotently request low-priority transcript generation for this episode.
- read_markdown: `GET https://stenobird.com/podcast/practical-ai/optimizing-for-efficiency-with-ibm-s-granite.md` — Read the agent-friendly Markdown representation of this episode resource.

A page view does not enqueue transcription. Agents should invoke `request_transcript` explicitly when they need this episode processed.

## Transcript

Full transcripts are not published on public pages unless there is a clear rights basis.