Skip to main content

Idees d'integració amb l'API de Podhoc: 12 patrons per generar pòdcasts programàticament

Patrons pràctics d'integració amb l'API de Podhoc: pipelines newsletter-a-pòdcast, plataformes d'aprenentatge, eines de coneixement intern, briefings de recerca, onboarding multilingüe i més. Esquemes d'arquitectura, pressupostos de crèdits i perfils de latència.

Dotze maneres com els equips posen a treballar l’API de Podhoc

Un cop tens un token d’API de Podhoc, la pregunta ja no és si pots generar pòdcasts programàticament — sinó què hauries de generar, per a qui i com encaixa en la resta del teu producte. Aquest article cataloga els dotze patrons d’integració que veiem amb més freqüència en el primer mes d’adopció de l’API, amb notes d’arquitectura, pressupostos de crèdits i els detalls que només aprens després d’enviar a producció.

Si encara no has fet la teva primera crida a l’API, comença per Com generar pòdcasts amb l’API de Podhoc. Un cop coneixes el cicle crear-consultar-descarregar, els patrons de sota són sobretot variacions de la mateixa instal·lació.

Nota de traducció: a revisar per un parlant nadiu del català.


1. Newsletter a pòdcast — la primera integració més barata

La integració més senzilla és un digest diari o setmanal automatitzat del contingut del teu newsletter.

Com funciona. Un cron s’executa una vegada al dia. Recupera l’URL del darrer newsletter (RSS, Substack, el teu CMS), crida POST /v1/podcasts amb target_duration_minutes: 15 i style: "deep_dive", consulta fins a la finalització, copia l’MP3 al teu bucket i envia una notificació als teus subscriptors.

Crèdits. ~75 crèdits per episodi de 15 minuts (multiplicador Pro). 7 dies × 75 = 525 crèdits/setmana, amb molta folgança dins del pla Pro de 3500 crèdits.

Per què és una bona primera integració. Una sola font per crida, un sol idioma, sense autopublicació, modes de fallada predictibles. Tens un pipeline d’extrem a extrem funcionant en un dia i pots observar el cost, la latència i la deriva de qualitat durant una setmana abans de comprometre’t amb alguna cosa més gran.

Compte amb. Els URL de newsletter darrere d’un mur d’inici de sessió són inabastables — Podhoc obté la versió pública. Si el teu newsletter requereix autenticació, mira-ho a un URL canònic públic primer (o contacta’ns per a una integració empresarial).


2. Onboarding SaaS en àudio

Substitueix 30 minuts de “mira aquest vídeo” per 30 minuts de “escolta aquest episodi” que els usuaris poden reproduir al gimnàs, al trajecte o mentre cuinen.

Com funciona. Quan un usuari es registra, el teu backend crida POST /v1/podcasts amb l’URL de la teva pàgina d’inici ràpid, target_duration_minutes: 20, style: "didactic". L’MP3 aterra al teu CDN. La pròxima vegada que l’usuari obri l’aplicació, li ofereixes la versió en àudio de l’onboarding.

Per què canvia les mètriques d’adopció. La majoria de l’onboarding SaaS falla perquè els usuaris estan massa ocupats per veure vídeos. L’àudio recupera el temps de trajecte. Les empreses que apliquen aquest patró informen de millores significatives en l’adopció de funcions a la primera setmana — sense canviar res del producte subjacent.

Compte amb. Genera una versió mestra per flux d’onboarding en lloc d’una per registre. Els usuaris que veuen tots el mateix contingut d’inici ràpid poden escoltar el mateix MP3. Emmagatzemar a la memòria cau per URL font redueix la teva despesa de crèdits en 100x.


3. Guies d’estudi autogenerades en plataformes d’aprenentatge

Cada vegada que es publica un mòdul del curs, generar automàticament un acompanyament en àudio de 15 minuts en l’idioma preferit de l’estudiant.

Com funciona. Es desencadena l’esdeveniment de publicació del mòdul. El teu backend crida POST /v1/podcasts amb l’URL pública del mòdul (o un mirall públic), target_duration_minutes: 15, style: "feynman_technique" per a contingut explicatiu o style: "didactic" per a material procedimental. Fan-out per idioma: una crida per cada idioma admès amb el mateix URL i un codi language diferent.

Crèdits. ~75 crèdits × 4 idiomes × N mòduls. Estén el fan-out d’idiomes gradualment — comença amb un, afegeix-ne més a mesura que l’adopció justifiqui la despesa.

Per què els estudiants interactuen. El format Feynman Technique descompon els conceptes en raonament des de primers principis, la mateixa estratègia d’aprenentatge actiu que impulsa la retenció a llarg termini. Consulta per què funciona l’aprenentatge per àudio per al context des de la ciència cognitiva.

Compte amb. El contingut de cursos amb taules, equacions o imatges riques es degrada en reduir-se a text. Prova amb el teu mòdul més difícil primer — si feynman_technique produeix un episodi que gestiona les equacions com a prosa, pots escalar.


4. Coneixement intern — converteix la wiki en companya de trajecte

La majoria de la documentació interna es llegeix una vegada i s’oblida. Una versió en àudio la converteix en alguna cosa que pots refrescar al camí cap a la feina.

Com funciona. Un cron itera sobre una llista curada d’URL de docs interns (les teves pàgines de Confluence publicades, docs de Notion, lloc GitHub Pages). Per a cada URL, genera un episodi de 10 minuts en l’idioma de treball de l’empresa. Empeny l’MP3 a un feed de pòdcast privat (RSS) al qual només es poden subscriure empleats autenticats.

Crèdits. ~30-45 crèdits per episodi de 10 minuts. Un lot setmanal de 20 docs són 600-900 crèdits per setmana.

Compte amb. Els docs interns han de ser abastables com a URL públics. El patró estàndard és mirallar-los a un URL públic però no endevinable (CloudFront amb protecció per cookie signada, o un slug únic) i passar-lo a Podhoc.


5. Briefing setmanal de l’equip de recerca

Síntesi multifont — combina 5-10 papers en un únic briefing de 30 minuts.

Com funciona. Una vegada a la setmana, el teu feed de recerca destaca els 5-10 papers nous més rellevants en el domini de l’equip. El teu backend crida POST /v1/podcasts amb tots els URL alhora, target_duration_minutes: 30, style: "critique" per fomentar l’avaluació metodològica en lloc d’un resum acrític.

Crèdits. La bonificació multifont és +20 crèdits, el multiplicador de veus és 1,2x, així que un episodi de 30 minuts amb 10 fonts ronda els 200 crèdits en un token de producció. Un per setmana cap a Pro sobradament.

Per què crítica. Els papers de recerca es beneficien d’un format que examina la metodologia en lloc de reformular els resultats. Prova els 8 estils d’àudio en els darrers 5 papers del teu equip abans de comprometre’t.

Compte amb. Un nombre de veus de 2 (o 3 en tokens Pro) és més atractiu que 1 per a briefings llargs. Multiveu desencadena el multiplicador 1,2x; pressuposta-ho en conseqüència.


6. Capa d’accessibilitat — cada article publicat disponible com a àudio

Executa la generació automàtica d’àudio a cada pàgina del teu lloc de contingut, construeix un enllaç audio a cada article i ofereix un feed de pòdcast al costat.

Com funciona. Quan el CMS publica un article nou, dispara un webhook que crida POST /v1/podcasts amb l’URL de l’article, una durada curta (target_duration_minutes: 8 per a articles breus), style: "simplified_explanation" per a una recontada accessible. Emmagatzema l’MP3 a S3, exposa-ho com a /article/audio/<slug>.mp3. Afegeix un AudioObject JSON-LD a l’article perquè els cercadors mostrin la versió en àudio.

Per què importa per a SEO. Google ha estat indexant activament contingut de pòdcast junt amb articles. Mostrar una versió en àudio a cada post de llarga durada augmenta la superfície de cerca sense escriure una segona peça de contingut. L’avantatge d’accessibilitat també és real — els lectors amb dislèxia, problemes de visió o dificultats d’atenció obtenen una experiència de primera classe.


7. Recorregut multilingüe de producte

Genera el mateix contingut com a pòdcasts en els 5 idiomes principals dels teus clients per tenir un onboarding natiu sense pressupost de localització.

Com funciona. Pren l’URL canònic en anglès del teu recorregut. Fa fan-out una crida POST /v1/podcasts per cada idioma objectiu. Emmagatzema els MP3 en rutes etiquetades per idioma al teu CDN (/audio/onboarding-en.mp3, /audio/onboarding-ca.mp3, etc.). Mostra el correcte segons la configuració regional de l’usuari.

Crèdits. 5 idiomes × ~75 crèdits = 375 crèdits per recorregut. Assegurança barata comparada amb encarregar veus traduïdes.

Per què supera les traduccions enregistrades per humans. El TTS multilingüe de Podhoc produeix veus de qualitat nativa en 74 idiomes. La sortida no és una traducció robòtica — és una recontada en l’idioma objectiu amb ritme i èmfasi apropiats. Compara cara a cara amb un model tts="natural" i sentiràs la diferència.

Compte amb. Alguns continguts tècnics tenen modismes en anglès (“ship it”, “raise the alarm”) que es tradueixen malament. Genera la primera versió en 2-3 idiomes objectius i revisa amb parlants nadius abans d’escalar als 5.


8. Àudio de seguiment d’èxit de client

Després de cada trucada d’onboarding, el teu equip de CSM escriu un correu de seguiment amb elements d’acció i recursos. Converteix-lo en un resum d’àudio personalitzat.

Com funciona. El CSM publica el document de seguiment en un URL públic del teu CDN. El backend crida POST /v1/podcasts amb target_duration_minutes: 5, style: "didactic". El client rep una recapitulació en àudio de 5 minuts que pot reproduir camí a la seva pròxima reunió.

Crèdits. ~38-45 crèdits per episodi de 5 minuts. 100 clients × 4 trucades/any = 400 episodis × 45 crèdits = 18.000 crèdits/any. Significatiu però acotat — encaixa còmodament en un patró empresarial Pro-plus.

Per què es guanya el lloc. Pocs CSM confien que els seus clients llegiran el correu de seguiment íntegrament. Una versió en àudio aterra on el correu no.


9. Briefings competitius per a sales-enablement

Genera un briefing setmanal en àudio sobre les actualitzacions de blog de cada competidor perquè l’equip de vendes pugui mantenir-se al dia sense llegir 12 newsletters.

Com funciona. Mantén una llista curada d’URL de competidors (els seus changelogs, blogs, roadmaps públics). Una vegada a la setmana, el teu script recull els 3 més recents de cadascun, crida POST /v1/podcasts amb tots els URL i style: "critique", genera un briefing de 25-30 minuts.

Crèdits. ~150-200 crèdits per briefing setmanal. Trivial comparat amb el cost del temps d’un comercial llegint.

Compte amb. Els URL de competidors canvien. Construeix un petit monitor que avisi quan un URL retorni 404.


10. Generació impulsada per xat (Slack / Discord / Teams)

Permet que qualsevol membre de l’equip escrigui un URL en un canal de xat i rebi un pòdcast a la seva DM.

Com funciona. El teu bot escolta missatges amb URL. Extreu l’URL, busca l’idioma i la durada preferits de l’usuari al teu magatzem de configuració, crida POST /v1/podcasts, consulta i respon amb un enllaç de descàrrega.

Per què redueix la fricció d’adopció. La majoria d’eines internes fallen perquè ningú recorda l’URL. Un punt d’entrada per xat viu on la gent ja treballa. El bot de Telegram és un exemple treballat d’aquest patró, completament desplegat i de codi obert.


11. Show programat — feed diari de pòdcast des d’un tema

Construeix un feed real de pòdcast que publiqui un nou episodi de 15 minuts cada dia laborable basat en una llista curada de fonts.

Com funciona. El cron a les 06:00 selecciona els 3 URL principals del dia del teu feed de fonts, crida POST /v1/podcasts amb target_duration_minutes: 15, descarrega l’MP3, construeix un element RSS i publica el feed. Els oients es subscriuen a Apple Podcasts, Spotify, Overcast — ni saben que és IA.

Crèdits. ~80 crèdits/dia × 5 dies = 400 crèdits/setmana.

Compte amb. Un feed RSS real necessita cover art, metadades d’episodi i un nom d’amfitrió estable. Usa un servei d’hosting de pòdcast (Transistor, Buzzsprout) per evitar el dolor de la validació a iTunes.


12. Alternativa a NotebookLM per a àudio de documents en lot

Si el teu equip usa visions generals en àudio estil NotebookLM ad hoc, canvia a l’API per a producció repetible i programable.

Com funciona. Construeix una petita eina interna: llença una llista d’URL en un formulari, tria un estil i durada, rep una notificació de Slack quan cada episodi estigui llest. Recolzada per l’API, el teu equip obté el flux d’alternativa a NotebookLM sense els límits de freqüència i sense la fricció de “fes clic 14 vegades per generar un episodi”.

Per què els equips migren d’eines interactives a l’API. Els productes estil NotebookLM estan calibrats per a un episodi a la vegada. Quan en vols 50, l’API és l’únic camí raonable.


Triant el teu primer patró

PatróTemps de configuracióPressupost setmanal de crèditsMillor per a
Newsletter a pòdcast1 dia~500Primera integració
Onboarding SaaS en àudio1 setmanaUna vegadaFlux d’onboarding existent
Acompanyants d’aprenentatge2 setmanesVariableProductes amb molts cursos
Feed de coneixement intern1 setmana~600Equips d’enginyeria / docs
Briefing setmanal de recerca1 setmana~200Equips amb molta recerca
Capa d’accessibilitat2 setmanesPer publicacióLlocs de contingut
Recorregut multilingüe1 setmanaUna vegadaProductes internacionals
Àudio de seguiment CSM2 setmanes~400SaaS d’alt contacte
Briefings competitius1 setmana~150Equips de sales-enablement
Generació per xat1 setmanaPer disparEquips d’eines internes
Feed diari de pòdcast2 setmanes~400Estratègies d’audiència
Alternativa a NotebookLM1 setmanaPer disparFluxos amb molts documents

Tria el patró més barat i petit primer. Observa el cost, la latència i la qualitat de la sortida durant dues setmanes abans d’escalar.


Notes arquitectòniques que apliquen a cada patró

Algunes coses que tota integració reeixida fa de la mateixa manera:

  • Persisteix podcast_id abans de consultar. Les caigudes són inevitables; reprendre estalvia crèdits.
  • Estima el cost abans de cobrar. GET /v1/estimate-cost és gratis — crida’l com a salvaguarda al teu client.
  • Emmagatzema a la memòria cau per URL font + paràmetres. Molts patrons generen el mateix dues vegades. Memoritza.
  • Posa timeout a la consulta als 15 minuts. La generació normalment acaba en 2-5; un sostre de 15 minuts fa aflorar fallades reals sense penjar el teu treballador.
  • Registra meta.request_id a cada error. El suport correlaciona amb ell.
  • Tracta el token de prova com el teu nivell CI. Executa proves d’integració amb ell. Els tokens de producció són només per a trànsit de producció.

La disciplina és la mateixa que per a qualsevol altra integració amb API REST — les filosofies de disseny de Stripe i de l’API d’Anthropic convergeixen al mateix grapat de patrons. Cap és específic de Podhoc.


Què llegir a continuació

L’API es llança amb una superfície petita i un únic contracte. Els patrons es multipliquen ràpid. Tria’n un, envia a producció en una setmana, i després duplica l’aposta en allò que els teus usuaris realment han enganxat.

Obtén un token d’API →

Preguntes freqüents

Què em permet construir l'API de Podhoc?
Qualsevol cosa que converteixi text al web en àudio multiveu tipus pòdcast: pipelines de newsletter a pòdcast, onboarding en àudio per a productes SaaS, guies d’estudi automàtiques per a plataformes d’aprenentatge, briefings executius per a equips de recerca, capes d’accessibilitat per a portals de contingut, recorreguts multilingües de producte. L’API és deliberadament mínima — POST d’un URL, consulta, descàrrega — així que els patrons d’integració són sobretot qüestió d’instal·lacions al teu costat.
Necessito el pla Pro per usar l'API?
Sí. L’accés a l’API està inclòs al pla Pro (29 €/mes, 3500 crèdits) i superiors. Els plans Free i Creator no inclouen tokens d’API. Els tokens es creen a app.podhoc.com/account/api-access un cop actualitzada la subscripció.
Quant costa cada pòdcast en crèdits?
El cost base és max(30, ceil(duration_minutes × 2,5)). Un episodi de 10 minuts són 30 crèdits base. La bonificació multifont afegeix 20, la de pesos personalitzats 10, multiveu multiplica per 1,2, amb sostre a 500 crèdits. L’API aplica un multiplicador addicional d'1,5x (test) o 2,5x (producció). Usa GET /v1/estimate-cost per previsualitzar abans de generar.
Quin patró d'integració és el més barat per començar?
Un pipeline de digest diari. Tria una font d’entrada (URL d’un newsletter, feed RSS, llista curada), genera un episodi curt (10-15 minuts) per dia en un idioma, desa’l al teu bucket. Això és aproximadament 30-50 crèdits diaris, amb molta folgança dins del pla Pro. El patró és curt, observable i et dóna una vista completa d’extrem a extrem del cost, la latència i la qualitat de la sortida.
Puc generar pòdcasts en diversos idiomes des de la mateixa font?
Sí. L’idioma d’origen i el de sortida estan desacoblats — Podhoc admet 74 idiomes d’entrada i 74 de sortida amb veus natives en cadascun. Un patró habitual és cridar POST /v1/podcasts una vegada per idioma objectiu, amb el mateix URL però diferent paràmetre language. Pagaràs el cost en crèdits per cada crida. No tradueixis la font al teu costat — deixa que ho faci Podhoc durant la generació.
Com evito crear pòdcasts duplicats quan el meu pipeline reintenta?
Registra el podcast_id que retorna l’endpoint de creació. Persisteix-lo juntament amb l’URL font i els paràmetres al teu propi magatzem abans de començar a consultar. Si el teu pipeline cau a meitat de la consulta, pots reprendre contra el mateix podcast_id en lloc de recrear (i tornar a cobrar). Les claus d’idempotència encara no són una funció de primera classe de l’API, així que la disciplina viu al teu client.
Puc desencadenar la generació des d'una plataforma de xat?
Sí. El bot de Telegram de Podhoc ja ho fa — consulta Com usar el bot de Telegram de Podhoc. Per a la teva integració, captura l’entrada del xat (Slack, Discord, Microsoft Teams), extreu els URL amb una expressió regular, crida POST /v1/podcasts i respon amb un enllaç d’estat o, un cop complet, un enllaç de descàrrega. Construeix un patró xat-a-pòdcast en una tarda.
Quins són els límits de freqüència de l'API?
Tokens de prova: 2 peticions/minut, 20/hora, 1 generació concurrent. Tokens de producció: 30 peticions/minut, 300/hora, 5 generacions concurrents. Quan s’arriba a un límit, la resposta és HTTP 429 amb capçalera Retry-After. Construeix la teva cua al voltant del límit concurrent (5 treballs simultanis a producció) i la limitació per minut.