Développement de nouvelles fonctionnalités voix, vidéo et image pour une plateforme de création d'influenceurs IA.
Voir le site
Contexte
DigitalCreator est un SaaS qui permet de créer et monétiser des influenceurs IA sur Instagram et TikTok. La plateforme propose la création de vidéos et d'images via des avatars générés par IA, avec un modèle basé sur des crédits.
Le problème
La plateforme devait étoffer ses fonctionnalités pour rester compétitive : ajout de la synthèse vocale, clonage de voix, génération d'images, et connexion aux APIs d'avatars vidéo. Les parcours utilisateurs existants étaient trop complexes et le système de crédits ne reflétait pas l'usage réel.
Mon approche
Connexion de l'API Fish Audio pour le text-to-speech avec pré-écoute et validation utilisateur avant génération. Parcours repensé pour plus de fluidité.
Liaison des audios générés aux avatars vidéo via Heygen, avec intégration Submagic pour le montage automatique quand activé.
Développement complet du flow de clonage vocal : import de fichiers audio, test de la voix clonée, usage privé et gestion des fichiers associés.
Refonte du flow de création avec génération d'images par prompt libre ou scènes prédéfinies. Images régénérables et téléchargeables directement.
Stack technique
Résultats
Fonctionnalités
5 features majeures livrées : TTS, clonage vocal, génération d'images, avatars vidéo, crédits
Crédits
Système de crédits refondu, basé sur la durée réelle de l'audio généré
UX
Parcours de création simplifiés avec pré-écoute et validation à chaque étape
Intégrations
3 APIs IA connectées et orchestrées : Fish Audio, Heygen, Submagic
Projet similaire ?