La réalité derrière le battage autour des avatars numériques
Le boom de l’IA générative a inondé le marché de chatbots et d’agents IA, mais la plupart restent des expériences basées sur du texte. Lemon Slice s’attaque à un problème qui gangrène le domaine des avatars depuis des années : créer des personnages numériques réalistes qui ne déclenchent pas l’effet de vallée étrange—cette sensation désagréable que ressentent les utilisateurs lorsque les avatars ressemblent presque, mais pas tout à fait, à des humains.
La startup affirme que les solutions d’avatar existantes apportent peu de valeur à l’expérience utilisateur. Les offres actuelles apparaissent souvent rigides et artificielles, offrant quelques secondes impressionnantes avant que les interactions ne révèlent leurs limites. Cet écart technologique a empêché les avatars d’atteindre une adoption grand public, malgré des années de développement dans l’industrie.
La percée technique : Lemon Slice-2
Fondée en 2024 par Lina Colucci, Sidney Primas et Andrew Weitz, Lemon Slice a développé Lemon Slice-2, un modèle de diffusion de 20 milliards de paramètres conçu pour fonctionner sur un seul GPU tout en assurant un streaming vidéo en direct à 20 images par seconde. Contrairement à ses concurrents qui s’appuient sur des solutions sur mesure pour des cas d’utilisation spécifiques, cette approche polyvalente s’attaque directement au défi de la vallée étrange.
Le modèle transforme une seule image en un avatar numérique interactif capable d’exécuter divers rôles—de représentant du service client à tuteur éducatif ou agent de soutien en santé mentale. Les utilisateurs peuvent ajuster dynamiquement les arrière-plans, le style et l’apparence du personnage lors des interactions. La société innove également dans la génération de personnages non humains pour répondre à des applications diverses au-delà des avatars humains.
La synthèse vocale est assurée par la technologie intégrée d’ElevenLabs, permettant un dialogue au son naturel.
Modèle de déploiement accessible
Lemon Slice distribue sa technologie d’avatar via une API et un widget intégrable, permettant aux entreprises d’intégrer la solution à leurs plateformes avec un minimum de code. Les déploiements actuels couvrent l’éducation, l’apprentissage des langues, le commerce électronique et la formation en entreprise.
Une levée de fonds de 10,5 millions de dollars pour accélérer l’expansion
La société a annoncé mardi avoir levé 10,5 millions de dollars lors d’un tour d’amorçage auprès de Matrix Partners, Y Combinator, Arash Ferdowsi (CTO de Dropbox), Emmett Shear (CEO de Twitch) et The Chainsmokers. Ce capital servira à financer des recrutements en ingénierie, l’expansion commerciale et des ressources de calcul GPU pour la formation du modèle.
Avec actuellement huit employés, Lemon Slice est positionnée pour une croissance rapide. La startup met en place des mesures de sécurité contre le clonage non autorisé de visages et de voix, en utilisant de grands modèles de langage pour la modération de contenu.
Ce qui distingue cette approche
Ilya Sukhar, partenaire chez Matrix, souligne que si la vidéo domine de plus en plus la consommation de contenu—les utilisateurs préférant souvent des tutoriels YouTube au texte—la plupart des plateformes d’avatars restent des solutions verticales spécifiques. L’architecture de transformeur de diffusion de Lemon Slice reflète les modèles de génération vidéo de pointe, permettant une flexibilité de bout en bout sans plafonds architecturaux limitant l’amélioration de la qualité.
Les concurrents et autres plateformes d’avatars numériques ont tenté de résoudre ce défi, mais la plupart ont opté pour des chemins architecturaux plus étroits, optimisés soit pour des humains photoréalistes, soit pour des personnages stylisés de jeux vidéo. Le cadre de diffusion polyvalent de Lemon Slice peut théoriquement dépasser entièrement la barrière de la vallée étrange, en gérant à la fois des représentations humaines et non humaines à partir d’une seule image.
Le soutien de Y Combinator témoigne de la confiance que cette approche axée sur l’apprentissage automatique représente un véritable point d’inflexion pour l’adoption de la technologie des avatars dans les applications d’entreprise et grand public.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Lemon Slice sécurise 10,5 millions de dollars pour résoudre le problème de la vallée de l'étrangeté des avatars
La réalité derrière le battage autour des avatars numériques
Le boom de l’IA générative a inondé le marché de chatbots et d’agents IA, mais la plupart restent des expériences basées sur du texte. Lemon Slice s’attaque à un problème qui gangrène le domaine des avatars depuis des années : créer des personnages numériques réalistes qui ne déclenchent pas l’effet de vallée étrange—cette sensation désagréable que ressentent les utilisateurs lorsque les avatars ressemblent presque, mais pas tout à fait, à des humains.
La startup affirme que les solutions d’avatar existantes apportent peu de valeur à l’expérience utilisateur. Les offres actuelles apparaissent souvent rigides et artificielles, offrant quelques secondes impressionnantes avant que les interactions ne révèlent leurs limites. Cet écart technologique a empêché les avatars d’atteindre une adoption grand public, malgré des années de développement dans l’industrie.
La percée technique : Lemon Slice-2
Fondée en 2024 par Lina Colucci, Sidney Primas et Andrew Weitz, Lemon Slice a développé Lemon Slice-2, un modèle de diffusion de 20 milliards de paramètres conçu pour fonctionner sur un seul GPU tout en assurant un streaming vidéo en direct à 20 images par seconde. Contrairement à ses concurrents qui s’appuient sur des solutions sur mesure pour des cas d’utilisation spécifiques, cette approche polyvalente s’attaque directement au défi de la vallée étrange.
Le modèle transforme une seule image en un avatar numérique interactif capable d’exécuter divers rôles—de représentant du service client à tuteur éducatif ou agent de soutien en santé mentale. Les utilisateurs peuvent ajuster dynamiquement les arrière-plans, le style et l’apparence du personnage lors des interactions. La société innove également dans la génération de personnages non humains pour répondre à des applications diverses au-delà des avatars humains.
La synthèse vocale est assurée par la technologie intégrée d’ElevenLabs, permettant un dialogue au son naturel.
Modèle de déploiement accessible
Lemon Slice distribue sa technologie d’avatar via une API et un widget intégrable, permettant aux entreprises d’intégrer la solution à leurs plateformes avec un minimum de code. Les déploiements actuels couvrent l’éducation, l’apprentissage des langues, le commerce électronique et la formation en entreprise.
Une levée de fonds de 10,5 millions de dollars pour accélérer l’expansion
La société a annoncé mardi avoir levé 10,5 millions de dollars lors d’un tour d’amorçage auprès de Matrix Partners, Y Combinator, Arash Ferdowsi (CTO de Dropbox), Emmett Shear (CEO de Twitch) et The Chainsmokers. Ce capital servira à financer des recrutements en ingénierie, l’expansion commerciale et des ressources de calcul GPU pour la formation du modèle.
Avec actuellement huit employés, Lemon Slice est positionnée pour une croissance rapide. La startup met en place des mesures de sécurité contre le clonage non autorisé de visages et de voix, en utilisant de grands modèles de langage pour la modération de contenu.
Ce qui distingue cette approche
Ilya Sukhar, partenaire chez Matrix, souligne que si la vidéo domine de plus en plus la consommation de contenu—les utilisateurs préférant souvent des tutoriels YouTube au texte—la plupart des plateformes d’avatars restent des solutions verticales spécifiques. L’architecture de transformeur de diffusion de Lemon Slice reflète les modèles de génération vidéo de pointe, permettant une flexibilité de bout en bout sans plafonds architecturaux limitant l’amélioration de la qualité.
Les concurrents et autres plateformes d’avatars numériques ont tenté de résoudre ce défi, mais la plupart ont opté pour des chemins architecturaux plus étroits, optimisés soit pour des humains photoréalistes, soit pour des personnages stylisés de jeux vidéo. Le cadre de diffusion polyvalent de Lemon Slice peut théoriquement dépasser entièrement la barrière de la vallée étrange, en gérant à la fois des représentations humaines et non humaines à partir d’une seule image.
Le soutien de Y Combinator témoigne de la confiance que cette approche axée sur l’apprentissage automatique représente un véritable point d’inflexion pour l’adoption de la technologie des avatars dans les applications d’entreprise et grand public.