La realidad detrás del bombo de los avatares digitales
El auge de la IA generativa ha inundado el mercado con chatbots y agentes de IA, pero la mayoría siguen siendo experiencias basadas en texto. Lemon Slice está abordando un problema que ha afectado al espacio de los avatares durante años: crear personajes digitales realistas que no desencadenen el efecto valle inquietante—esa sensación desconcertante que experimentan los usuarios cuando los avatares parecen casi, pero no del todo, humanos.
La startup argumenta que las soluciones de avatares existentes aportan poco valor a la experiencia del usuario. Las ofertas actuales a menudo parecen rígidas e innaturales, ofreciendo unos segundos impresionantes antes de que las interacciones revelen sus limitaciones. Esta brecha tecnológica ha impedido que los avatares logren una adopción masiva, a pesar de años de desarrollo en toda la industria.
El avance técnico: Lemon Slice-2
Fundada en 2024 por Lina Colucci, Sidney Primas y Andrew Weitz, Lemon Slice ha desarrollado Lemon Slice-2, un modelo de difusión de 20 mil millones de parámetros diseñado para funcionar en una sola GPU, ofreciendo transmisión de vídeo en vivo a 20 cuadros por segundo. A diferencia de los competidores que dependen de soluciones a medida para casos de uso específicos, este enfoque de propósito general enfrenta directamente el desafío del valle inquietante.
El modelo transforma una sola imagen en un avatar digital interactivo capaz de desempeñar diversos roles—desde representantes de atención al cliente hasta tutores educativos y agentes de apoyo en salud mental. Los usuarios pueden ajustar dinámicamente fondos, estilos y apariencia del personaje durante las interacciones. La compañía también está innovando en la generación de personajes no humanos para servir aplicaciones diversas más allá de los avatares humanos.
La síntesis de voz se realiza mediante la tecnología integrada de ElevenLabs, que permite diálogos con sonido natural.
Modelo de despliegue accesible
Lemon Slice distribuye su tecnología de avatares a través de una API y un widget embebible, permitiendo a las empresas integrar la solución en sus plataformas con un mínimo de código. Los despliegues actuales abarcan educación, aprendizaje de idiomas, comercio electrónico y formación corporativa.
Ronda semilla de 10,5 millones de dólares impulsa la expansión
La compañía anunció el martes que ha recaudado 10,5 millones de dólares en financiación semilla de Matrix Partners, Y Combinator, Arash Ferdowsi (CTO de Dropbox), Emmett Shear (CEO de Twitch) y The Chainsmokers. El capital se destinará a contratar ingenieros, ampliar la estrategia de mercado y recursos de computación GPU para el entrenamiento del modelo.
Con actualmente ocho empleados, Lemon Slice está en posición de escalar rápidamente. La startup implementa medidas de seguridad contra clonaciones no autorizadas de rostro y voz, aprovechando modelos de lenguaje grande para la moderación de contenido.
Por qué este enfoque es diferente
Ilya Sukhar, de Matrix Partners, destaca que, aunque el vídeo domina cada vez más el consumo de contenido—los usuarios prefieren tutoriales de YouTube a textos—la mayoría de las plataformas de avatares siguen siendo soluciones verticales específicas. La arquitectura de transformador de difusión de Lemon Slice refleja los modelos de generación de vídeo de vanguardia, permitiendo una flexibilidad de extremo a extremo sin límites arquitectónicos que restrinjan las mejoras en calidad.
Los competidores y otras plataformas de avatares digitales han intentado resolver este desafío, pero la mayoría han optado por caminos arquitectónicos más estrechos, optimizados para humanos fotorrealistas o personajes estilizados de videojuegos. La estructura de difusión de propósito general de Lemon Slice puede, en teoría, superar completamente la barrera del valle inquietante, manejando tanto representaciones humanas como no humanas a partir de una sola imagen.
El respaldo de Y Combinator refleja la confianza en que este enfoque basado en ML representa un punto de inflexión genuino para la adopción de la tecnología de avatares en aplicaciones empresariales y de consumo.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
Lemon Slice asegura 10,5 millones de dólares para resolver el problema del Valle inquietante de los avatares
La realidad detrás del bombo de los avatares digitales
El auge de la IA generativa ha inundado el mercado con chatbots y agentes de IA, pero la mayoría siguen siendo experiencias basadas en texto. Lemon Slice está abordando un problema que ha afectado al espacio de los avatares durante años: crear personajes digitales realistas que no desencadenen el efecto valle inquietante—esa sensación desconcertante que experimentan los usuarios cuando los avatares parecen casi, pero no del todo, humanos.
La startup argumenta que las soluciones de avatares existentes aportan poco valor a la experiencia del usuario. Las ofertas actuales a menudo parecen rígidas e innaturales, ofreciendo unos segundos impresionantes antes de que las interacciones revelen sus limitaciones. Esta brecha tecnológica ha impedido que los avatares logren una adopción masiva, a pesar de años de desarrollo en toda la industria.
El avance técnico: Lemon Slice-2
Fundada en 2024 por Lina Colucci, Sidney Primas y Andrew Weitz, Lemon Slice ha desarrollado Lemon Slice-2, un modelo de difusión de 20 mil millones de parámetros diseñado para funcionar en una sola GPU, ofreciendo transmisión de vídeo en vivo a 20 cuadros por segundo. A diferencia de los competidores que dependen de soluciones a medida para casos de uso específicos, este enfoque de propósito general enfrenta directamente el desafío del valle inquietante.
El modelo transforma una sola imagen en un avatar digital interactivo capaz de desempeñar diversos roles—desde representantes de atención al cliente hasta tutores educativos y agentes de apoyo en salud mental. Los usuarios pueden ajustar dinámicamente fondos, estilos y apariencia del personaje durante las interacciones. La compañía también está innovando en la generación de personajes no humanos para servir aplicaciones diversas más allá de los avatares humanos.
La síntesis de voz se realiza mediante la tecnología integrada de ElevenLabs, que permite diálogos con sonido natural.
Modelo de despliegue accesible
Lemon Slice distribuye su tecnología de avatares a través de una API y un widget embebible, permitiendo a las empresas integrar la solución en sus plataformas con un mínimo de código. Los despliegues actuales abarcan educación, aprendizaje de idiomas, comercio electrónico y formación corporativa.
Ronda semilla de 10,5 millones de dólares impulsa la expansión
La compañía anunció el martes que ha recaudado 10,5 millones de dólares en financiación semilla de Matrix Partners, Y Combinator, Arash Ferdowsi (CTO de Dropbox), Emmett Shear (CEO de Twitch) y The Chainsmokers. El capital se destinará a contratar ingenieros, ampliar la estrategia de mercado y recursos de computación GPU para el entrenamiento del modelo.
Con actualmente ocho empleados, Lemon Slice está en posición de escalar rápidamente. La startup implementa medidas de seguridad contra clonaciones no autorizadas de rostro y voz, aprovechando modelos de lenguaje grande para la moderación de contenido.
Por qué este enfoque es diferente
Ilya Sukhar, de Matrix Partners, destaca que, aunque el vídeo domina cada vez más el consumo de contenido—los usuarios prefieren tutoriales de YouTube a textos—la mayoría de las plataformas de avatares siguen siendo soluciones verticales específicas. La arquitectura de transformador de difusión de Lemon Slice refleja los modelos de generación de vídeo de vanguardia, permitiendo una flexibilidad de extremo a extremo sin límites arquitectónicos que restrinjan las mejoras en calidad.
Los competidores y otras plataformas de avatares digitales han intentado resolver este desafío, pero la mayoría han optado por caminos arquitectónicos más estrechos, optimizados para humanos fotorrealistas o personajes estilizados de videojuegos. La estructura de difusión de propósito general de Lemon Slice puede, en teoría, superar completamente la barrera del valle inquietante, manejando tanto representaciones humanas como no humanas a partir de una sola imagen.
El respaldo de Y Combinator refleja la confianza en que este enfoque basado en ML representa un punto de inflexión genuino para la adopción de la tecnología de avatares en aplicaciones empresariales y de consumo.