Una comparación práctica de cinco plataformas líderes revela cuál es la mejor para alojar a sus futuros agentes de IA para escenarios cotidianos.
Imagen creada por Decrypt usando IA
Puedes hacer cualquier cosa con los agentes de IA: buscar información en tu biblioteca de documentos, construir código, rastrear la web, obtener información y análisis agudo de datos complejos, y mucho más. Incluso puedes crear una oficina virtual con un grupo de agentes especializados en diferentes tareas y hacerlos trabajar mano a mano como tu propio personal de empleados digitales especializados.
¿Entonces, qué tan difícil es hacer esto? Si una persona común quisiera construir su propio asesor financiero de IA, por ejemplo, ¿qué plataforma les serviría mejor? Sin API, sin codificación extraña, sin Github, solo queríamos ver qué tan bien las mejores compañías de IA pueden crear agentes de IA sin que el usuario posea un alto grado de habilidad técnica.
Por supuesto, obtienes lo que pagas. En este caso, también queríamos ver si había una correlación entre lo fácil que era para un lego configurar un agente y la calidad de los resultados que cada uno entregaba.
Nuestro experimento enfrentó a cinco pesos pesados entre sí: ChatGPT, Claude, Huggingface, Mistral AI y Gemini. Cada plataforma recibió las mismas instrucciones básicas para crear un asesor financiero.
La prueba se centró exclusivamente en las capacidades listas para usar. Si los agentes eran capaces de manejar un escenario común, en este caso, ayudar a alguien a equilibrar $25,000 en inversiones contra $30,000 en deudas. También queríamos ver qué tan buenos eran para analizar un gráfico de trading. Evitamos usar herramientas adicionales que aumentarían la productividad de los agentes e intentamos tomar el enfoque más sencillo.
TL;DR Aquí está lo que descubrimos y cómo clasificamos los modelos:
1) GPT de OpenAI (8.5/10) de Gate
ChatGPT es la plataforma más equilibrada, que ofrece la creación de agentes sofisticados con opciones guiadas y manuales para satisfacer las necesidades de novatos totales y usuarios un poco más experimentados por igual.
Si bien la reciente actualización de la interfaz enterró algunas características en los menús, la plataforma destaca en traducir los requisitos complejos del usuario en agentes funcionales. Probamos el modelo construyendo un asesor financiero que demostró una conciencia contextual superior y capacidades estructuradas para resolver problemas, proporcionando estrategias detalladas pero coherentes para la gestión de deudas y la asignación de inversiones.
2) Google Gemini (7/10)
Gemini se destaca por su interfaz pulida e intuitiva y su excelente manejo de errores. Si bien requiere indicaciones más detalladas para obtener resultados óptimos, su interpretación literal de las instrucciones crea resultados consistentes y predecibles.
El enfoque consultivo del agente hacia el asesoramiento financiero enfatizó la recopilación de contexto antes de las recomendaciones, reflejando prácticas profesionales. Sin embargo, puede ser excesivamente conservador en sus respuestas sin opciones.
3) HuggingChat (6.5/10)
La plataforma de código abierto ofrece opciones de personalización y selección de modelos incomparables. Esto es genial para aquellos que buscan un control detallado sobre cada aspecto, pero no es realmente para aquellos que buscan simplicidad. (Piénselo como comparar un sistema Linux vs. uno macOS). Su sofisticado marco de horizonte temporal y la integración práctica de herramientas demuestran capacidades avanzadas.
Construimos un agente puro sin ninguna funcionalidad adicional. Utilizamos el Nemomotron de Nvidia como LLM base, y fue lo suficientemente bueno para igualar la calidad de salida de ChatGPT. No está mal para el campamento de código abierto.
4) Claude (5.5/10)
La plataforma de Anthropic destaca en nichos específicos, especialmente en tareas que requieren un amplio procesamiento de contexto e interpretación de código. Su interfaz minimalista oculta capacidades sofisticadas, pero el campo de instrucciones "opcional" puede confundir a los usuarios.
Nuestro agente se mantuvo muy conservador y vago en sus consejos, pero demostró una sólida conciencia del riesgo y pensamiento estratégico. Requiere una promoción más cuidadosa para exprimir verdaderamente su potencial, pero sería injusto para una prueba adaptar una promoción, negando la premisa de asumir condiciones similares.
5) Mistral AI (5/10)
La plataforma francesa ofrece una aprendizaje única basada en ejemplos y opciones de personalización profunda. Sin embargo, su interfaz centrada en el desarrollador y los problemas ocasionales de cambio de idioma crean barreras para los usuarios no técnicos. También requiere modificar la configuración del agente para diferentes modelos con el fin de realizar tareas diversas como analizar imágenes o trabajar con código. Esto no es ideal.
El asesor financiero mostró promesa en el diseño de interacción, pero tuvo dificultades con la validación matemática básica y ofreció el peor resultado. Esto no quiere decir que el resultado fuera malo, pero en una prueba sin entrenamiento, fue el menos satisfactorio.
Teniendo en cuenta la clasificación anterior, no hay una solución única y todas las plataformas tienen sus ventajas y desventajas. Con dedicación y una personalización cuidadosa de los mensajes, los resultados de una plataforma pueden variar y superar incluso al resto. En última instancia, todos los LLM tienen sus propios estilos de mensajes respectivos.
Si desea saber más sobre la lógica detrás de nuestra clasificación, aquí tiene una mirada más detallada de nuestra experiencia y los resultados que obtuvimos con nuestros agentes. Configuramos todos nuestros agentes con el mismo mensaje de sistema, sin parámetros o funcionalidades adicionales, y les hicimos la misma pregunta básica: “Tengo $25,000 para invertir y debo $30,000. Diseñe un plan financiero para mí”.
OpenAI
La interfaz de ChatGPT recientemente recibió un lavado de cara que en realidad complicó las cosas. Ahora, la opción de creación de GPT se oculta detrás de menús, pero una vez encontrada, ofrece dos caminos: una configuración conversacional donde la IA ayuda a construir su agente y una configuración manual para aquellos que saben exactamente lo que quieren.
La plataforma GPT de OpenAI es una navaja suiza de capacidades: lee código, busca en la web y maneja tanto la generación como el análisis de imágenes. El proceso de configuración guiado por IA lo hace particularmente adecuado para principiantes, aunque puede sentirse restrictivo para usuarios avanzados que buscan un control detallado. (Por ejemplo, si le indicas al modelo que sea más específico o detallado, puede cambiar toda la indicación del sistema, dándote peores resultados).
Cuando se trata de usar realmente el agente, ChatGPT es muy directo y la interfaz es limpia y fácil de entender.
Los agentes pueden leer documentos de forma nativa y entender imágenes, lo que proporciona una ventaja sobre otras plataformas.
Ahora, hablemos de la calidad de los agentes que puede crear con indicaciones básicas. Nuestro asesor financiero llamado MoneyGPTfue bastante impresionante, dándonos una clase magistral en resolución estructurada de problemas.
Además de sus asignaciones precisas: “$20,000 para deudas de alto interés” y divisiones detalladas de cartera, el agente demostró un razonamiento financiero sofisticado. Proporcionó una hoja de ruta de cinco pasos que no era solo una lista, sino una estrategia coherente que tuvo en cuenta tanto las necesidades inmediatas como las consideraciones a largo plazo.
La fortaleza del agente radicaba en su capacidad para equilibrar el detalle con el contexto. Si bien recomendaba inversiones específicas (40% S&P 500, 30% bonos), también explicaba la lógica detrás de sus respuestas: 'Pagar deudas con altos intereses es como obtener un retorno de inversión garantizado'. Esta conciencia contextual se extendía a la planificación a largo plazo, sugiriendo ciclos de revisión periódica y estrategias adaptables basadas en circunstancias cambiantes.
Sin embargo, esta abundancia de información reveló una posible debilidad: el riesgo de abrumar a los usuarios con demasiados detalles a la vez. Si bien es técnicamente completo, la entrega rápida de asignaciones específicas, estrategias de inversión y planes de seguimiento puede resultar desalentadora para los principiantes en finanzas.
Puedes leer su plan completoaquíy puedes usarlo haciendo clic eneste enlace. Lo recomendamos sinceramente.
En general, la plataforma de creación de agentes de Google Gemini gana el concurso de belleza con una interfaz pulida e intuitiva que hace que la creación de agentes se sienta casi demasiado fácil. El sistema toma las instrucciones literalmente, lo que ayuda a evitar confusiones, y su interfaz limpia elimina el factor de intimidación del desarrollo de IA.
Sin embargo, se requiere una indicación más detallada para exprimir un buen jugo de ella. No da las cosas por sentado: una indicación breve te dará una respuesta de baja calidad.
Bajo el capó, cuenta con una potencia seria: integración de búsqueda web impulsada por Google, capacidades de análisis de código y procesamiento de imágenes que compiten con las ofertas de ChatGPT, pero en su mayoría dependientes de la tecnología de Microsoft.
La interfaz de Gemini se siente como si hubiera sido diseñada por personas que realmente entienden la experiencia del usuario. La interfaz guía a los usuarios con etiquetas claras y todo se muestra en solo una pantalla.
Este enfoque pulido lo hace particularmente atractivo para los recién llegados, aunque los usuarios experimentados podrían encontrarse deseando un control más granular.
Llamamos a nuestro agente MoneyGemy pidió un plan financiero. Su enfoque consultivo mostró la metodología distintiva de resolución de problemas de Google. En lugar de dar una respuesta directa, lideró con preguntas como “¿Qué tipo de deuda es?” y “¿Cuáles son sus tasas de interés?” —mostrando una comprensión de que el asesoramiento financiero no es universal.
Su énfasis en recopilar contexto antes de proporcionar recomendaciones se alinea con las prácticas profesionales de planificación financiera, aunque puede frustrar a los usuarios que buscan respuestas inmediatas.
Una respuesta sin conocimiento no fue útil. El agente básicamente dijo que no conocía lo suficiente al usuario como para brindar un buen asesoramiento financiero. Después de pedirle que hiciera suposiciones y obligarlo a proporcionar un plan que pudiera adaptarse a la mayoría de los escenarios, el agente generó un borrador muy conservador de un plan sin dar sugerencias específicas sobre qué inversiones considerar.
Sin embargo, MoneyGem terminó su respuesta con una recomendación para maximizar las cuentas con ventajas fiscales como un 401(k) o Roth IRA para reducir su carga fiscal. Bueno.
Puedes hacer clic aquípara leer nuestra interacción con MoneyGem, y probar el modelo tú mismo haciendo clic este enlace.
Mistral AI
El enfoque de Mistral para el proceso de configuración del agente está un poco lejos de la simplicidad. La herramienta de creación de agentes está oculta en su consola de desarrollador, con opciones de personalización profundas que podrían asustar a los principiantes pero deleitar a los curiosos.
Su interfaz de construcción de agentes no es parte de LeChat (la interfaz del chatbot), pero aparecerá allí una vez que se cree el agente.
Una cosa que realmente nos gusta es la capacidad de alimentar la herramienta con ejemplos que moldean el comportamiento y el estilo de respuesta del agente, algo que ninguna otra plataforma ofrece actualmente. Además, aquí hay un error extraño: Mientras creábamos nuestro agente, la interfaz de usuario cambió repentinamente a francés, posiblemente porque la empresa es francesa. De todas formas, no pudimos cambiar de nuevo a inglés o español.
Una vez que se crea el agente, los usuarios deben invocarlo en la interfaz normal del chatbot para poder trabajar con él. Deben salir de Le Plateforme e ir a Le Chat, lo cual no es lo más intuitivo de hacer. Sin embargo, la interfaz de usuario para usar el agente es bastante sencilla y se siente como cualquier otro chatbot de IA.
Construimos nuestro agente y lo llamamosLe Moneypara honrar las raíces francesas de Mistral. Su rendimiento mostró claramente el enfoque generalista de Mistral para resolver problemas. Su sugerencia de "reservar $10,000 para emergencias, $15,000 para el pago de deudas y $10,000 para inversiones" parecía sencilla, pero mostraba que los agentes carecían de alguna validación matemática básica.
El total de $35,000 superó los fondos disponibles en $10,000, lo cual es un error básico que algunos modelos de lenguaje exhiben cuando priorizan la corrección conceptual sobre la precisión numérica.
Sin embargo, debemos tener en cuenta que los mejores LLMs que tienen un mejor rendimiento han mejorado mucho y no fallan en esta tarea, al menos no tan frecuentemente como Mistral.
Aparte de eso, su plan no era realmente detallado, pero fue el único que proporcionaba preguntas de seguimiento que podrían hacer la interacción más fluida y podrían ayudarlo a comprender mejor las necesidades del usuario.
El plan completo de LeMoney está disponibleaquíy el agente está disponible para pruebasaquí.
Antropico
Los proyectos de Claude parecen menos una plataforma de creación de agentes y más un sistema sofisticado de ejecución de tareas. La interfaz es mínima, casi demasiado minimalista, y no parece intuitiva.
Esta interfaz minimalista puede dejar a algunos usuarios rascándose la cabeza. La plataforma presenta una configuración básica con un campo de instrucciones 'opcional' que de alguna manera se siente tanto insignificante como crucial al mismo tiempo: Si las instrucciones se etiquetan como opcionales, ¿cómo sabrá el agente de IA qué se supone que debe hacer?
Su interfaz minimalista se siente extraña, pero Anthropic nunca ha sido conocida por su gusto en las elecciones de interfaz de usuario. La misma ventana para configurar el modelo es la que utiliza para solicitarlo. Sus capacidades se centran principalmente en la interpretación del código de texto, nada más. Las búsquedas web y el procesamiento y generación de imágenes son cosas llamativas que Anthropic deja a sus competidores.
Nuestro agente, llamado MoneyClaude, no está disponible para pruebas públicas porque Anthropic no lo permite. Adoptó una postura muy conservadora al proporcionar consejos financieros con respuestas técnicamente precisas pero vagas, como "mantener un enfoque equilibrado entre la reducción de la deuda y el ahorro esencial", por ejemplo.
Solicitó información adicional, pero al menos se aseguró de proporcionar una estrategia muy genérica en su ausencia sin requerir una interacción adicional, lo cual parece más óptimo que el enfoque de Google.
Haz clic aquí para leer su plan completo.
Hugging Face
El repositorio de código abierto se destaca como el paraíso del usuario avanzado y una pesadilla potencial para principiantes. Es la única plataforma que permite a los usuarios elegir su modelo de lenguaje preferido, ofreciendo un control sin precedentes sobre los cimientos del agente.
Además, los usuarios tienen docenas de herramientas diferentes para integrar con sus agentes, pero solo pueden activar tres de ellas simultáneamente. Esta limitación obliga a considerar cuidadosamente qué características son más importantes para cada caso de uso específico, pero es algo que ningún otro modelo puede ofrecer.
Es la experiencia más personalizable de todas las interfaces, sin embargo, con muchas perillas para ajustar. El resultado es una plataforma que puede crear agentes más poderosos y especializados que sus competidores, pero solo en manos de alguien que sabe exactamente lo que está haciendo.
Los usuarios pueden probar sus agentes en HuggingChat—sin lugar a dudas, el sueño del usuario avanzado. Una vez que creas el agente, usarlo es muy sencillo. La interfaz muestra una gran tarjeta con el nombre del agente, la descripción y la foto. También permite a los usuarios compartir el enlace del agente y ajustar su configuración, todo desde la tarjeta.
Colocando nuestro HuggingMoneyEl agente pone a prueba que trata con un marco de horizonte temporal, mostrando una comprensión más sofisticada de la psicología de la planificación financiera. Su desglose en "Corto plazo (0-24 meses), Mediano plazo (24-60 meses) y Largo plazo (más de 60 meses)" refleja las prácticas profesionales de planificación financiera.
El agente sugirió asignar "$0-$5,000 en vehículos líquidos y de bajo riesgo", manteniendo al mismo tiempo pagos de deuda agresivos de "$1,000-$1,500 mensuales." A primera vista, esto es un signo de comprensión matizada de la gestión del flujo de efectivo.
Otra característica interesante fue su integración de herramientas prácticas con consejos teóricos. Más allá de simplemente sugerir el 50/30/20En resumen, recomendó aplicaciones específicas para la presupuestación y enfatizó la optimización fiscal, creando un puente entre la estrategia a nivel alto y la ejecución diaria. ¿La principal desventaja? Incluye suposiciones sobre las tasas de interés de la deuda sin buscar aclaraciones.
En un esfuerzo por proporcionar consejos útiles, se dan por sentadas demasiadas cosas. Este impulso de proporcionar una respuesta sin importar qué, se puede solucionar con un estímulo, pero es algo a considerar.
Puedes leer el plan completo de HuggingMoneyaquí. Además, puedes probarlo haciendo clic en este enlace.
Una comparación práctica de cinco plataformas líderes revela cuál es la mejor para alojar a sus futuros agentes de IA para escenarios cotidianos.
Imagen creada por Decrypt usando IA
Puedes hacer cualquier cosa con los agentes de IA: buscar información en tu biblioteca de documentos, construir código, rastrear la web, obtener información y análisis agudo de datos complejos, y mucho más. Incluso puedes crear una oficina virtual con un grupo de agentes especializados en diferentes tareas y hacerlos trabajar mano a mano como tu propio personal de empleados digitales especializados.
¿Entonces, qué tan difícil es hacer esto? Si una persona común quisiera construir su propio asesor financiero de IA, por ejemplo, ¿qué plataforma les serviría mejor? Sin API, sin codificación extraña, sin Github, solo queríamos ver qué tan bien las mejores compañías de IA pueden crear agentes de IA sin que el usuario posea un alto grado de habilidad técnica.
Por supuesto, obtienes lo que pagas. En este caso, también queríamos ver si había una correlación entre lo fácil que era para un lego configurar un agente y la calidad de los resultados que cada uno entregaba.
Nuestro experimento enfrentó a cinco pesos pesados entre sí: ChatGPT, Claude, Huggingface, Mistral AI y Gemini. Cada plataforma recibió las mismas instrucciones básicas para crear un asesor financiero.
La prueba se centró exclusivamente en las capacidades listas para usar. Si los agentes eran capaces de manejar un escenario común, en este caso, ayudar a alguien a equilibrar $25,000 en inversiones contra $30,000 en deudas. También queríamos ver qué tan buenos eran para analizar un gráfico de trading. Evitamos usar herramientas adicionales que aumentarían la productividad de los agentes e intentamos tomar el enfoque más sencillo.
TL;DR Aquí está lo que descubrimos y cómo clasificamos los modelos:
1) GPT de OpenAI (8.5/10) de Gate
ChatGPT es la plataforma más equilibrada, que ofrece la creación de agentes sofisticados con opciones guiadas y manuales para satisfacer las necesidades de novatos totales y usuarios un poco más experimentados por igual.
Si bien la reciente actualización de la interfaz enterró algunas características en los menús, la plataforma destaca en traducir los requisitos complejos del usuario en agentes funcionales. Probamos el modelo construyendo un asesor financiero que demostró una conciencia contextual superior y capacidades estructuradas para resolver problemas, proporcionando estrategias detalladas pero coherentes para la gestión de deudas y la asignación de inversiones.
2) Google Gemini (7/10)
Gemini se destaca por su interfaz pulida e intuitiva y su excelente manejo de errores. Si bien requiere indicaciones más detalladas para obtener resultados óptimos, su interpretación literal de las instrucciones crea resultados consistentes y predecibles.
El enfoque consultivo del agente hacia el asesoramiento financiero enfatizó la recopilación de contexto antes de las recomendaciones, reflejando prácticas profesionales. Sin embargo, puede ser excesivamente conservador en sus respuestas sin opciones.
3) HuggingChat (6.5/10)
La plataforma de código abierto ofrece opciones de personalización y selección de modelos incomparables. Esto es genial para aquellos que buscan un control detallado sobre cada aspecto, pero no es realmente para aquellos que buscan simplicidad. (Piénselo como comparar un sistema Linux vs. uno macOS). Su sofisticado marco de horizonte temporal y la integración práctica de herramientas demuestran capacidades avanzadas.
Construimos un agente puro sin ninguna funcionalidad adicional. Utilizamos el Nemomotron de Nvidia como LLM base, y fue lo suficientemente bueno para igualar la calidad de salida de ChatGPT. No está mal para el campamento de código abierto.
4) Claude (5.5/10)
La plataforma de Anthropic destaca en nichos específicos, especialmente en tareas que requieren un amplio procesamiento de contexto e interpretación de código. Su interfaz minimalista oculta capacidades sofisticadas, pero el campo de instrucciones "opcional" puede confundir a los usuarios.
Nuestro agente se mantuvo muy conservador y vago en sus consejos, pero demostró una sólida conciencia del riesgo y pensamiento estratégico. Requiere una promoción más cuidadosa para exprimir verdaderamente su potencial, pero sería injusto para una prueba adaptar una promoción, negando la premisa de asumir condiciones similares.
5) Mistral AI (5/10)
La plataforma francesa ofrece una aprendizaje única basada en ejemplos y opciones de personalización profunda. Sin embargo, su interfaz centrada en el desarrollador y los problemas ocasionales de cambio de idioma crean barreras para los usuarios no técnicos. También requiere modificar la configuración del agente para diferentes modelos con el fin de realizar tareas diversas como analizar imágenes o trabajar con código. Esto no es ideal.
El asesor financiero mostró promesa en el diseño de interacción, pero tuvo dificultades con la validación matemática básica y ofreció el peor resultado. Esto no quiere decir que el resultado fuera malo, pero en una prueba sin entrenamiento, fue el menos satisfactorio.
Teniendo en cuenta la clasificación anterior, no hay una solución única y todas las plataformas tienen sus ventajas y desventajas. Con dedicación y una personalización cuidadosa de los mensajes, los resultados de una plataforma pueden variar y superar incluso al resto. En última instancia, todos los LLM tienen sus propios estilos de mensajes respectivos.
Si desea saber más sobre la lógica detrás de nuestra clasificación, aquí tiene una mirada más detallada de nuestra experiencia y los resultados que obtuvimos con nuestros agentes. Configuramos todos nuestros agentes con el mismo mensaje de sistema, sin parámetros o funcionalidades adicionales, y les hicimos la misma pregunta básica: “Tengo $25,000 para invertir y debo $30,000. Diseñe un plan financiero para mí”.
OpenAI
La interfaz de ChatGPT recientemente recibió un lavado de cara que en realidad complicó las cosas. Ahora, la opción de creación de GPT se oculta detrás de menús, pero una vez encontrada, ofrece dos caminos: una configuración conversacional donde la IA ayuda a construir su agente y una configuración manual para aquellos que saben exactamente lo que quieren.
La plataforma GPT de OpenAI es una navaja suiza de capacidades: lee código, busca en la web y maneja tanto la generación como el análisis de imágenes. El proceso de configuración guiado por IA lo hace particularmente adecuado para principiantes, aunque puede sentirse restrictivo para usuarios avanzados que buscan un control detallado. (Por ejemplo, si le indicas al modelo que sea más específico o detallado, puede cambiar toda la indicación del sistema, dándote peores resultados).
Cuando se trata de usar realmente el agente, ChatGPT es muy directo y la interfaz es limpia y fácil de entender.
Los agentes pueden leer documentos de forma nativa y entender imágenes, lo que proporciona una ventaja sobre otras plataformas.
Ahora, hablemos de la calidad de los agentes que puede crear con indicaciones básicas. Nuestro asesor financiero llamado MoneyGPTfue bastante impresionante, dándonos una clase magistral en resolución estructurada de problemas.
Además de sus asignaciones precisas: “$20,000 para deudas de alto interés” y divisiones detalladas de cartera, el agente demostró un razonamiento financiero sofisticado. Proporcionó una hoja de ruta de cinco pasos que no era solo una lista, sino una estrategia coherente que tuvo en cuenta tanto las necesidades inmediatas como las consideraciones a largo plazo.
La fortaleza del agente radicaba en su capacidad para equilibrar el detalle con el contexto. Si bien recomendaba inversiones específicas (40% S&P 500, 30% bonos), también explicaba la lógica detrás de sus respuestas: 'Pagar deudas con altos intereses es como obtener un retorno de inversión garantizado'. Esta conciencia contextual se extendía a la planificación a largo plazo, sugiriendo ciclos de revisión periódica y estrategias adaptables basadas en circunstancias cambiantes.
Sin embargo, esta abundancia de información reveló una posible debilidad: el riesgo de abrumar a los usuarios con demasiados detalles a la vez. Si bien es técnicamente completo, la entrega rápida de asignaciones específicas, estrategias de inversión y planes de seguimiento puede resultar desalentadora para los principiantes en finanzas.
Puedes leer su plan completoaquíy puedes usarlo haciendo clic eneste enlace. Lo recomendamos sinceramente.
En general, la plataforma de creación de agentes de Google Gemini gana el concurso de belleza con una interfaz pulida e intuitiva que hace que la creación de agentes se sienta casi demasiado fácil. El sistema toma las instrucciones literalmente, lo que ayuda a evitar confusiones, y su interfaz limpia elimina el factor de intimidación del desarrollo de IA.
Sin embargo, se requiere una indicación más detallada para exprimir un buen jugo de ella. No da las cosas por sentado: una indicación breve te dará una respuesta de baja calidad.
Bajo el capó, cuenta con una potencia seria: integración de búsqueda web impulsada por Google, capacidades de análisis de código y procesamiento de imágenes que compiten con las ofertas de ChatGPT, pero en su mayoría dependientes de la tecnología de Microsoft.
La interfaz de Gemini se siente como si hubiera sido diseñada por personas que realmente entienden la experiencia del usuario. La interfaz guía a los usuarios con etiquetas claras y todo se muestra en solo una pantalla.
Este enfoque pulido lo hace particularmente atractivo para los recién llegados, aunque los usuarios experimentados podrían encontrarse deseando un control más granular.
Llamamos a nuestro agente MoneyGemy pidió un plan financiero. Su enfoque consultivo mostró la metodología distintiva de resolución de problemas de Google. En lugar de dar una respuesta directa, lideró con preguntas como “¿Qué tipo de deuda es?” y “¿Cuáles son sus tasas de interés?” —mostrando una comprensión de que el asesoramiento financiero no es universal.
Su énfasis en recopilar contexto antes de proporcionar recomendaciones se alinea con las prácticas profesionales de planificación financiera, aunque puede frustrar a los usuarios que buscan respuestas inmediatas.
Una respuesta sin conocimiento no fue útil. El agente básicamente dijo que no conocía lo suficiente al usuario como para brindar un buen asesoramiento financiero. Después de pedirle que hiciera suposiciones y obligarlo a proporcionar un plan que pudiera adaptarse a la mayoría de los escenarios, el agente generó un borrador muy conservador de un plan sin dar sugerencias específicas sobre qué inversiones considerar.
Sin embargo, MoneyGem terminó su respuesta con una recomendación para maximizar las cuentas con ventajas fiscales como un 401(k) o Roth IRA para reducir su carga fiscal. Bueno.
Puedes hacer clic aquípara leer nuestra interacción con MoneyGem, y probar el modelo tú mismo haciendo clic este enlace.
Mistral AI
El enfoque de Mistral para el proceso de configuración del agente está un poco lejos de la simplicidad. La herramienta de creación de agentes está oculta en su consola de desarrollador, con opciones de personalización profundas que podrían asustar a los principiantes pero deleitar a los curiosos.
Su interfaz de construcción de agentes no es parte de LeChat (la interfaz del chatbot), pero aparecerá allí una vez que se cree el agente.
Una cosa que realmente nos gusta es la capacidad de alimentar la herramienta con ejemplos que moldean el comportamiento y el estilo de respuesta del agente, algo que ninguna otra plataforma ofrece actualmente. Además, aquí hay un error extraño: Mientras creábamos nuestro agente, la interfaz de usuario cambió repentinamente a francés, posiblemente porque la empresa es francesa. De todas formas, no pudimos cambiar de nuevo a inglés o español.
Una vez que se crea el agente, los usuarios deben invocarlo en la interfaz normal del chatbot para poder trabajar con él. Deben salir de Le Plateforme e ir a Le Chat, lo cual no es lo más intuitivo de hacer. Sin embargo, la interfaz de usuario para usar el agente es bastante sencilla y se siente como cualquier otro chatbot de IA.
Construimos nuestro agente y lo llamamosLe Moneypara honrar las raíces francesas de Mistral. Su rendimiento mostró claramente el enfoque generalista de Mistral para resolver problemas. Su sugerencia de "reservar $10,000 para emergencias, $15,000 para el pago de deudas y $10,000 para inversiones" parecía sencilla, pero mostraba que los agentes carecían de alguna validación matemática básica.
El total de $35,000 superó los fondos disponibles en $10,000, lo cual es un error básico que algunos modelos de lenguaje exhiben cuando priorizan la corrección conceptual sobre la precisión numérica.
Sin embargo, debemos tener en cuenta que los mejores LLMs que tienen un mejor rendimiento han mejorado mucho y no fallan en esta tarea, al menos no tan frecuentemente como Mistral.
Aparte de eso, su plan no era realmente detallado, pero fue el único que proporcionaba preguntas de seguimiento que podrían hacer la interacción más fluida y podrían ayudarlo a comprender mejor las necesidades del usuario.
El plan completo de LeMoney está disponibleaquíy el agente está disponible para pruebasaquí.
Antropico
Los proyectos de Claude parecen menos una plataforma de creación de agentes y más un sistema sofisticado de ejecución de tareas. La interfaz es mínima, casi demasiado minimalista, y no parece intuitiva.
Esta interfaz minimalista puede dejar a algunos usuarios rascándose la cabeza. La plataforma presenta una configuración básica con un campo de instrucciones 'opcional' que de alguna manera se siente tanto insignificante como crucial al mismo tiempo: Si las instrucciones se etiquetan como opcionales, ¿cómo sabrá el agente de IA qué se supone que debe hacer?
Su interfaz minimalista se siente extraña, pero Anthropic nunca ha sido conocida por su gusto en las elecciones de interfaz de usuario. La misma ventana para configurar el modelo es la que utiliza para solicitarlo. Sus capacidades se centran principalmente en la interpretación del código de texto, nada más. Las búsquedas web y el procesamiento y generación de imágenes son cosas llamativas que Anthropic deja a sus competidores.
Nuestro agente, llamado MoneyClaude, no está disponible para pruebas públicas porque Anthropic no lo permite. Adoptó una postura muy conservadora al proporcionar consejos financieros con respuestas técnicamente precisas pero vagas, como "mantener un enfoque equilibrado entre la reducción de la deuda y el ahorro esencial", por ejemplo.
Solicitó información adicional, pero al menos se aseguró de proporcionar una estrategia muy genérica en su ausencia sin requerir una interacción adicional, lo cual parece más óptimo que el enfoque de Google.
Haz clic aquí para leer su plan completo.
Hugging Face
El repositorio de código abierto se destaca como el paraíso del usuario avanzado y una pesadilla potencial para principiantes. Es la única plataforma que permite a los usuarios elegir su modelo de lenguaje preferido, ofreciendo un control sin precedentes sobre los cimientos del agente.
Además, los usuarios tienen docenas de herramientas diferentes para integrar con sus agentes, pero solo pueden activar tres de ellas simultáneamente. Esta limitación obliga a considerar cuidadosamente qué características son más importantes para cada caso de uso específico, pero es algo que ningún otro modelo puede ofrecer.
Es la experiencia más personalizable de todas las interfaces, sin embargo, con muchas perillas para ajustar. El resultado es una plataforma que puede crear agentes más poderosos y especializados que sus competidores, pero solo en manos de alguien que sabe exactamente lo que está haciendo.
Los usuarios pueden probar sus agentes en HuggingChat—sin lugar a dudas, el sueño del usuario avanzado. Una vez que creas el agente, usarlo es muy sencillo. La interfaz muestra una gran tarjeta con el nombre del agente, la descripción y la foto. También permite a los usuarios compartir el enlace del agente y ajustar su configuración, todo desde la tarjeta.
Colocando nuestro HuggingMoneyEl agente pone a prueba que trata con un marco de horizonte temporal, mostrando una comprensión más sofisticada de la psicología de la planificación financiera. Su desglose en "Corto plazo (0-24 meses), Mediano plazo (24-60 meses) y Largo plazo (más de 60 meses)" refleja las prácticas profesionales de planificación financiera.
El agente sugirió asignar "$0-$5,000 en vehículos líquidos y de bajo riesgo", manteniendo al mismo tiempo pagos de deuda agresivos de "$1,000-$1,500 mensuales." A primera vista, esto es un signo de comprensión matizada de la gestión del flujo de efectivo.
Otra característica interesante fue su integración de herramientas prácticas con consejos teóricos. Más allá de simplemente sugerir el 50/30/20En resumen, recomendó aplicaciones específicas para la presupuestación y enfatizó la optimización fiscal, creando un puente entre la estrategia a nivel alto y la ejecución diaria. ¿La principal desventaja? Incluye suposiciones sobre las tasas de interés de la deuda sin buscar aclaraciones.
En un esfuerzo por proporcionar consejos útiles, se dan por sentadas demasiadas cosas. Este impulso de proporcionar una respuesta sin importar qué, se puede solucionar con un estímulo, pero es algo a considerar.
Puedes leer el plan completo de HuggingMoneyaquí. Además, puedes probarlo haciendo clic en este enlace.