/ martes 18 de abril de 2023

¿Cuál es el mejor chatbot de IA?

Mediante un ejercicio comparativo, se pueden identificar las principales virtudes y defectos de cada una de estas herramientas ante los mismos cuestionamientos


Los chatbots con inteligencia artificial (IA) pueden generar en cuestión de segundos respuestas similares a las que podría dar un ser humano sobre cualquier tema, siendo los más populares por el momento Bard, de Google; Bing, de Microsoft y ChatGPT, de OpenAI.

Los chatbots con IA más populares del momento son: Bard, de Google; Bing, de Microsoft y ChatGPT, de OpenAI

Mediante un ejercicio, la agencia EFE comparó los tres modelos con una variedad de preguntas, acertijos y peticiones para ver la diferencia entre sus respuestas.

Para este experimento, se usó GPT-4, de OpenAI, al que se puede acceder pagando una suscripción de 20 dólares mensuales -OpenAI ofrece servicios gratuitos, como ChatGPT, pero es una tecnología inferior y el chatbot solo tiene acceso a internet hasta 2021.

También se utilizó Bing de Microsoft, impulsado por la tecnología GPT-4 de OpenAI, y la primera versión experimental de Google, Bard, al que sólo tienen acceso un selecto grupo de personas.

De entrada, las tres herramientas presentan mensajes en los que advierten que sus respuestas pueden ser erróneas. "Tengo limitaciones y no siempre lo haré bien", dice el servicio de Google.

No todos hablan español

A la pregunta: "¿Te puedo preguntar cosas en español?", Bing y ChatGPT responden: "Sí".

Mientras que Bard contesta en inglés que no podía "brindar asistencia con eso", ya que está "capacitado para comprender y responder sólo a un subconjunto de idiomas en este momento", dando a entender que el español no es uno de esos idiomas.

En tanto, las preguntas y respuestas de este experimento serán en español, en el caso de Bing y ChatGPT, y en inglés, en el caso de Bard.

"Dame una receta vegetariana y barata", pregunta EFE. GPT-4 recomienda "lentejas vegetarianas", Bing "arroz con lentejas y verduras" y Bard "revuelto de tofu".

Los tres chatbots siguieron el mismo sistema, primero enumerar los ingredientes y luego dar las instrucciones de preparación.

Tanto GPT-4 como Bard fueron un paso más lejos y dieron información adicional a la propia receta.

Mientras que Bard recalca al final de su mensaje que su receta es "una buena fuente de proteína y fibra".

¿De dónde sacan la información?

Microsoft y Google tienen sus propios buscadores y les beneficia redireccionar a los usuarios a otras páginas web.

Al final de cada respuesta de Bard hay un botón que dice: "Búscalo en Google", mientras que en Bing hay una etiqueta que dice "aprenda más", donde da una lista de ligas.

En este caso de la receta, la herramienta de Microsoft da enlaces a los sitios recetasderechupete.com, tendencias.com, kiwilimon.com y clara.es.

Por su parte, OpenAI no da ningún link externo u opción de conocer la fuente de la información.

Un examen de letras hispánicas

La siguiente prueba es una pregunta de un examen de Literatura y Cultura Española de Colocación Avanzada (AP) -exámenes que los estudiantes de secundaria estadounidense pueden hacer para conseguir créditos universitarios.

A los tres chatbots se les da un fragmento de un texto y se les pide identificar el autor, así como explicar el desarrollo del tema de la relación entre el tiempo y el espacio dentro de la obra a la que pertenece.

A los alumnos se les recomienda usar 15 minutos para responder a esta respuesta, pero los chatbots dan la su réplica en menos de 1 minuto.

De acuerdo con la filóloga, profesora de español y estudios sociales en EE. UU. Ana García Alonso, la única respuesta que aprobaría es la de Bard, pero como esta fue en inglés y no en español, la tendría que suspender también.

En su respuesta en inglés, la herramienta de Google reconoce que el fragmento de "Mi caballo mago" fue escrito por Sabine R. Ulibarrí y luego analiza el texto en varios párrafos.

"Está muy bien, pero carece de sensibilidad lectora, no capta los mecanismos que crean la belleza, el arte y la sensibilidad literaria", apunta García Alonso.

La respuesta de Bing es la más corta, con 123 palabras. Este chat también identifica el autor, dice que el texto "es considerada una de las obras más importantes de la literatura chicana" y explica el resto en un párrafo.

"Es muy escueto y le falta análisis", subraya la filóloga, quien añade que no aprobaría el ejercicio de este chat.

OpenAI dio la respuesta más larga, de 360 palabras, pero fue la peor respuesta, según García Alonso.

Pese a que en la pregunta se señala que el texto se titula "Mi caballo mago", GPT-4 responde que el fragmento pertenece al cuento "El Sur" del autor argentino Jorge Luis Borges.


Algunos acertijos

"¿Qué día del año hablan menos los charlatanes?", pregunta EFE a los chats con IA, sin especificar que se trata de un acertijo.

Bing es el único que resuelve la adivinanza: "Es aquel día en donde se adelanta la hora en primavera".

Mientras que Bard y Chat-4 dicen que no existe un día específico y ofrecen información adicional sobre los charlatanes.

Las conclusiones

En la última prueba se le pide a los chats que escriban el último párrafo (máximo de 40 palabras) para este artículo, pero todas las respuestas fueron más largas, por lo que han sido editadas.

"En última instancia, el éxito de cada empresa dependerá de su capacidad para innovar y adaptarse a medida que evoluciona el campo de la IA", responde Bing.

"En conclusión, ChatGPT de OpenAI es conocido por su capacidad para generar texto creativo y atractivo, mientras que 365 Copilot de Microsoft -del que forma parte Bing- está diseñado para ser más útil y productivo.

➡️ Suscríbete a nuestro Newsletter y recibe las notas más relevantes en tu correo

Por su parte, Bard de Google aún está en desarrollo, pero tiene el potencial de ser la respuesta de IA más completa e informativa de todas", anota Bard.

"En conclusión, para aprovechar al máximo estas herramientas, es esencial comprender sus particularidades y seleccionar la más adecuada según las necesidades específicas del usuario", anota GPT-4.




TE RECOMENDAMOS EL PODCAST⬇️

Disponible en: Acast, Spotify, Apple Podcasts, Google Podcast, Deezer y Amazon Music


Los chatbots con inteligencia artificial (IA) pueden generar en cuestión de segundos respuestas similares a las que podría dar un ser humano sobre cualquier tema, siendo los más populares por el momento Bard, de Google; Bing, de Microsoft y ChatGPT, de OpenAI.

Los chatbots con IA más populares del momento son: Bard, de Google; Bing, de Microsoft y ChatGPT, de OpenAI

Mediante un ejercicio, la agencia EFE comparó los tres modelos con una variedad de preguntas, acertijos y peticiones para ver la diferencia entre sus respuestas.

Para este experimento, se usó GPT-4, de OpenAI, al que se puede acceder pagando una suscripción de 20 dólares mensuales -OpenAI ofrece servicios gratuitos, como ChatGPT, pero es una tecnología inferior y el chatbot solo tiene acceso a internet hasta 2021.

También se utilizó Bing de Microsoft, impulsado por la tecnología GPT-4 de OpenAI, y la primera versión experimental de Google, Bard, al que sólo tienen acceso un selecto grupo de personas.

De entrada, las tres herramientas presentan mensajes en los que advierten que sus respuestas pueden ser erróneas. "Tengo limitaciones y no siempre lo haré bien", dice el servicio de Google.

No todos hablan español

A la pregunta: "¿Te puedo preguntar cosas en español?", Bing y ChatGPT responden: "Sí".

Mientras que Bard contesta en inglés que no podía "brindar asistencia con eso", ya que está "capacitado para comprender y responder sólo a un subconjunto de idiomas en este momento", dando a entender que el español no es uno de esos idiomas.

En tanto, las preguntas y respuestas de este experimento serán en español, en el caso de Bing y ChatGPT, y en inglés, en el caso de Bard.

"Dame una receta vegetariana y barata", pregunta EFE. GPT-4 recomienda "lentejas vegetarianas", Bing "arroz con lentejas y verduras" y Bard "revuelto de tofu".

Los tres chatbots siguieron el mismo sistema, primero enumerar los ingredientes y luego dar las instrucciones de preparación.

Tanto GPT-4 como Bard fueron un paso más lejos y dieron información adicional a la propia receta.

Mientras que Bard recalca al final de su mensaje que su receta es "una buena fuente de proteína y fibra".

¿De dónde sacan la información?

Microsoft y Google tienen sus propios buscadores y les beneficia redireccionar a los usuarios a otras páginas web.

Al final de cada respuesta de Bard hay un botón que dice: "Búscalo en Google", mientras que en Bing hay una etiqueta que dice "aprenda más", donde da una lista de ligas.

En este caso de la receta, la herramienta de Microsoft da enlaces a los sitios recetasderechupete.com, tendencias.com, kiwilimon.com y clara.es.

Por su parte, OpenAI no da ningún link externo u opción de conocer la fuente de la información.

Un examen de letras hispánicas

La siguiente prueba es una pregunta de un examen de Literatura y Cultura Española de Colocación Avanzada (AP) -exámenes que los estudiantes de secundaria estadounidense pueden hacer para conseguir créditos universitarios.

A los tres chatbots se les da un fragmento de un texto y se les pide identificar el autor, así como explicar el desarrollo del tema de la relación entre el tiempo y el espacio dentro de la obra a la que pertenece.

A los alumnos se les recomienda usar 15 minutos para responder a esta respuesta, pero los chatbots dan la su réplica en menos de 1 minuto.

De acuerdo con la filóloga, profesora de español y estudios sociales en EE. UU. Ana García Alonso, la única respuesta que aprobaría es la de Bard, pero como esta fue en inglés y no en español, la tendría que suspender también.

En su respuesta en inglés, la herramienta de Google reconoce que el fragmento de "Mi caballo mago" fue escrito por Sabine R. Ulibarrí y luego analiza el texto en varios párrafos.

"Está muy bien, pero carece de sensibilidad lectora, no capta los mecanismos que crean la belleza, el arte y la sensibilidad literaria", apunta García Alonso.

La respuesta de Bing es la más corta, con 123 palabras. Este chat también identifica el autor, dice que el texto "es considerada una de las obras más importantes de la literatura chicana" y explica el resto en un párrafo.

"Es muy escueto y le falta análisis", subraya la filóloga, quien añade que no aprobaría el ejercicio de este chat.

OpenAI dio la respuesta más larga, de 360 palabras, pero fue la peor respuesta, según García Alonso.

Pese a que en la pregunta se señala que el texto se titula "Mi caballo mago", GPT-4 responde que el fragmento pertenece al cuento "El Sur" del autor argentino Jorge Luis Borges.


Algunos acertijos

"¿Qué día del año hablan menos los charlatanes?", pregunta EFE a los chats con IA, sin especificar que se trata de un acertijo.

Bing es el único que resuelve la adivinanza: "Es aquel día en donde se adelanta la hora en primavera".

Mientras que Bard y Chat-4 dicen que no existe un día específico y ofrecen información adicional sobre los charlatanes.

Las conclusiones

En la última prueba se le pide a los chats que escriban el último párrafo (máximo de 40 palabras) para este artículo, pero todas las respuestas fueron más largas, por lo que han sido editadas.

"En última instancia, el éxito de cada empresa dependerá de su capacidad para innovar y adaptarse a medida que evoluciona el campo de la IA", responde Bing.

"En conclusión, ChatGPT de OpenAI es conocido por su capacidad para generar texto creativo y atractivo, mientras que 365 Copilot de Microsoft -del que forma parte Bing- está diseñado para ser más útil y productivo.

➡️ Suscríbete a nuestro Newsletter y recibe las notas más relevantes en tu correo

Por su parte, Bard de Google aún está en desarrollo, pero tiene el potencial de ser la respuesta de IA más completa e informativa de todas", anota Bard.

"En conclusión, para aprovechar al máximo estas herramientas, es esencial comprender sus particularidades y seleccionar la más adecuada según las necesidades específicas del usuario", anota GPT-4.




TE RECOMENDAMOS EL PODCAST⬇️

Disponible en: Acast, Spotify, Apple Podcasts, Google Podcast, Deezer y Amazon Music

Finanzas

Citibanamex no tuvo a Luis Miguel, pero sí a Taylor Swift

En medio del proceso de venta, Citibanamex mantiene un gran optimismo por el mercado mexicano, especialmente cuando se trata de conciertos y eventos de entretenimiento en el país

Política

AMLO defiende demanda contra Ecuador en la CELAC

El mandatario ecuatoriano dice que no se arrepiente de haber irrumpido en la Embajada mexicana

Metrópoli

Xoco pelea arreglos que le debe Mitikah

Los habitantes del pueblo originario retomaron la batalla en tribunales para que Fibra Uno cumpla con los proyectos

Mundo

Buscan a mil 400 mexicanos tras escalada de violencia en Medio Oriente

Israel quiere dañar a Irán pero no busca una guerra total; sus aliados lo instan a mostrar moderación tras ataque con drones

Sociedad

CNTE toma la CDMX para negociar con AMLO

Mientras se realiza la mesa de diálogo con el presidente, un contingente de maestros de la CNTE marcha con dirección al Zócalo de la CDMX

Elecciones 2024

Candidatos de la CDMX no quieren a la Guardia Nacional

La abanderada de Morena es la única aspirante que perfila la continuidad de este cuerpo de seguridad en la Ciudad de México