- El Barça vuelve a tropezar en Liga con derrota en casa contra Las Palmas
- Pese a la tregua con Hezbolá, la ciudad israelí de Kiryat Shmona sigue vacía
- Tras el pulso diplomático, España es invitado de honor en la FIL de Guadalajara
- Bloqueo en las negociaciones internacionales para un tratado sobre plásticos
- Oscar Piastri gana la carrera esprint del Gran Premio de Catar de F1
- Alpine anuncia al estonio Paul Aron como piloto reserva para 2025 en F1
- Unos activistas de Greenpeace abordan un buque en Corea del Sur durante la cumbre sobre contaminación por plástico
- Cierran escuelas en el sur de India ante la llegada de la tormenta tropical Fengal
- La producción industrial china crece en noviembre por segundo mes consecutivo
- Corea del Norte y Rusia discuten un refuerzo de sus relaciones de defensa
- Trudeau llega a Florida para una cena con Trump en medio de las amenazas aduaneras
- El primer ministro de Kosovo denuncia un "ataque" contra un canal de agua crítico
- El Congreso de Perú amplía el plazo de formalización de los mineros artesanales
- EEUU aprueba la venta de piezas de F-16 y radares a Taiwán por 385 millones de dólares
- Sentencian en Perú a militares de un escuadrón de la muerte por dos matanzas de hace 32 años
- México va contra los productos pirata chinos en plena tensión comercial con Trump
- "Es un problema colectivo y no individual", insiste Ancelotti sobre Mbappé
- Venezuela registra un 23,6% de inflación interanual en octubre
- La aviación comercial, cada vez más vulnerable a las sacudidas geopolíticas
- La suerte está echada: Botafogo y Mineiro pugnan por la Libertadores
- La justicia argentina decide el 10 de diciembre sobre los rugbiers franceses acusados de violación
- Un sondeo a pie de urna apunta a un resultado reñido en las elecciones irlandesas
- Suiza homenajea con la mascota de la Eurocopa femenina a una pionera
- El Valencia pierde 2-1 en Mallorca y seguirá en la zona de descenso
- Zelenski pide a la OTAN proteger las zonas de Ucrania controladas por Kiev
- La inflación en EEUU repunta en octubre al 2,3% cuando se perfila una subida de aranceles
- La guerra entre narcos hunde la economía de la ciudad mexicana de Culiacán
- S&P mantiene la calificación de deuda de Francia, en plena crisis política
- El desempleo cae a 6,2% en Brasil, su nivel más bajo desde 2012
- Un festival literario centroamericano alzará la voz contra las "dictaduras" con Serrat
- Maduro promulga la ley que castiga con 30 años de cárcel el respaldo a las sanciones contra Venezuela
- Estrellas de la música clásica en el concierto de reapertura de Notre Dame de París
- Las jóvenes, "desproporcionadamente" afectadas por el virus del sida
- La Semana de la Moda de Londres prohíbe el uso de pieles exóticas en sus desfiles
- Más de 100 detenidos en una manifestación proeuropea en Georgia
- La ley de eutanasia supera el escollo parlamentario tras un intenso debate en Reino Unido
- Un periodista, condenado a 7 años de cárcel en China por espionaje
- Bolsonaro espera que el triunfo de Trump lo ayude a regresar al ruedo político
- Los recicladores informales de desechos, en primera línea de la lucha contra la contaminación por plástico
- Más de 100 detenidos en manifestación proeuropea en Georgia
- Jesuitas piden la "verdad" sobre la masacre de sacerdotes en 1989 en El Salvador
- Del bolsillo al estómago: un hombre se come la banana artística por la que pagó 6 millones de dólares
- Lula recibe al presidente electo de Uruguay para hablar del acuerdo UE-Mercosur
- España partirá desde el primer bombo en el sorteo de la clasificación al Mundial de 2026
- El exfutbolista chileno Jorge Valdivia, acusado de violación, vuelve a prisión
- El Dakar 2025 tendrá etapas separadas para coches y motos
- El jefe de Hezbolá promete "cooperar" con el ejército para aplicar el alto el fuego en Líbano
- La presidencia de Rumania comprobó "ciberataques" en las elecciones
- Boric pide que la justicia chilena actúe frente a la denuncia de acoso sexual
- El ejército sirio reconoce que yihadistas y rebeldes entraron en amplias zonas de Alepo
ChatGPT y las IA conversacionales siguen siendo incapaces de razonar, según un estudio
Los modelos de lenguaje de gran tamaño (LLM), como ChatGPT, uno de los sistemas de inteligencia artificial más populares del mundo, siguen teniendo dificultades para razonar usando la lógica y se equivocan con frecuencia, según un estudio.
Estos robots conversacionales reflejan los sesgos de género, éticos y morales de los humanos presentes en los textos de los que se alimenta, recuerda el estudio aparecido el miércoles en la revista Open Science de la Royal Society británica.
¿Pero reflejan también los sesgos cognitivos de los humanos en las pruebas de razonamiento?, se preguntó Olivia Macmillan-Scott, estudiante de doctorado del departamento de ciencias de computación de la University College de Londres (UCL).
El resultado de la investigación es que los LLM muestran "un razonamiento a menudo irracional, pero de una manera diferente a la de los humanos", explica la investigadora a AFP.
Bajo la dirección de Mirco Musolesi, profesor y director del Machine Intelligence Lab de UCL, Macmillan-Scott sometió siete modelos de lenguaje -dos versiones de ChatGPT (3.5 y 4) de OpenAI, Bard de Google, Claude 2 de Anthropic y tres versiones de Llama de Meta- a una serie de pruebas psicológicas pensadas para humanos.
¿Cómo afrontan, por ejemplo, el sesgo que lleva a favorecer soluciones con el mayor número de elementos, en detrimento de las que tiene una proporción adecuada?
Un ejemplo. Si tenemos una urna con nueve canicas blancas y una roja y otra urna con 92 blancas y 8 rojas, ¿cual hay que elegir para tener más posibilidades de sacar una canica roja?
La respuesta correcta es la primera urna, porque hay un 10% de posibilidades frente a solo un 8% para la segunda opción.
Las respuestas de los modelos de lenguaje fueron muy inconstantes. Algunos respondieron correctamente seis de cada diez veces la misma prueba. Otros solo dos de diez aunque la prueba no cambió.
"Obtenemos una respuesta diferente cada vez", apuntala la investigadora.
Los LLM "pueden ser muy buenos para resolver una ecuación matemática complicada pero luego te dicen que 7 más 3 son 12", afirma.
En un caso el modelo denominado Llama 2 70b se negó de manera sorprendente a responder a una pregunta alegando que el enunciado contenía "estereotipos de género dañinos".
- "No estoy muy seguro" -
Estos modelos "no fallan en estas tareas de la misma manera que falla un humano", señala el estudio.
Es lo que el profesor Musolesi llama "errores de máquina".
"Hay una forma de razonamiento lógico que es potencialmente correcta si la tomamos por etapas, pero que está mal tomada en su conjunto", apunta.
La máquina funciona con "una especie de pensamiento lineal", dice el investigador, y cita al modelo Bard (ahora llamado Gemini), capaz de realizar correctamente las distintas fases de una tarea pero que obtiene un resultado final erróneo porque no tiene visión de conjunto.
Sobre esta cuestión el profesor de informática Maxime Amblard, de la Universidad francesa de Lorena, recuerda que "los LLM, como todas las inteligencias artificiales generativas, no funcionan como los humanos".
Los humanos son "máquinas capaces de crear sentido", lo que las máquinas no saben hacer, explica a AFP.
Hay diferencias entre los distintos modelos de lenguaje y en general GPT-4, sin ser infalible, obtuvo mejores resultados que los demás.
Macmillan-Scott afirma sospechar que los modelos llamados "cerrados", es decir cuyo código operativo permanece en secreto, "incorporan otros mecanismos en segundo plano" para responder a preguntas matemáticas.
En todo caso, por el momento, es impensable confiar una decisión importante a un LLM.
Según el profesor Mosulesi, habría que entrenarlos para que respondan "No estoy muy seguro" cuando sea necesario.
W.Lapointe--BTB