China supera a GPT-4 Turbo con su IA y lidera en modelos open-source

Portada » Tecnología » Inteligencia artificial » China supera a GPT-4 Turbo con su IA y lidera en modelos open-source

Publicado el 07/18/2024
a las 05:40
por Aythami Sosa

El lanzamiento de ChatGPT marcó una gran disrupción en la industria tecnológica. Hoy en día, es raro encontrar productos o servicios en muchas empresas del sector que no incluyan tecnologías de inteligencia artificial generativa. Estos logros han permitido que Estados Unidos lidere la innovación en este campo.

A pesar de este duro golpe, el dominio estadounidense ha motivado a China a lograr grandes avances en este sector. Prueba de ello es su superordenador completamente fabricado con componentes chinos para entrenar sus modelos de lenguaje, su dominio en el número de patentes y documentos científicos publicados sobre la materia, y su creciente notoriedad en el lanzamiento de modelos de lenguaje open-source.

China avanza rápidamente en IA, destacando por sus potentes modelos de lenguaje de código abierto

Hace un tiempo se discutía sobre las alternativas que China tenía frente a ChatGPT. Aunque estas alternativas no alcanzaban el nivel de la herramienta de OpenAI, con el tiempo han evolucionado notablemente. Uno de los grandes conglomerados que ha invertido significativamente en este campo es Alibaba.

Actualmente, Qwen2 es uno de los modelos más destacados del país, situándose muy cerca de las últimas propuestas de OpenAI y Anthropic. Concretamente, su versión de 72.000 millones de parámetros y modelo open-source se ha posicionado ligeramente por detrás de GPT-4 y Claude 3.5 Sonnet, los modelos de lenguaje más avanzados de las empresas estadounidenses.

El ranking, realizado por SuperClue, una plataforma de benchmarking que evalúa modelos de lenguaje basándose en métricas como calculación, razonamiento lógico, código, y comprensión de texto, coloca a Qwen2 en una posición privilegiada. Además del modelo de Alibaba, también se destacan las propuestas de la startup Deepseek, SenseTime, Oppo, y una colaboración entre la Universidad de Tsinghua y la startup Zhipu AI. Todos estos modelos han superado a GPT-4 Turbo según las pruebas de SuperClue, que aunque no es el modelo más reciente de OpenAI, sigue siendo uno de los más potentes.

Todo indica que el desempeño de los modelos de lenguaje chinos está alcanzando a las propuestas más destacadas de OpenAI o Anthropic. Los esfuerzos están dando sus frutos y en pocos meses, China ha logrado grandes avances en este sector.

Los modelos de Qwen son especialmente valorados dentro de la comunidad open-source. Según Clement Delangue, CEO y cofundador de la plataforma Hugging Face, «Qwen 72B domina entre los modelos abiertos chinos«. En el top 10 de modelos de lenguaje de Hugging Face, tres modelos de Qwen figuran en esta lista.

Pumped to announce the brand new open LLM leaderboard. We burned 300 H100 to re-run new evaluations like MMLU-pro for all major open LLMs!

Some learning:
– Qwen 72B is the king and Chinese open models are dominating overall
– Previous evaluations have become too easy for recent…
— clem 🤗 (@ClementDelangue) June 26, 2024

Es importante destacar que Hugging Face es el hogar de los modelos de lenguaje abiertos, por lo que la plataforma no prueba modelos cerrados como los de OpenAI o Google. Otro test realizado por LMSYS, una organización de investigación de modelos de IA apoyada por la Universidad de California, Berkeley, sitúa a Qwen2-72B en la posición número 20.

Por el momento, los modelos cerrados estadounidenses siguen dominando en cuanto a rendimiento. Sin embargo, la presencia de China en este sector es cada vez más fuerte, y no es la primera vez que el país demuestra un rápido crecimiento en este y muchos otros sectores.

Sobre el autor:

Aythami Sosa

80% dedicado a mi pasión, el marketing digital y el 20% a investigar el mundo digital y de todo lo que tiene que ver con la innovación, la ciencia, la tecnología y la cultura digital. Siempre curioso por últimas novedades y estar al tanto de las últimas tendencias digitales.