Créditos
Nathan Gardels es el editor en jefe de la revista Noema.
El debut de Deepseek Chatbot de China reafirma que una de las máximas más antiguas sobre el comportamiento humano se aplica a las últimas tecnologías: la necesidad es la madre de la invención y la innovación.
Tanto los delirios geopolíticos como las burbujas de archivo estallaron la semana pasada cuando quedó claro que el modelo de IA generativo de Deepseek estaba a la par con lo mejor de Occidente. Más impresionante es que aparentemente usó principalmente chips y costos mucho menos avanzadoss Los pocos millones para construir en comparación con los miles de millones de gran tecnología estadounidense están gastando para grandes cantidades de los semiconductores más poderosos prohibidos para la exportación a China. El ingenio de los ingenieros de Deepseek se ha atribuido en gran medida a la necesidad de descubrir cómo trabajar alrededor de las restricciones occidentales.
Esta paradoja de los esfuerzos occidentales para obstaculizar el desarrollo tecnológico de China realmente estimulando que no es nuevo. Como Zheng Yongnian, un
El erudito con sede en Shenzhen escuchó de cerca por el liderazgo chino que escribió en Noema en 2018, las restricciones tecnológicas ya impuestas pueden frenar el ritmo del salto de China hacia adelante, pero “no podrán detener su alcance de alta tecnología. Las enormes reservas de capital del estado de China, su gran grupo de talentos listos y su enorme mercado continuarán impulsándolo “.
Continuó: “De hecho, Estados Unidos puede estar disparando en el pie. Los halcones de comercio estadounidense no logran comprender el registro de la historia contemporánea, lo que demuestra que las prohibiciones tecnológicas impuestas por Occidente son la mayoría de las veces contraproducentes cuando se dirigen a un país capaz.
Por ejemplo, China se vio obligada a ir solo en proyectos como su programa de vuelo espacial tripulado después de ser interrumpido por rigurosas políticas de exclusión impuestas por Occidente. Además, las prohibiciones de tecnología estrictas de Estados Unidos han obligado a China a presentar grandes inversiones nacionales que llevaron a su rendimiento excepcional en la construcción de supercomputadoras que superan las de los Estados Unidos. Y después del Movimiento de la Plaza Tiananmen de 1989, el embargo a gran escala de la tecnología militar impuesta a China por Occidente impulsó y motivó a China a desarrollar sistemas de armamento militar independientes ”.
Al mismo tiempo, los modelos de IA generativos avanzados como DeepSeek, que se aprovechan de los datos de entrenamiento occidentales, representan sus propios peligros dentro de China. ¿Qué hacen las autoridades chinas cuando estos modelos generan algo que no está permitido en un espacio de información bien controlado? ¿Los chatbots cada vez más finos descubrirán cómo eludir los censores?
Open Source vs. Modelos cerrados
Como un modelo de código abierto económico, Deepseek estará ampliamente disponible y accesible para cualquier persona en cualquier parte del mundo para construir. Eso sin duda estimulará nuevas ondas de innovación en todo el planeta que desafiará perennemente el dominio de los modelos cerrados y patentados de gran tecnología que impulsan el desarrollo de IA en la Llama de Meta de los EE. UU. Es la única excepción de código abierto entre estos grandes jugadores con sede en los Estados Unidos. .
Ya sea para bien o para un software de código abierto casado con el ingenio de la inteligencia colectiva, conocerá pocos límites.
Para el ex CEO de Google, Eric Schmidt, es por eso que la llegada de Deepseek es un “punto de inflexión” en la competencia global de IA que debe cambiar la forma en que innova Silicon Valley.
“Estados Unidos ya tiene los mejores modelos cerrados del mundo. Para seguir siendo competitivos, también debemos apoyar el desarrollo de un ecosistema vibrante de código abierto ”, Schmidt escribió con Dhaval Adjodah en el Washington Post. “La carrera entre la IA de código abierto y cerrado, así como entre Estados Unidos y China, aún no tiene un claro ganador. Pero claramente existe una presión creciente sobre los grandes jugadores tecnológicos de Estados Unidos si Deepseek puede competir con ellos utilizando muchos menos recursos.
Es poco probable que las compañías de modelos de fronteras estadounidenses cambien sus modelos de negocio en el corto plazo, ni está claro de inmediato que deberían hacerlo ”, continuaron los autores. “La competencia abierta y cerrada probablemente encontrará un equilibrio natural, con una variedad de ofertas y puntos de precio diferentes para diferentes usuarios”.
La desventaja del código abierto
Cuando Schmidt alude a que no sea una buena idea para que el desarrollo del modelo de IA de la frontera cerrada se abra por completo, se refiere a las desventajas del código abierto.
En una conversación con Noema en mayo pasado, presentó sus preocupaciones.
“Siempre es útil recordar a los tecnodemistas en mi mundo que hay personas malvadas. Y usarán sus herramientas para dañar a las personas. … Toda la tecnología es de doble uso. Todos estos inventos pueden ser mal utilizados, y es importante que los inventores sean honestos al respecto “, advirtió Schmidt, refiriéndose a todo tipo de amenazas desde bioweapons y guerra automatizada hasta desinformación y reconocimiento facial de fake profundo con fines represivos.
“Ya sea para bien o para un software de código abierto casado con el ingenio de la inteligencia colectiva conocerá pocos límites”.
Schmidt continuó: “En los modelos de código abierto y de peso abierto el código fuente y el pesas En los modelos (los números utilizados para determinar la resistencia de diferentes conexiones) se liberan al público. Esos inmediatamente van por todo el mundo, y ¿a quién van? Van a China, por supuesto, van a Rusia, van a Irán. Van a Bielorrusia y Corea del Norte. Cuando estaba más recientemente en China, esencialmente todo el trabajo que vi comenzó con modelos de código abierto desde el oeste y luego se amplificó “.
Este, de hecho, es el caso de Deepseek.
Mientras que Schmidt espera que las principales empresas de IA en Occidente que colocan miles de millones en modelos de IA patentados “eventualmente se regulan estrechamente a medida que avanzan en la escala de capacidad (hacia la inteligencia general artificial)”, se preocupa “el resto no lo hará”.
Cuando se le preguntó sobre la sabiduría de tratar de detener el avance de China al prohibir la exportación de chips, respondió: “Estoy mucho más preocupado por la proliferación de código abierto. Y estoy seguro de que los chinos comparten la misma preocupación sobre cómo se puede usar mal contra su gobierno y el nuestro.
Necesitamos asegurarnos de que los modelos de código abierto sean seguros con barandillas en primer lugar a través de lo que llamamos 'Refuerzo Aprendiendo de la retroalimentación humana'(Rlhf) que está ajustado, por lo que esas barandillas no pueden ser' respaldadas 'por personas malvadas. No tiene que ser fácil hacer que los modelos de código abierto sean inseguros una vez que se hayan hecho seguros “.
Así como la necesidad es la madre de la invención, el carácter de doble uso de la tecnología inteligente también significa que la innovación es la madre de su propia regulación necesaria. Eso debe ser especialmente cuando el razonamiento de la cadena de pensamiento totalmente capaz permite a AIS adquirir su propia agencia.
“Para la mayor parte de la historia”, dijo Mustafa Suleyman de Deepmind, “el desafío de la tecnología radica en la creación y desatado de su poder. Que ahora se ha volteado; El desafío de la tecnología hoy se trata de contener su poder desatado, asegurando que continúe sirviéndonos a nosotros y a nuestro planeta “.