Stability AI: Now Doubling Down on Language Models

Stability AI, una empresa conocida por comercializar Stable Diffusion, está tomando medidas estratégicas para priorizar los modelos de lenguaje con el objetivo de mejorar su situación financiera. La compañía ha presentado recientemente su primer modelo en la serie ‘Stable LM 2’, llamado ‘Stable LM 2 1.6B’, que es un potente modelo de lenguaje a pesar de su tamaño compacto de 1.6 mil millones de parámetros.

Desarrollar Stable LM 2 1.6B implicó entrenarlo con una gran cantidad de datos, que constan de dos billones de tokens, durante dos ciclos de entrenamiento. Este modelo multilingüe fue entrenado con datos de siete idiomas, incluyendo inglés, español y francés.

Uno de los principales objetivos al crear Stable LM 2 1.6B es reducir las barreras para los desarrolladores. Stability AI tiene como objetivo permitir que más desarrolladores participen en el ecosistema de IA generativa brindándoles acceso a este potente modelo de lenguaje. De hecho, este modelo ha superado a otros modelos con menos de 2 mil millones de parámetros, superando a sistemas conocidos como Phi-1.5 de Microsoft, TinyLlama 1.1B y Falcon 1B en diversas tareas.

Con el lanzamiento de Stable LM 2 1.6B, Stability AI se esfuerza por capacitar a los desarrolladores y creadores de modelos al ofrecerles total transparencia en los detalles del entrenamiento. La compañía no solo ha presentado el modelo base, sino también una versión afinada mediante instrucciones. Ha puesto a disposición los detalles de los datos y el punto de control final del preentrenamiento para facilitar a los desarrolladores la continuación fluida de los procesos de preentrenamiento y ajuste fino.

En los últimos meses, Stability AI ha ido desplazando gradualmente su enfoque hacia los modelos de lenguaje. Este cambio de dirección puede atribuirse a la presión creciente que enfrenta la empresa por parte de los inversores debido a dificultades financieras. Incluso se ha sugerido que Stability AI está considerando una venta, con posibles compradores como Cohere y Jasper expresando su interés. A pesar de que la empresa continúa invirtiendo fuertemente en costos informáticos y salarios, sus ingresos siguen siendo relativamente bajos. Sin embargo, Stability AI está decidida a priorizar la investigación y el desarrollo.

Enfatizar en los sistemas basados en el lenguaje se alinea bien con las capacidades existentes de Stability AI en generación de imágenes y videos. Este cambio estratégico también posiciona a la empresa como competidora de proveedores de modelos basados en texto.

El acceso a Stable LM 2 1.6B está disponible tanto para fines comerciales como no comerciales, aunque con ciertas restricciones. El uso no comercial requiere una membresía gratuita de Stability AI, mientras que se ofrece un nivel profesional para creadores y desarrolladores que cumplan con criterios específicos. Se requieren negociaciones con Stability AI para acceder a nivel empresarial.

Si bien Stable LM 2 1.6B ofrece capacidades significativas, es importante tener en cuenta que aún puede tener ciertas limitaciones, como la posibilidad de generar lenguaje tóxico. Stability AI insta a la comunidad a utilizar el modelo de manera responsable y tomar las medidas adecuadas para garantizar prácticas de desarrollo éticas.

Estos desarrollos recientes por parte de Stability AI demuestran la determinación de la empresa de aprovechar los modelos de lenguaje para su crecimiento y éxito futuro en la industria de la IA.

Preguntas frecuentes