El argumento comercial para ejecutar las cosas en las instalaciones siempre ha comenzado con la regulación.
Alójelo usted mismo, mantenga los datos en su entorno y evite depender de un proveedor. Es un instinto razonable y durante mucho tiempo fue una respuesta razonable.
La brecha entre lo que se podía ejecutar internamente y lo que estaba disponible externamente era manejable. La opción local era una opción defendible.
La IA está cambiando eso.
Arquitecto jefe y director de innovación, Duco.
El caso del “hágalo usted mismo” ignora casi todo lo que viene después: la necesidad de que las personas mantengan todo funcionando a medida que evoluciona el modelo de IA, las tarifas de licencia y los costos de computación a medida que cambia el panorama, los ciclos de actualización que nunca llegan a tiempo y el trabajo requerido para analizar las decisiones tomadas en un panorama tecnológico que parecía completamente diferente hace seis meses.
Ninguno de estos costos está oculto exactamente. Estos son fáciles de pasar por alto cuando se trata de costos de construcción en el caso de negocio inicial.
Puede ejecutar IA en sus instalaciones, no solo la mejor IA
Los modelos Frontier, que acaparan la mayoría de los titulares, no pueden ser autohospedados. Sus proveedores no los ponen a disposición para implementación privada.
Lo que se puede licenciar y ejecutar internamente mejora constantemente, pero también lo hacen las fronteras. Sólo Anthropic ha lanzado más de una docena de modelos revestidos en menos de dos años, y está lejos de ser el único proveedor.
El autohospedaje significa ciclos de lanzamiento más lentos. Las actualizaciones son costosas y disruptivas, por lo que las empresas permanecen en sus versiones más tiempo del debido. Lo mismo ocurre con el hardware a continuación.
Los chips de IA especializados se desgastan rápidamente. Cada dos años llegan nuevas generaciones de GPU, cada una de ellas financieramente mejor que la anterior y cada una de las cuales requiere nueva inversión de capital. Su modelo está atrasado, el silicio con el que se ejecuta está atrasado y la actualización es un gran proyecto.
Modelos, licencias, infraestructura, herramientas, personas: nada de esto sigue un ciclo de actualización predecible. En el entorno actual, “desactualizado” puede significar dentro de unos meses. Cada ronda de inversión se realiza bajo presión, con tiempo limitado para evaluar adecuadamente las opciones.
Fuga de talento
Para crear y ejecutar herramientas de IA en sus instalaciones, necesita ingenieros que en realidad no estén trabajando en lo que diferencia a su negocio. Están siguiendo el ritmo de la IA. Las herramientas de ajuste evolucionan como modelos. Resolución de problemas cuando las cosas se estropean. Gestión de infraestructura. Se están evaluando nuevos modelos a medida que se lanzan.
Cuando se trata de procesamiento y conciliación de datos, estas cosas son necesarias pero no marcan la diferencia. Tienen que funcionar, pero el importante tiempo de ingeniería dedicado a ellos no le dará ninguna ventaja. Este es un mantenimiento costoso de algo que no es de tu incumbencia.
A medida que el entorno interno se expande y la tecnología envejece, aumenta la plantilla necesaria para gestionarla. Se trata de especialistas costosos y la mayor parte de lo que hacen no hace avanzar el negocio.
Por qué la IA pertenece a un mundo nativo de la nube
El argumento a favor de la IA nativa de la nube no tiene que ver realmente con la computación en la nube. Si su arquitectura puede mantenerse al día con una tecnología que avanza más rápido de lo que puede igualar cualquier ciclo de lanzamiento interno.
En un mundo nativo de la nube, las capacidades de los nuevos modelos se presentan como características, no como proyectos. Cuando aparece algo mejor en la frontera, la plataforma lo explota. El consentimiento no reinicia la conversación. La revisión de seguridad no devuelve cero. El equipo de ingeniería no tiene que reconstruir nada. Power aterriza y su equipo de operaciones puede usarlo el mismo día.
El argumento del control que impulsó a las empresas a optar por las instalaciones en las instalaciones sigue siendo importante, pero ya no está en conflicto con las implementaciones nativas de la nube. Permisos, pistas de auditoría, gobernanza, soberanía de datos: todo esto se puede hacer cumplir con el mismo rigor en una plataforma nativa de la nube con una arquitectura adecuada, o incluso más. El comercio ha sido cancelado. El control ya no tiene por qué ser estático.
Las empresas que reconocen esto temprano obtienen una ventaja. Sus ingenieros se centran en lo que marca la diferencia en los negocios. Sus equipos de operaciones obtienen mejores herramientas sin un ciclo de compra cada trimestre. La pregunta “¿Qué estamos observando?” Deja de ser tú quien le pregunta a cualquiera.
¿Qué cambia cuando trabajas con un socio de confianza?
Transferir la carga de construir, mantener, asegurar y probar a un socio experto significa que sus recursos se centran donde deberían estar y sus capacidades evolucionan con el mercado.
Las plataformas construidas sobre infraestructura como AWS Bedrock están diseñadas para absorber nuevas capacidades de modelos a medida que surgen, incluidos modelos de frontera que no pueden autohospedarse en absoluto. La arquitectura subyacente mantiene el ritmo para que las organizaciones no la utilicen.
Cuando hay un modelo mejor disponible, la plataforma se adapta. Sin nuevos proyectos, sin ingenieros adicionales, sin primeros meses de trabajo de integración. Los equipos de operaciones se centran en lo que quieren hacer allí.
Los ingenieros se centran en las cosas que diferencian a la empresa. Y la pregunta “¿Estamos utilizando el modelo correcto?” Deja de tener lugar una discusión trimestral del comité de inversiones y comienza a surgir un escenario para que alguien cambie.
Utilice el mejor almacenamiento en la nube empresarial para administrar sus datos.
Este artículo fue producido en parte Perspectiva profesional de TechRadarNuestro canal para mostrar las mejores y más brillantes mentes de la industria tecnológica actual.
Las opiniones expresadas aquí son las del autor y no necesariamente las de TechRadarPro o Future plc. Si está interesado en contribuir, obtenga más información aquí: