
Durante el evento Computex, Intel dejó claro que, si bien no está al frente en el segmento de aceleradores de inteligencia artificial, está dispuesto a competir en otro frente: el precio. Su nueva línea de tarjetas gráficas para estaciones de trabajo, especialmente la Arc Pro B60, no pretende desbancar a las poderosas GPU de Nvidia, pero sí ofrecer una alternativa viable y económica para tareas de inferencia en inteligencia artificial.
Aunque la Arc B50, con un precio base de 299 dólares, está dirigida a cargas gráficas tradicionales, es la B60 la que acapara la atención cuando se habla de inteligencia artificial. Esta tarjeta, más potente y con un mayor consumo energético, se perfila como una opción híbrida para trabajos gráficos e inferencia de IA. Si bien Intel aún no ha fijado un precio oficial, Vivian Lien, vicepresidenta y gerente general de gráficos para clientes, estima que cada unidad podría representar aproximadamente 500 dólares del costo total de un PC.
Comparada con las GPU profesionales RTX 4000 y 4500 de Nvidia, que cuestan entre 1.250 y 2.400 dólares, la B60 se presenta como una opción intermedia en términos de rendimiento. Sin embargo, en el terreno de la inferencia, queda muy por detrás de modelos como la RTX Pro 6000, lanzada en marzo, que ofrecen entre 4,5 y 5 veces más rendimiento en operaciones INT8 y el cuádruple en capacidad y ancho de banda de memoria. Pero también cuestan alrededor de 8.565 dólares cada una, lo que posiciona a la B60 como una alternativa casi 17 veces más barata.
En cifras, la Arc Pro B60 cuenta con 24 GB de memoria, 456 GB/s de ancho de banda, y un rendimiento de 197 TOPS en INT8, todo con un consumo de entre 120W y 200W. En comparación, la RTX Pro 6000 ofrece hasta 1.007 TOPS en INT8, 96 GB de memoria, 1.792 GB/s de ancho de banda y un TDP de hasta 600W.
Escalabilidad y paralelismo como estrategia
La propuesta de Intel no radica en competir tarjeta por tarjeta, sino en escalar a través del paralelismo. Su proyecto “Battlematrix” plantea ensamblar estaciones de trabajo con hasta ocho GPU B60, alcanzando así 1,5 petaOPS en INT8, 192 GB de memoria VRAM y un ancho de banda combinado de 3,6 TB/s. Incluso si el precio final de cada unidad se elevara a 750 dólares, el total seguiría siendo muy inferior al de un sistema similar basado en Nvidia.
Un sistema dual con ocho GPU B60 costaría menos que una estación de trabajo con dos RTX Pro 6000. Eso sí, habría que considerar el consumo energético: un solo equipo con ocho B60 podría alcanzar los 1.800W, lo que roza el límite de un circuito de 15 amperios en Estados Unidos. Por ello, Intel sugiere limitar el TDP a 120W por tarjeta en estos casos.
Aunque las B60 consumen menos energía por unidad que las GPU de Nvidia, su eficiencia energética es menor. Esto se agrava si se considera que las RTX Pro 6000 soportan de manera nativa operaciones con datos de 4 bits, lo que incrementa aún más su rendimiento teórico —hasta 20 veces más rápidas en FP4 si se aprovecha la dispersión de datos (sparsity).
Un enfoque práctico para la inferencia
Sin embargo, en muchos escenarios de inferencia, el cuello de botella no está en la potencia de cálculo, sino en el ancho de banda de la memoria. Esto significa que, aunque Nvidia ofrezca cifras impresionantes en TFLOPS, el impacto práctico puede ser menor para tareas como prellenado de inferencias o respuestas concurrentes.
Además, aunque las B60 no soportan de forma nativa operaciones de 4 bits, son compatibles con modelos cuantizados a esa precisión. Herramientas como Llama.cpp ya aprovechan las GPU de Intel a través de Sycl, mostrando que estos modelos pueden ejecutarse eficientemente, siempre que las activaciones —la parte que más demanda cálculo— se mantengan en mayor precisión.
Por último, Intel destaca que estas GPU no solo sirven para inferencia: también pueden utilizarse para ajustar modelos (fine-tuning), lo cual amplía su utilidad en contextos como laboratorios o entornos multiusuario, donde varios desarrolladores o investigadores comparten recursos dentro de un mismo sistema.