Home Tecnología Los ingenieros crean el primer modelo de IA especializado para el lenguaje...

Los ingenieros crean el primer modelo de IA especializado para el lenguaje de diseño de chips

3
0

De izquierda a derecha: Jiang Hu, editor en jefe de ACM Todaes; Ben Tan, coautor de papel; Siddharth Garg, autor principal de papel; Helen Li, Presidenta General de la Conferencia de Automatización del Diseño. Crédito: NYU Tandon School of Engineering

Los investigadores de la NYU Tandon School of Engineering han creado Verigen, el primer modelo de inteligencia artificial especializado capacitado con éxito para generar el código Verilog, el lenguaje de programación que describe cómo funciona el circuito de un chip.

El investigación Acabo de obtener las transacciones ACM en la automatización del diseño de los sistemas electrónicos 2024 Premio al Mejor Papel, afirmándolo como un avance importante para automatizar la creación de lenguajes de descripción de hardware que tradicionalmente han requerido una experiencia técnica profunda.

“Los modelos de IA de propósito general no son muy buenos para generar el código Verilog, porque hay muy poco código de Verilog en Internet disponible para la capacitación”, dijo el profesor de autor principal del Instituto Siddharth Garg, que se encuentra en el Departamento de Ingeniería Eléctrica e Informática de NYU Tandon (CCS) y se desempeña en la facultad de NYU Wireless y NYU Center for Cybersecurity (CCS). “Estos modelos tienden a funcionar bien en los lenguajes de programación que están bien representados en Github, como C y Python, pero tienden a hacer mucho peor en lenguajes mal representados como Verilog”.

Junto con Garg, un equipo de NYU Tandon Ph.D. Los estudiantes, los investigadores postdoctorales y los miembros de la facultad Ramesh Karri y Brendan Dolan-Gavitt abordaron este desafío creando y distribuyendo el conjunto de datos de capacitación de IA más grande del código Verilog jamás reunido. Buscaron GitHub para reunir aproximadamente 50,000 archivos Verilog de repositorios públicos, y complementaron esto con contenido de 70 libros de texto de Verilog. Este proceso de recopilación de datos requirió un filtrado y desduplicación cuidadosos para crear un corpus de entrenamiento de alta calidad.

Para su modelo más poderoso, los investigadores luego ajustaron el modelo de lenguaje Codegen-16B de código abierto de Salesforce, que contiene 16 mil millones de parámetros y originalmente fue previamente capacitado tanto en lenguaje natural como en código de programación.

Las demandas computacionales fueron sustanciales. La capacitación requirió tres GPU NVIDIA A100 que funcionan en paralelo, con los parámetros del modelo solo que consumían 30 GB de memoria y el proceso de capacitación completo que requiere aproximadamente 250 GB de memoria GPU.

Este modelo ajustado funcionó de manera impresionante en las pruebas, superando a los modelos comerciales de última generación, al tiempo que era un orden de magnitud más pequeño y completamente abierto. En su evaluación, el Coden-16B sintonizado logró una tasa de 41.9% de código funcionalmente correcto versus 35.4% para el modelo comercial-Davinci-002, con una precisión de impulso de ajuste fino de solo 1.09% a 27%, lo que demuestra la ventaja significativa del entrenamiento de dominio específico.

“Hemos demostrado que al ajustar un modelo en esa tarea específica que le importa, puede obtener órdenes de reducción de magnitud en el tamaño del modelo”, señaló Garg, destacando cómo su enfoque mejoró tanto la precisión como la eficiencia. El tamaño más pequeño permite que el modelo se ejecute en computadoras portátiles estándar en lugar de requerir hardware especializado.

El equipo evaluó las capacidades de Verigen en una gama de tareas de diseño de hardware cada vez más complejas, desde componentes digitales básicos hasta máquinas de estado finitas avanzadas. Si bien aún no es perfecto, particularmente en los desafíos más complejos, el verígeno demostró mejoras notables sobre los modelos de propósito general, especialmente en la generación de código sintácticamente correcto.

La importancia de este trabajo ha sido reconocida en el campo, con una investigación posterior por parte de Nvidia en 2025 Reconociendo el verigen como uno de los primeros e importantes puntos de referencia para la generación de Verilog basada en LLM, ayudando a establecer fundamentos para avances rápidos en el diseño de hardware asistido por AI.

La naturaleza de código abierto del proyecto ya ha provocado un interés significativo en el campo. Si bien Verigen fue el primer modelo del equipo presentado en el documento ACM, desde entonces han desarrollado una familia mejorada de modelos llamado “CL Verilog” que funciona aún mejor.

Estos modelos más nuevos se han proporcionado a compañías de hardware, incluidas Qualcomm y NXP para la evaluación de posibles aplicaciones comerciales. El trabajo se basa en esfuerzos anteriores de NYU Tandon, incluido el 2020. Dave (derivado automáticamente Verilog del inglés) Proyecto, avanzando en el campo creando una solución más integral a través del ajuste fino a gran escala de los modelos de idiomas.

Verigen complementa otras iniciativas de diseño de chips asistidas por AI-AI de NYU Tandon destinado a democratizar el hardware: su proyecto de chat de chips creó el primer microchip funcional diseñado a través de conversaciones de lenguaje natural con GPT-4; Chips4All, apoyado por el programa de investigación de investigación de la National Science Foundation (NSF), capacita a diversos estudiantes de posgrado STEM en diseño de chips; y los conceptos básicos, financiados a través del aprendizaje experimental de NSF para la iniciativa de tecnologías emergentes y novedosas, enseña el diseño de chips a los profesionales no del STEM.

Más información: Shailja Thakur et al, Verigen: un modelo de lenguaje grande para la generación de código de Verilog, transacciones ACM en la automatización del diseño de sistemas electrónicos (2024). Doi: 10.1145/3643681

Proporcionado por la Escuela de Ingeniería NYU Tandon

Cita: los ingenieros crean el primer modelo de IA especializado para el lenguaje de diseño de chips (2025, 26 de junio) Consultado el 26 de junio de 2025 de https://techxplore.com/news/2025-06-ai-specialized-chiplanguage.html

Este documento está sujeto a derechos de autor. Además de cualquier trato justo con el propósito de estudio o investigación privada, no se puede reproducir ninguna parte sin el permiso por escrito. El contenido se proporciona solo para fines de información.

Fuente de noticias