Home Tecnología Un sistema de hardware de clasificación en memoria elimina la necesidad de...

Un sistema de hardware de clasificación en memoria elimina la necesidad de comparadores en tareas de clasificación no lineal

60
0

Descripción general de los sistemas de clasificación. Crédito: Nature Electronics (2025). Doi: 10.1038/s41928-025-01405-2

Un equipo de investigación dirigido por el Prof. Yang Yuchao de la Escuela de Ingeniería Electrónica e Informática de la Escuela de Graduados de la Universidad de Pekín, Shenzhen, ha logrado un avance global al desarrollar el primer sistema de hardware de clasificación en memoria adaptado para tareas de clasificación compleja y no lineal.

Publicado en Nature Electronics, el estudiarTitulado “Un sistema de clasificación rápida y reconfigurable basado en memristores”, propone una arquitectura sin comparación, que supera uno de los desafíos más difíciles en el campo del procesamiento en la tecnología de procesamiento en memoria (PIM).

La clasificación es una tarea informática fundamental, pero su naturaleza no lineal dificulta la aceleración del hardware tradicional. Si bien las arquitecturas PIM con sede en Memristor han demostrado ser prometedoras para operaciones lineales, han luchado durante mucho tiempo con la clasificación. El equipo del Prof. Yang abordó esto eliminando la necesidad de comparadores y la introducción de un mecanismo de lectura de dígitos novedoso, junto con un nuevo algoritmo y diseño de hardware que reinventa cómo la clasificación se puede realizar dentro de la memoria.

Este trabajo representa un paso significativo en la evolución de la tecnología PIM, desde operaciones de matriz lineal hasta tareas no lineales de alta complejidad como la clasificación. Al proponer un marco de clasificación escalable y reconfigurable, el equipo proporciona una solución de alto rendimiento y eficiente en energía que satisface las demandas de rendimiento de las aplicaciones modernas de big data y IA.

El estudio presenta un sistema de clasificación sin comparación basado en una matriz de memristores de un transistor-uno (1T1R), utilizando un mecanismo de lectura de dígitos que reemplaza la lógica tradicional de selección de comparación y mejora significativamente la eficiencia computacional. El equipo también desarrolló el algoritmo de omisión del nodo de árbol (TNS), lo que acelera la clasificación reutilizando caminos transversales y reduciendo las operaciones innecesarias.

Para escalar el rendimiento en diversos conjuntos de datos y configuraciones, se introdujeron tres estrategias de TNS de matriz cruzada (CA-TNS). La estrategia de múltiples bancos divide grandes conjuntos de datos en matrices para el procesamiento paralelo; Bit-Slice distribuye anchos de bits para habilitar la clasificación de tuberías; y aprovechan los estados multi-conductancia de los memristores para mejorar el paralelismo intra-célula.

Juntas, estas innovaciones forman un acelerador de clasificación flexible y adaptable capaz de manejar diferentes anchos y complejidades de datos.

La clasificación en memoria es compatible con la computación en memoria basada en la matriz existente, lo que permite el cálculo de IA disperso adaptativo en tiempo real. Crédito: Nature Electronics (2025). Doi: 10.1038/s41928-025-01405-2

Para validar el rendimiento del mundo real, el equipo fabricó un chip de Memristor y lo integró con FPGA y Hardware PCB para construir un sistema de demostración completo y de extremo a extremo. En las pruebas de referencia, se entregó hasta 7.70 × velocidad más rápida, 160.4 × eficiencia energética más alta y 32.46 × mayor eficiencia de área en comparación con los principales sistemas de clasificación basados en ASIC.

El sistema también demostró ser efectivo en aplicaciones prácticas: en la planificación de la ruta de Dijkstra, calculó con éxito las rutas más cortas entre 16 estaciones de metro de Beijing con baja latencia y consumo de energía. En la inferencia de la red neuronal, permitió la escasez sintonizable en tiempo de ejecución integrando TNS con la multiplicación del vector matriz basado en memristor en el modelo PointNet ++, logrando una velocidad 15 × y 67.1 × mejoras de eficiencia energética. Estos resultados destacan la amplia aplicabilidad del sistema en cargas de trabajo convencionales y de IA.

Este trabajo redefine lo que es posible en los sistemas de procesamiento en memoria. Al demostrar un sistema de clasificación flexible, eficiente y escalable, el equipo del Prof. Yang ha abierto la puerta al hardware inteligente de próxima generación capaz de alimentar la IA, el análisis en tiempo real y la computación de borde. Establece las bases para la futura aceleración de cálculo no lineal, empujando los límites de lo que los sistemas basados en memristor pueden lograr.

Más información: Lianfeng Yu et al, un sistema de clasificación en memoria rápido y reconfigurable basado en memristores, Nature Electronics (2025). Dos: 10.1038/s41928-025-01405-2

Proporcionado por la Universidad de Pekín

Cita: un sistema de hardware de clasificación en memoria elimina la necesidad de comparadores en tareas de clasificación no lineal (2025, 16 de julio) Recuperado el 16 de julio de 2025 de https://techxplore.com/news/2025-07-memory-hardware-nonlinear-casks.html

Este documento está sujeto a derechos de autor. Además de cualquier trato justo con el propósito de estudio o investigación privada, no se puede reproducir ninguna parte sin el permiso por escrito. El contenido se proporciona solo para fines de información.

Fuente de noticias