Память с интеллектом: как сортировать данные без лишних движений
Команда профессора Ян Ючао совершила прорыв, создав систему, которая сортирует данные прямо в памяти, без традиционных компараторов.

Исследовательская группа под руководством профессора Ян Ючао из Школы электроники и компьютерной инженерии Пекинского университета (Шэньчжэнь) совершила прорыв, создав первую в мире аппаратную систему для сортировки данных прямо в памяти, специально разработанную для сложных нелинейных задач сортировки. Работа под названием «Быстрая и переконфигурируемая система сортировки в памяти на основе мемристоров» опубликована в журнале Nature Electronics. Вместо традиционных компараторов архитектура использует новый механизм Digit Read, что позволило преодолеть одну из самых сложных проблем в технологии обработки данных в памяти (PIM).
Сортировка — фундаментальная, но сложная вычислительная задача. Ее нелинейный характер затрудняет ускорение на традиционном оборудовании. В то время как мемристорные PIM-архитектуры уже показали потенциал для линейных операций, сортировка долгое время оставалась для них сложным вызовом. Команда профессора Ян предложила решение, которое не требует компараторов и использует инновационный алгоритм и аппаратный дизайн, переосмысливающий сам подход к сортировке в памяти.
Почему это важно
Эта работа — значительный шаг в эволюции PIM-технологий: от линейных матричных операций к нелинейным задачам высокой сложности, таким как сортировка. Предлагаемый масштабируемый и гибкий способ обеспечивает высокую пропускную способность и энергоэффективность, что отвечает требованиям современных приложений для big data и искусственного интеллекта.
Ключевые аспекты исследования:
- Система исключает компараторы и использует массив мемристоров (1T1R) с механизмом Digit Read, что повышает вычислительную эффективность.
- Разработан алгоритм Tree Node Skipping (TNS), который ускоряет сортировку за счет повторного использования путей обхода и сокращения ненужных операций.
- Для масштабирования производительности предложены три стратегии Cross-Array TNS (CA-TNS):
- Multi-Bank — распределение больших наборов данных по массивам для параллельной обработки.
- Bit-Slice — распределение битовых ширин для конвейерной сортировки.
- Multi-Level — использование многоуровневых состояний мемристоров для повышения параллелизма внутри ячеек.
Вместе эти инновации формируют гибкий и адаптируемый аппаратный ускоритель сортировки, способный работать с различными битовыми ширинами и сложностями данных.
Практические демонстрации
Для проверки эффективности системы в реальных условиях команда создала мемристорный чип и интегрировала его с FPGA и PCB, построив полномасштабную демонстрационную систему. В тестах она показала до 7.7× выше скорость, 160.4× лучше энергоэффективность и 32.46× лучше использование площади по сравнению с передовыми ASIC-системами сортировки .
Система также успешно справилась с практическими задачами:
- В алгоритме Дейкстры для поиска кратчайшего пути между 16 станциями пекинского метро она обеспечила низкую задержку и энергопотребление.
- В нейросетевом выводе на модели PointNet++ объединение TNS с мемристорным умножением матриц позволило динамически управлять разреженностью данных и добиться 15× ускорения и 67.1× улучшения энергоэффективности.
Что это значит для будущего
Это исследование расширяет границы возможного для систем обработки в памяти. Гибкая, эффективная и масштабируемая система сортировки открывает дорогу для нового поколения интеллектуальных аппаратных решений, способных питать искусственный интеллект, аналитику реального времени и edge-вычисления. Заложен фундамент для ускорения нелинейных вычислений на мемристорах.
Это исследование может принести пользу в нескольких областях:
- Большие данные и AI — ускорение предобработки данных и обучения моделей за счет эффективной сортировки.
- Edge-устройства — снижение энергопотребления и задержек в IoT и мобильных системах.
- Высокопроизводительные вычисления — оптимизация рабочих нагрузок в базах данных и облачных средах.
- Робототехника и автономные системы — быстрое принятие решений в реальном времени.
Несмотря на впечатляющие результаты, стоит отметить, что исследование пока демонстрируется на относительно небольших масштабах (например, 16 узлов метро). Вопросы долговременной стабильности мемристоров, их массового производства и совместимости с существующими CMOS-техпроцессами требуют дальнейшего изучения. Кроме того, архитектура может столкнуться с проблемами при работе с высокодинамичными данными, где распределение значений часто меняется.
Ранее ученые создали квантовый чип для массового производства.



















