[학부] 생성형 AI를 더 작고 효율적으로 구현한다....서울공대 전기정보공학부 이종호 교수 연구팀, 이미지 생성 핵심 기능 통합한 인공지능 반도체 기술 제시

2026.05.07.l 조회수 834

▲ 서울대학교 전기정보공학부 이종호 교수, 구륜한 연구원, 고종현 연구원

서울대학교 공과대학은 전기정보공학부 이종호 교수 연구팀이 강유전체 메모리 기반으로 생성형 AI의 핵심 기능을 하나의 소자 플랫폼에 통합한 세계 최초의 인공지능 반도체 기술을 제시했다고 밝혔다.

이번 기술은 생성형 AI 구현에 필요한 두 핵심 기능, 즉 무작위 샘플링과 안정적인 연산을 하나의 메모리 어레이 안에서 함께 구현한 세계 최초 사례라는 점에서 의미가 크다. 연구팀은 강유전체 메모리의 전압 의존적 특성을 활용해, 무작위 텔레그래프 잡음(RTN)을 이용한 확률적 샘플링과 비휘발성 다중 전도 상태를 이용한 결정론적 연산을 하나의 플랫폼에서 구현했다.

이번 연구성과는 최고 권위의 국제 학술지인 ‘네이처 커뮤니케이션즈(Nature Communications)’에 실렸다.

최근 생성형 AI는 이미지 생성, 영상 합성, 자율 시스템, 개인 맞춤형 콘텐츠 생성 등 다양한 분야로 빠르게 확산되고 있다. 하지만 생성형 AI를 실제 반도체 칩 위에서 직접 구현하는 일은 여전히 쉽지 않다. 기존 인공지능 반도체는 주로 분류나 추론처럼 안정적인 결정론적 연산에 최적화돼 있는 반면, 생성형 모델은 여기에 더해 잠재 공간에서 무작위 샘플을 뽑아내는 확률적 기능까지 함께 요구하기 때문이다.

이 때문에 기존 연구들은 확률 샘플링과 디코딩을 서로 다른 소자나 외부 소프트웨어 모듈에 나눠 맡기는 경우가 많았고, 그 결과 면적 증가, 배선 복잡도, 전력 소모, 지연 시간 증가 등의 한계를 안고 있었다. 특히 두 기능을 하나의 메모리 기반 하드웨어 안에서 함께 구현하면서도, 기존 CMOS 공정과의 호환성과 집적 가능성까지 확보하는 일은 쉽지 않은 과제로 남아 있었다.

이러한 제약을 극복하기 위해 연구팀은 하프늄 산화물 기반 강유전체 메모리의 전압 의존적 특성에 주목했다. 전압이 높은 영역에서는 무작위 텔레그래프 잡음(RTN)이 강하게 나타나 확률적 샘플링 소스로 동작하고, 전압이 낮은 영역에서는 RTN이 억제돼 비휘발성 다중 전도 상태를 활용한 안정적인 벡터-행렬 곱(VMM) 연산이 가능해진다. 이를 통해 하나의 메모리 어레이 안에서 생성형 AI에 필요한 무작위성과 안정성을 함께 구현하는 전략을 제시했다.

이 기술은 생성형 AI 하드웨어에서 따로 분리돼 있던 샘플링과 디코딩 기능을 하나의 강유전체 메모리 기반 플랫폼 안에 통합할 수 있다는 점에서 의미가 크다. 별도의 외부 확률 발생 모듈 없이도 동일한 소자가 서로 다른 동작 영역에서 각기 다른 역할을 수행할 수 있어, 향후 생성형 AI 반도체의 집적도와 전력 효율을 함께 높일 수 있는 가능성을 보여준다.

연구팀은 실제 6인치 웨이퍼 위에 제작한 NOR형 강유전체 메모리 어레이를 이용해 이 개념을 검증했다. 전압과 샘플링 시간을 조절해 잠재 벡터 분포를 최적화한 뒤, 이를 변분 오토인코더(VAE)에 적용해 얼굴 이미지 데이터셋(CelebA)에 대한 생성 실험을 수행했다. 그 결과 다양한 얼굴 속성을 반영한 이미지 생성 가능성을 확인했으며, 회로 수준 검증을 통해 10만회 수준의 반복 동작 이후에도 안정적인 생성 성능을 유지함을 보였다.

이번 연구는 생성형 AI 하드웨어에서 오랫동안 분리돼 있던 두 기능을 하나의 CMOS 호환 강유전체 메모리 기반 소자 플랫폼에서 통합할 수 있음을 보였다는 점에서 의미가 있다. 이는 향후 온칩 생성형 AI 가속기, 뉴로모픽 시스템, 저전력 엣지 AI 반도체 등에서 면적과 전력 효율을 동시에 개선할 수 있는 가능성을 제시한다.

특히 강유전체 메모리는 기존 반도체 공정과의 호환성이 높아 향후 대규모 생성형 AI 하드웨어 시스템으로의 확장 가능성도 기대된다. 앞으로 연구팀은 샘플링 속도, 병렬성, 어레이 규모, 주변회로 최적화 등을 통해 실시간 생성형 AI 하드웨어로의 발전 가능성을 넓혀갈 계획이다.

연구를 이끈 이종호 교수는 “생성형 AI 하드웨어에서는 무작위 샘플링과 결정론적 연산을 동시에 만족시키는 것이 핵심 과제인데, 이번 연구는 강유전체 메모리의 전압 의존적 특성을 활용해 이 두 기능을 하나의 소자 플랫폼에서 구현할 수 있음을 보였다는 점에서 의미가 있다”고 밝혔다.

본 연구의 주저자인 구륜한 연구원과 고종현 연구원은 현재 서울대학교 전기정보공학부 이종호 교수 연구팀에서 메모리 반도체, 하드웨어 인공지능, 저전력 뉴로모픽 시스템 관련 연구를 수행하고 있다.

▲ 그림 1. 제안한 강유전체 메모리 기반 하드웨어 VAE 시스템의 개요.
강유전체 메모리 어레이는 RTN을 이용한 확률적 잠재 변수 샘플링과 VMM 기반 결정론적 디코딩을 함께 수행한다.

▲ 그림 2. 강유전체 메모리의 잡음 제어와 이미지 생성 성능 검증. 메모리 소자의 전압 및 샘플링 시간 조건에 따라 RTN 기반 무작위성이 달라지며,
이를 통해 생성되는 잠재 벡터 분포와 이미지 품질이 변화한다. 연구팀은 최적 조건에서 CelebA 데이터셋에 대해 균형 잡힌 이미지 생성이 가능함을 확인했다.

[참고자료]

논문명/저널 : “CMOS compatible ferroelectric tunnel junctions integrate stochastic sampling and deterministic computing for image generation”, Nature Communications
DOI: 10.1038/s41467-026-72969-6

뉴스

[학부] 생성형 AI를 더 작고 효율적으로 구현한다....서울공대 전기정보공학부 이종호 교수 연구팀, 이미지 생성 핵심 기능 통합한 인공지능 반도체 기술 제시