Construction, IT, Science, Economy etc

반도체 업계가 술렁이는 구글의 '터보 퀀트' Google’s TurboQuant AI-compression algorithm can reduce LLM memory usage by 6x

Google’s TurboQuant AI-compression algorithm can reduce LLM memory usage by 6x

구글이 공개한 ‘터보퀀트(Turbo Quant)’ 논문. 터보퀀트는 ‘벡터 검색 엔진’에서 발생하는 메모리 병목 현상을 해결하여 AI의 효율성을 극대화하는 데이터 압축 알고리즘이다./구글 리서치 블로그 캡처


Even if you don’t know much about the inner workings of generative AI models, you probably know they need a lot of memory. Hence, it is currently almost impossible to buy a measly stick of RAM without getting fleeced. Google Research recently revealed TurboQuant, a compression algorithm that reduces the memory footprint of large language models (LLMs) while also boosting speed and maintaining accuracy.

https://arstechnica.com/ai/2026/03/google-says-new-turboquant-compression-can-lower-ai-memory-usage-without-sacrificing-quality

메모리 6분의 1로 줄이는 논문 나와... 업계 술렁

구글이 메모리 반도체 사용을 획기적으로 줄이는 ‘터보 퀀트(Turbo Quant)’ 기술을 발표하면서 메모리 반도체 기업 주가가 급락했다. 구글이 내놓은 논문은 메모리 병목을 해결해 AI(인공지능) 효율성을 극대화하는 알고리즘이다. AI 붐으로 메모리 반도체 수요가 폭증하는 가운데 이 같은 기술이 확산할 경우, 같은 AI 성능을 구현하는 데 필요한 메모리 용량이 줄어들 수 있다는 분석이 나온다.

구글 리서치가 25일(현지 시각) 내놓은 터보 퀀트는 대규모 언어 모델(LLM)과 비슷한 데이터를 찾아주는 ‘벡터 검색 엔진’에서 발생하는 메모리 병목 현상을 해결해 AI의 효율성을 극대화하는 데이터 압축 알고리즘이다. 챗GPT나 제미나이 같은 대규모 언어 모델은 대화가 길어질수록 예전 내용을 기억하기 위해 메모리를 많이 잡아먹는다. 기억 장치가 꽉 차면 AI가 느려지거나 먹통이 되기 때문에 막대한 양의 메모리 반도체 확보가 필수다. 터보 퀀트는 기억 데이터의 정확도는 그대로 유지하면서 크기만 6분의 1로 줄이는 압축 기술이다. 이전에는 100페이지 분량의 책 내용을 통째로 기억해야 했지만 터보 퀀트 기술은 의미는 모두 살리면서 요약본으로 압축해서 저장하는 것이다.


TurboQuant는 최적화된 JAX 기준선 대비 다양한 비트 폭 수준에서 키-값 캐시 내 어텐션 로짓 계산 성능이 크게 향상됨을 보여줍니다. (출처: Google)


퀀트 터보 기술을 잘 활용하면 단순 계산으로 현재 필요한 메모리 수요가 6분의 1 수준으로 떨어진다고 볼 수 있다. 지금보다 적은 양의 메모리로도 복잡한 AI 연산을 할 수 있기 때문이다. 이런 탓에 26일 국내 증시에서 메모리 반도체 기업 주가는 급락했다. 삼성전자는 4.7% 하락했고, SK하이닉스는 6.2% 급락 마감했다. 미국의 마이크론도 전날 3% 넘게 하락했다.

다만 반론도 나온다. 메모리 병목 현상이 해결되면 더 많은 데이터를 처리할 수 있게 돼 메모리 수요가 감소하기보다는 오히려 증가할 수 있다는 분석이다. 한지영 키움증권 연구원은 “AI 모델의 효율성과 성능이 향상될수록 역설적으로 AI 총수요가 증가하는 현상이 나타날 가능성도 생각해볼 수 있다”고 했다. 현재 터보 퀀트 기술은 논문 수준이고 실제 상용화까지 시간이 걸리는 데도 국내외 반도체 주가가 급락한 것은 올 들어 주가 급등에 따른 차익실현 명분으로 작용했다는 분석도 나온다.

실리콘밸리=강다은 특파원

https://www.chosun.com/economy/tech_it/2026/03/26/JHCQKRRSOBHXBHAXZCLUCJDMKE

댓글 없음: