AI Infrastructure Deep Dive 구글 터보퀀트(TurboQuant),AI 메모리의 게임체인저인가 메모리 6배 압축 · 성능 8배 향상 · 정확도 손실 제로반도체 시장 충격파와 투자 시사점까지 KEY TAKEAWAY 구글 리서치가 3월 25일 공개한 터보퀀트(TurboQuant)는 LLM의 KV 캐시를 3비트 수준으로 압축해 메모리 사용량을 최소 6배 절감하면서도 정확도 손실이 전혀 없는 혁신적 알고리즘이다. 추가 학습 없이 즉시 적용 가능하며, NVIDIA H100 GPU 기준 어텐션 연산 성능을 최대 8배 향상시킨다. 클라우드플레어 CEO 매튜 프린스는 이를 "구글의 딥시크 모먼트"라 평가했다. 1. 터보퀀트(TurboQuant)란 무엇인가 ..