[고든 정의 TECH+] 엔비디아에 도전장 내민 인텔…GPU 시장 왕좌 빼앗을까?
박종익 기자
업데이트 2021 08 21 11:49
입력 2021 08 21 11:48
이번 공개 내용을 보면 과거 실행 유닛(EU)이라고 불린 그래픽 연산 유닛은 이제 벡터 엔진으로 이름이 바뀌었고 벡터 엔진 옆에는 인공지능 관련 연산을 담당하는 매트릭스 엔진(XMX)이 같은 숫자만큼 존재합니다. 그리고 여러 개의 벡터 엔진과 매트릭스 엔진 아래 하드웨어 레이 트레이싱(Ray Tracing)을 담당하는 부분이 있습니다.
그런데 엔비디아의 튜링 GPU 역시 그래픽 연산을 담당하는 쿠다(CUDA) 코어와 인공지능 연산을 담당하는 텐서 코어, 그리고 하드웨어 레이 트레이싱을 지원하는 RT 코어를 지니고 있습니다. 참고로 레이 트레이싱은 광원에서 나온 빛이 여러 사물의 표면에 반사되는 경로를 계산해 현실적인 빛의 효과를 그래픽에 추가하는 기술입니다.
하지만 그렇다고 인텔이 무조건 엔비디아를 따라하기만 한 건 아닙니다. 인텔의 GPU 제조 방식은 엔비디아와 큰 차이가 있습니다. 바로 CPU를 개발하면서 축적한 다이 간 연결 기술인 포베로스(Foveros)와 EMIB(embedded multidie interconnect bridge)를 이용해 서로 다른 공정에서 만든 반도체 칩을 연결해 매우 큰 GPU를 만드는 방식입니다.
많게는 수백억 개의 트랜지스터를 집적한 최신 GPU는 한 번에 실수 없이 제조하기가 쉽지 않습니다. 특히 다이 사이즈가 커질수록 제조가 어려워집니다. A100처럼(TSMC 7nm 공정 사용) GPU 다이 크기가 826㎟이나 되고 트랜지스터 숫자도 542억 개나 되면 그렇지 않아도 비싼 웨이퍼에 수율도 좋지 않아 가격이 꽤 비싸 집니다.
인텔은 이 문제에 대한 해결책으로 여러 개의 작은 반도체 칩을 평면으로 연결하는 고속도로인 EMIB와 수직으로 연결하는 방식인 포베로스 기술을 개발했습니다. 이렇게 하면 반도체 패키징 과정이 매우 복잡해지는 문제가 있지만, 대신 꼭 최신 미세 공정을 적용하지 않아도 되는 부분은 더 저렴한 공정을 사용할 수 있고 한 번에 제조가 매우 어려운 초대형 프로세서도 만들 수 있습니다.
인텔이 공개한 폰테 베키오는 5개의 다른 공정으로 만든 47개의 반도체 조각인 액티브 타일(Active Tile)을 포베로스와 EMIB 기술로 연결해 무려 1000억 개 이상의 트랜지스터를 지닌 초대형 GPU입니다. 현재까지 상용화된 가장 복잡한 프로세서인 엔비디아의 A100보다 두 배의 트랜지스터 집적도를 지니고 있습니다. 연산 능력 역시 FP32 기준으로 45TFLOPS 이상으로 A100의 19.5TFLOPS의 두 배가 넘습니다. 오랜 세월 개발한 포베로스와 EMIB 기술이 이제 빛을 본 셈입니다.
이번 공개에서 마지막으로 주목할 점은 인텔이 TSMC의 최신 미세 공정인 6nm (N6), 5nm (N5) 공정을 사용하기로 한 것입니다. 알케미스트 GPU는 6nm 공정으로 제조되어 미세 공정에서 경쟁자보다 약간 우위에 섰고 폰테 베키오는 인텔 7 공정을 포함한 다양한 미세 공정을 사용하지만, 컴퓨트 타일은 5nm 공정을 사용해 역시 경쟁자보다 앞서고 있습니다. 최소한 미세 공정에서 밀리는 일은 없다는 이야기입니다. GPU 생산은 TSMC에 외주를 맞길 것이라는 점은 이미 알려진 내용이지만, 이번 발표를 보면 인텔이 얼마나 상대방을 이기고 싶어 했는지를 짐작할 수 있습니다.
인텔의 발표 내용을 신뢰한다면 폰테 베키오 GPU가 나오는 순간 엔비디아의 A100은 1위 자리를 내줘야 합니다. 물론 작년에 A100을 내놓은 엔비디아 역시 차세대 GPU를 개발 중이라 순순히 1위 자리를 내주지는 않을 것입니다. GPU 시장 진출을 선언한 인텔이 시작부터 엔비디아를 위협할지 아니면 엔비디아가 다시 1위 자리를 지킬 수 있을지 결과가 주목됩니다.