시작하기 - 아폴로 미션
•
10년안에 인간을 달에 착륙시키겠다는 이념
•
전례가 없는 대담한 목표
•
완전히 다른 3가지의 산업
•
아폴로는 단순히 달에 깃발을 꽂는 것에 그치지 않았다.
•
심오한 사회적, 경제적 유산(Legacy)를 남겼다.
•
우리는 막대한 투자가 이루어지는 시대에 살고 있다.
•
Consequential Industry at a consequential time.
•
AI는 새로운 기술의 지평을 열 것
•
3가지 주요 사항
◦
AI algorithms and neural architectures
◦
Silicon and systems
◦
energy and efficiency
혁신의 속도
•
과거 컴퓨팅의 발전은 2년마다 트랜지스터 밀도가 두배로 증가하는 무어의 법칙을 따라잡는 것에 기반을 두었다.
•
현재 6개월마다 성능이 두배로 증가하는 ai 성능을 맞닥드리고 있다.
•
계속 따라잡아야 한다. 이를 따라잡으려면 엔드투엔드 최적화와 혁신에 집중해야 한다.
•
혁신에 대한 의존도
•
과거 메모리 업계는 시스템 관점에서 10~15%의 성능 향상을 제공하곤 했다.
•
지금 시대에서는 시스템 전체에 걸처 개선의 폭을 넓혀야 한다.
•
HBM
◦
고객은 모든 방면에서의 개선을 요구하고 있다.
규모
•
무엇이 업계를 선도하는 기업을 만드나.
◦
업계와 함께 확장하고 업계가 나아가는 방향으로 가는 능력
•
자본투자 결정
◦
3~4년 전에 미리 결정을 해야한다.
◦
파트너는 이러한 미래 수요를 충족시키ㅣ기 위해 미리 구축하며 동시에 확장해야한다.
◦
현재 혁신의 가파른 곡선을 고려할 때 위험을 감수하지 않고서는 리더십을 유지할 수 없다.
◦
앞으로 다가올 가속화
◦
용량 문제를 해결해야한다.
◦
더 높은 FLOPS와 더 많은 메모리로 개선이 필요하다. (가속기 성능이)
•
고수율 HBM
◦
새로운 역량을 개발하고 맞춤형 HBM을 지원하기 위한 라인 구축하는 것이 중요하다.
◦
수요를 충족하기 위해 AI 컴퓨팅을 더 빠르게 배포한다.
◦
단일 워크로드가 수천 개의 노드에서 실행되고 있따.
→ 즉, 서비스형 AI에서는 결함이 있는 구성요소로인한 지연을 감당할 수 없다.
따라서 서비스 중단 노드는 차세대 모델 학습에 기ㅕ할 수 있는 귀중한 용량을 의미한다.
지속 가능성
•
컴퓨팅과 냉각
•
마소는 2030년까지 탄소 중립을 달성하기 위해 노력 중
◦
부품의 지속 가능성을 높힐 수 있는 방법을 찾아야함 (문제)
◦
제품 구상 단계부터 에너지 및 비용 효율이 높은 제품을 설계하고 성능을 혁신함으로써 실제로 더 나은 성과를 거둘 수 있다.
사이드킥 액체 침수 냉각 시스템
•
기존 데이터 센터 공간에서 Maya ai 가속기와 gpu를 사용할 수 있게 되었다.