Apple은 다음 달 WWDC(Worldwide Developers Conference)를 통해 자사의 온디바이스 AI 기능을 경쟁 우위로 강조할 계획이며, 15년간의 맞춤형 실리콘 전문 지식을 바탕으로 클라우드가 아닌 로컬에서 AI 모델을 실행하는 사례를 만들 계획이라고 합니다.
The Information과의 인터뷰에서 Apple의 계획에 정통한 사람들은 Apple이 iPhone, Apple Watch 및 Mac용으로 설계된 칩이 장치에서 직접 AI 쿼리를 처리하는 데 어떻게 이점을 제공하는지 보여줄 것으로 예상된다고 말합니다. 복잡한 쿼리에는 클라우드 기반 처리가 여전히 필요하지만 Apple은 로컬 추론을 경쟁사가 추구하는 대규모 데이터 센터 구축에 대한 개인 정보 보호 및 비용 절감 대안으로 자리매김할 것입니다.
Google과의 계약의 일환으로 Apple은 Google Gemini 모델의 대형 버전을 사용하여 Apple 하드웨어에서 로컬로 실행할 수 있는 더 작은 증류 버전을 훈련할 예정인 것으로 보입니다. Apple은 또한 모델 축소 작업을 발전시키기 위해 인수를 모색하고 있다고 합니다. 한 회사는 장치에서 AI를 로컬로 실행하는 데 중점을 둔 매사추세츠 스타트업인 Liquid AI를 고려한 것으로 알려졌습니다.
일부 쿼리에는 여전히 클라우드 처리가 필요합니다. Apple은 더 큰 Gemini 기반 모델의 처리를 처리하기 위해 Google Cloud 내에서 Nvidia의 기밀 컴퓨팅 기술을 사용하는 것을 승인한 것으로 보입니다. 보안 기능은 처리 중에 데이터와 AI 모델을 암호화하여 적당한 성능 비용을 추가하지만 더 강력한 개인 정보 보호 기능을 제공합니다.
이 합의는 Apple이 모든 클라우드 기반 쿼리가 Apple 실리콘에서 실행되는 자체 프라이빗 클라우드 컴퓨팅 인프라에 의해 독점적으로 처리될 것이라고 밝혔던 Apple의 원래 Apple Intelligence 발표에서 눈에 띄게 벗어났습니다. Apple은 변경에도 불구하고 Private Cloud Compute 브랜드를 유지할 가능성이 높다고 파트너십에 정통한 사람들이 The Information에 말했습니다.
또한 Apple이 온디바이스 처리를 어디까지 추진할 수 있는지에 대한 실질적인 한계가 있다고 합니다. Google의 전체 Gemini 모델은 수조 개의 매개변수를 사용하며, The Information은 Apple이 Mac 컴퓨터에 있는 것과 동일한 Apple 실리콘 칩을 사용하는 자체 프라이빗 클라우드 컴퓨팅 인프라에서 이를 실행하는 데 어려움을 겪고 있다고 주장합니다.
Apple Intelligence는 WWDC 2024에서 처음 발표되었지만 초기 기능에 대한 미지근한 반응과 보다 개인화된 Siri 버전에 대한 오랜 지연으로 인해 출시가 방해를 받았습니다. Apple은 이제 6월 8일부터 진행되는 WWDC 2026을 통해 내러티브를 재구성하고 지연된 기능을 다시 도입하며 새로운 기능을 선보일 것으로 예상됩니다.
