하드웨어 뉴스

 

분류 하드웨어 뉴스 | CPU

CPU 코어 및 캐시가 게임 성능에 미치는 영향

작성자 정보

  • 작성자 AMD
  • 작성일

컨텐츠 정보

본문

게임을 하려면 X의 코어가 필요하다는 누군가의 말을 들은 적이 있을 것입니다. 콘솔에 8개의 코어가 있기 때문에 PC 게이머들이 앞으로 나아가야 한다는 잘못된 인식으로 인해 "6은 충분한 코어 이상" 또는 "게임에 최소 8개의 코어가 필요합니다"가 대표적인 예입니다.


이전에도 이러한 "코어" 오해에 대처하면서 CPU의 코어 수가 아니라 전체 CPU 성능이 중요하다는 점을 설명했습니다. 이해하기 쉬운 개념이지만, 엄청난 양의 반발이 있습니다.


또한 시스템 요구 사항을 코어 수로 낮추는 것이 더 쉽습니다. 광범위한 CPU를 해제하는 빠른 방법이기 때문입니다. 예를 들어, 게임은 더 이상 듀얼 코어 CPU에서 제대로 실행되지 않거나 전혀 실행되지 않으므로 게임을 하려면 최소한 쿼드 코어가 필요합니다. 그렇긴 하지만 대부분의 현대적이고 까다로운 게임은 SMT(동시 멀티 스레딩)를 지원하더라도 쿼드 코어에서 제대로 실행되지 않습니다.


퀘이사존


내 주장과 완전히 반대되는 것처럼 들리지만 다시 한번 말하지만 전반적인 CPU 성능에 대한 최우선 사항입니다.


예를 들어 Core i5-11600K 또는 Ryzen 5 5600X와 같은 최신 6코어/12스레드 프로세서의 성능에 필적할 수 있는 단일 쿼드 코어 CPU는 없습니다. 반대로 Core i5-11600K 및 Ryzen 5 5600X의 게임 또는 전체 CPU 성능에 필적할 수 없는 8코어 이상의 CPU가 수십 개 있습니다.


퀘이사존


8코어/16스레드 Ryzen 7 2700X만큼 최신 CPU도 게임에서는 물론 앞으로도 성능이 떨어질 것입니다. CineBench와 같은 생산성 벤치마크에서 모든 코어를 사용하는 경우 5600X가 2700X보다 10% 이상 빠르므로 5600X의 훨씬 우수한 코어 및 메모리 대기 시간과 결합할 수 있으며 게임용으로 더 빠른 6코어 CPU를 사용할 수 있습니다.


"게임에는 8개의 코어가 필요합니다"라는 주장을 무시하는 것은 지나치게 단순화하여 PC 빌더를 오도하여 실제로 필요한 것보다 더 많은 CPU를 사용하도록 부추길 수 있습니다.


따라서 "게임에는 8개의 코어가 필요합니다"라는 주장을 무시하는 것은 지나치게 단순화하여 PC 빌더를 오도하여 실제로 필요한 것보다 더 많은 CPU를 사용하도록 부추길 수 있습니다. 게다가 그 돈은 더 빠른 GPU에 더 잘 투자되거나 향후 업그레이드를 위해 절약됩니다. 또한 빌더가 궁극적으로 게임용으로 훨씬 느린 CPU를 구매하도록 권장할 수 있습니다. 5600X(6코어)보다 2700X(8코어)를 생각하십시오.


AMD와 인텔

이제 다양한 게임에서 수십 개의 최신 AMD 및 Intel CPU를 벤치마킹하면서 매우 흥미로운 사실을 발견했습니다. 게임이 아니더라도 최대 10개의 코어를 추가하면 Intel CPU의 성능이 균일하게 확장되는 것처럼 보입니다. 그만큼 처리 능력이 필요합니다. 한편, AMD의 Zen 3 제품군은 6코어에서 최대 16코어까지 일관된 성능을 제공하며, 이들 사이에서 성능 차이를 보이는 게임은 거의 없습니다.


퀘이사존


Zen 3 CPU/GPU 스케일링 데이터를 보면 강력한 GeForce RTX 3090을 사용할 경우 16코어/32스레드 Ryzen 9 5950X가 6코어/12스레드 5600X보다 평균 5% 더 빠릅니다. 8코어/16스레드 5800X는 ~3% 더 빠릅니다.


이제 이 데이터가 1080p 테스트를 기반으로 한다는 사실에도 불구하고 GPU 병목 현상을 주장하고 싶을 수 있지만 이러한 게임 중 상당수는 오늘날의 표준에 따라 CPU 집약적입니다.


퀘이사존


이제 내가 발견한 매우 흥미로운 점은 비슷한 범위의 게임을 RTX 3090으로 1080p에서 테스트하지만 Intel의 10세대 Core CPU 범위를 사용하는 경우 결과가 상당히 다르다는 것입니다. 8코어/16스레드 Core i7-10700K는 Core i5-10600K보다 9% 빠르며, 10900K는 16% 더 빨라 성능이 훨씬 향상되었습니다.


이것은 사람들이 Intel CPU를 사용할 때 게임에 대해 "모어 코어가 더 낫다"라는 주장을 정당화하는 것을 많이 보았기 때문에 매혹적입니다. 코어 수가 67% 증가했기 때문입니다. 하지만 더 많은 것이 있습니까?


대답은 "예"입니다.


AMD Zen 3 CPU는 모두 CCD당 32MB의 L3 캐시를 특징으로 합니다. 이는 Ryzen 5 및 Ryzen 7 부품의 경우 총 32MB이고, Ryzen 9는 총 64MB를 두 개의 개별 다이로 나눕니다.


Intel CPU는 코어 수에 따라 L3 캐시 용량의 근본적인 변화를 봅니다. 10세대 6코어 i5 모델은 12MB의 L3, 8코어 i7은 16MB, 10코어 i9는 20MB입니다.


퀘이사존


따라서 10600K에서 10900K로, 67% 더 많은 코어를 얻을 수 있을 뿐만 아니라 L3 캐시 용량도 67% 증가합니다. 대부분의 PC 게임이 여전히 10600K의 6코어를 최대화할 수 없기 때문에 여기서 더 큰 역할을 하는 것이 무엇인지 궁금해야 합니다. 추가 캐시 또는 코어가 무엇입니까?


10700K 및 10900K에서 코어를 비활성화하고 작동 주파수, 링 버스 및 메모리 타이밍을 잠그면 실제로 이를 확인할 수 있습니다. 이 테스트를 위해 우리는 Gigabyte Z590 Aorus Xtreme 마더보드를 사용하여 Intel 3개의 CPU를 4.5GHz로 클럭하고 링 버스용 45배 승수를 사용했습니다. 또한 모든 1차, 2차 및 3차 타이밍이 수동으로 구성된 DDR4-3200 CL14 듀얼 랭크, 듀얼 채널 메모리를 사용했습니다.


따라서 각 구성의 유일한 차이점은 코어 수와 각 모델에 고정된 L3 캐시 용량입니다. 코어를 비활성화해도 L3 풀 크기는 줄어들지 않습니다. 단일 코어가 활성화된 경우에도 10900K에는 여전히 20MB의 L3가 있습니다.


모든 테스트는 시장에서 가장 빠른 1080p 게임 GPU인 Radeon RX 6900 XT를 사용하여 수행되었습니다. 결과를 확인해봅시다.



벤치마크


지금까지 발견한 가장 극단적인 예부터 시작하겠습니다. 면책 조항: 소수로 좁히기 위해 수십 개의 게임을 테스트하지 않고 흥미로운 조사에 도움이 될 것으로 생각되는 6개의 게임만 선택했습니다. 일부는 다른 것보다 CPU를 더 많이 사용합니다. 이는 일종의 아이디어입니다.


각 프로세서의 기본 L3 캐시 용량과 일치하는 Rainbow Six Siege 결과를 보면 동일한 4.5GHz 주파수에서 클럭된 10600K, 10700K, 10900K를 모두 비교하므로 기본적으로 IPC 테스트입니다. 이것에서 가장 많이 도출할 수 있는 결론은 6코어에서 8코어로 이동하면 15% 더 많은 성능을 얻을 수 있고 8에서 10으로 추가로 9% 더 높은 성능을 얻을 수 있다는 것입니다. 따라서 10600K에서 10900K로 이동하면 25% 더 많은 성능을 얻을 수 있으며 이는 사실입니다. 하지만 4개의 추가 코어 때문인가요?


퀘이사존


이제 8코어 데이터를 살펴보고 16MB L3 캐시와 20MB L3 캐시를 비교하면 이것만으로도 성능이 5% 향상되고 흥미롭게도 2개의 추가 코어로 성능이 3%만 향상되었음을 알 수 있습니다. 그러나 10700K와 10900K는 이미 성능 면에서 비슷했는데 6코어만 활성화하면 어떻게 보일까요?


이 데이터는 매우 흥미롭고 Zen 3 프로세서에서 보는 것과 매우 유사합니다. 8개 코어가 모두 활성화된 10700K는 이 테스트에서 10600K보다 15% 빠르며 429fps에서 494fps로 이동합니다. 그러나 여기서 우리는 이 마진의 10%가 12MB에서 16MB로 증가하는 더 큰 L3 캐시 용량으로 인한 것임을 알 수 있습니다. 10600K에 10900K와 동일한 20MB L3 캐시가 장착되어 있다면 10700K보다 빠를 것입니다. 또한 10900K는 6코어가 아닌 10코어를 사용하여 6% 더 빠릅니다.


즉, 코어가 67% 증가하면 성능이 6% 증가하는 반면 L3 캐시가 67% 증가하면 성능이 18% 증가하므로 이 시나리오에서 추가 캐시가 훨씬 더 유용합니다.


또한 이 시나리오에서 우리는 동일한 아키텍처의 CPU를 테스트하고 있기 때문에 코어가 전부가 아니라는 것을 앞서 내 요점으로 증명합니다. 우리는 Zen 3에서 대다수의 게이머에게 6코어를 넘어서는 이점이 거의 없음을 알 수 있습니다.


퀘이사존


CPU를 많이 사용하지 않아 6개 이상의 코어가 있는 최신 프로세서를 사용하여 잘 실행되는 게임의 경우, GPU가 완전히 제한되어 있으므로 코어 및/또는 캐시를 추가해도 별 차이가 없습니다.


사실 이것은 대부분의 게임, 심지어 작년에 출시된 게임의 상황입니다. 또한 우리는 1080p에서 RTX 3090으로 테스트 중이므로 RTX 3060 Ti와 같은 더 적은 GPU로 1440p와 같은 고해상도로 게임을 하는 경우 CPU를 많이 요구하는 게임에서도 마진은 여기에 표시된 것과 유사해야 합니다.


퀘이사존


Watch Dogs Legion은 Core i5-10600K에서 얻을 수 있는 것보다 더 많은 CPU 성능을 필요로 하지 않는 또 다른 게임입니다. 10900K의 추가 코어와 캐시는 1080p에서 7% 더 많은 성능을 제공합니다. 즉, 여기에서 캐시는 ~2.5%의 성능 향상을 가져오고 코어는 약 4%만 향상되는 것처럼 보입니다. 어느 쪽이든 전체적인 차이는 무시할 수 있습니다.


퀘이사존


Cyberpunk 2077 데이터는 특히 1% 낮은 결과가 흥미롭습니다. 우리는 10600K에서 10900K로 갈 때 1% 낮은 성능에서 15% 개선을 볼 수 있으며 이는 프레임 시간 성능에 영향을 미칩니다. 그러나 대량 또는 이는 추가 코어가 기본적으로 아무것도 하지 않는 증가된 L3 캐시 때문입니다.


퀘이사존


F1 2020은 대부분의 이득이 증가한 L3 캐시에 기인할 수 있는 또 다른 타이틀입니다. 예를 들어, 10900K는 클럭 대 클럭을 일치시킬 때 10600K보다 10% 더 빠른 것으로 보입니다. 그러나 10900K를 6코어로 제한하면 기본 10코어 구성(1% 차이)과 비교할 때 성능이 거의 떨어지지 않습니다. 이것은 L3 캐시 용량이 코어 수보다 더 중요한 또 다른 게임입니다. 적어도 6개를 넘어설 때입니다.


퀘이사존


우리는 매우 CPU를 많이 요구하는 Shadow of the Tomb Raider의 마을 섹션을 사용합니다. 그 점에서 우리는 내장 벤치마크를 사용하지 않고 실제로 게임을 하고 있습니다.


우리는 SoTR을 사용하여 CPU 성능을 테스트하는 것을 좋아합니다. 왜냐하면 코어가 매우 무거우며 많은 코어에 부하를 분산시킬 것이기 때문입니다. 이것은 더 많은 코어와 더 많은 캐시를 추가하는 것 사이에서 본 결과 중 가장 균형 잡힌 결과입니다. 둘 다 성능에 긍정적인 영향을 미치는 것으로 나타났기 때문입니다.


동일한 클럭 속도에서 평균 프레임 속도를 볼 때 10900K가 10600K보다 18% 빠르며 1% 낮은 결과의 경우 32% 더 빨라서 극적인 개선임을 알 수 있습니다. 그 이득의 16%는 캐시 증가에 기인할 수 있으며 14%는 추가된 코어에서 비롯된 것임을 알 수 있습니다.



우리가 배운 것

댓글 1개 / 1페이지

잼스뻔님의 댓글

  • 잼스뻔
    정보 감사합니다 :)
  • 작성일

하드웨어 뉴스
번호
제목
이름