Come 2020 Intel retornará ao negócio de gráficos discretos e espera-se que lance uma nova GPU para gamers. Podemos ver isso de duas maneiras: os gráficos da Intel estão se tornando, ou milagrosamente, o alvo das piadas sobre PCs de última geração e estão entrando em um mercado dominado por apenas dois jogadores desde a virada do milênio.

Aqui está um breve cronograma de como este lançamento recente tomou forma aos olhos do público:

12 de junho de 2018: Brian Krzanich, ex-CEO da Intel, disse aos investidores em uma reunião especial que a Intel tem desenvolvido discretamente uma arquitetura de GPU discreta "Arctic Sound" por anos e será lançada em 2020.

8 de janeiro de 2019: Gregory Bryant, vice-presidente de usuário veterano de computador durante a CES, explica que a próxima GPU será produzida no processo de 10nm da Intel.

21 de março de 2019: A Intel oferece dois designs no palco para suas GPUs. Estilisticamente, eles são semelhantes aos SSDs Optane e, em tamanho, têm capacidade de resfriamento de médio alcance.




1 ° de maio de 2019: Jim Jeffers, engenheiro chefe e gerente da equipe de renderização e visualização, anunciou os recursos de rastreamento de raios do Xe no FMX19. Além disso, a Intel continuou a manter os recursos longe dos concorrentes.




Há muitos vazamentos e rumores sobre o espaço da tecnologia entre essas datas, e podemos reunir quantidades titânicas de informações estudando os fundamentos da arquitetura Intel. Este é o tópico deste artigo.

desenvolvimento

Não querendo arriscar, a Intel decidiu que toda a sua equipe gráfica seria composta por especialistas roubados da AMD e da Nvidia. Aprendemos pela primeira vez que a Intel fará GPUs discretas: eles contrataram o gerente de arquitetura gráfica e o gerente de negócios gráficos da AMD, Raja Koduri, Sendo vice-presidente sênior de computação básica e visual da Intel em 2017.




Em seguida veio Jim Keller, o arquiteto-chefe por trás da arquitetura Zen da AMD, para o cargo de vice-presidente sênior de engenharia de silício. Posteriormente, a Intel fez de Chris Hook, diretor sênior de marketing de produto global da AMD, um comerciante separado de GPU. Em seguida, Darren McPhee, ex-diretor de marketing de produtos da AMD; O ex-jornalista de tecnologia Damien Triolet se tornou comerciante da AMD; Tom Peterson, diretor técnico de marketing e arquiteto de chips da Nvidia; e, finalmente, Heather Lennon, gerente de comunicações e marketing gráfico da AMD.




Claro, apenas o trabalho público maior. A equipe de gráficos da Intel tem 4.500 funcionários. E você não teria tantas pessoas e pessoas talentosas sem pelo menos fazer algo vagamente interessante.




Arquitetônico

Contagem de núcleo

Embora o Xe pertença ao futuro, nenhuma tecnologia está separada dos produtos que surgiram no passado e do desenvolvimento que deu origem a ele - gerações bem documentadas. A primeira rodada de produtos Xe usará uma arquitetura desenvolvida a partir do "Gen11" lançado atualmente, mas ainda intimamente relacionado e baseado nas declarações da Intel na CES. Assim, podemos reunir informações interessantes pesquisando na Intels. papel branco Gen11.

Como você se lembra de nosso Comparação Navi vs TuringTodas as arquiteturas gráficas consistem em peças cada vez mais complexas. 16 núcleos CUDA agrupados para Nvidia blocosquatro deles um streaming multiprocessador, um casal conjunto de renderização de textura (TPC) e um deles tem quatro ou seis conjunto de renderização gráfica (GPC). Assim, cada GPC contém 512 ou 768 núcleos CUDA.




Conforme mostrado na tabela abaixo, o número de GPC e TPC por GPC determina o número de núcleos para cada dado. Lembre-se de que as GPUs à venda podem ter alguns desses núcleos desativados. Por exemplo, um RTX 2070 Super usa uma matriz TU104 que permite que 83% dos núcleos sejam limitados a 2560 núcleos CUDA.

  6 clusters de processamento gráfico 3 clusters de processamento gráfico
768 CUDA por GPC (6 TPC por GPC) 768 x 6 = 4608 CUDA (TU102) 768 x 3 = 2304 CUDA (TU106)
512 CUDA por GPC (4 TPC por GPC) 512 x 6 = 3072 CUDA (TU104) 512 x 3 = 1536 CUDA (TU116)

Vamos aplicar o mesmo conceito à arquitetura da Intel.

Os núcleos da Intel não são semelhantes ao CUDA da Nvidia, mas são semelhantes aos processadores stream da AMD, então vamos discutir em termos deles. Cada processador de fluxo é um Unidade lógica aritmética pode realizar um ponto flutuante ou operação inteira por hora. Intel's unidades lógicas aritméticas Vamos chamá-los de equivalente a quatro núcleos, já que podem realizar quatro operações por hora.

A Intel começa pareando os dois unidades lógicas aritméticas para alguém unidade executiva (oito núcleos) seguido por um fatia inferior (64 núcleos), então oito deles são mais cheios fatia (512 cores).

Os processadores da próxima geração da Intel incluem uma fatia integrada, mas como você pode imaginar, o array discreto Xe será construído a partir de várias fatias. Basicamente, isso significa que a Intel só pode produzir padrões com contagens de núcleos em múltiplos de 512, como a Nvidia. A contagem principal de um dado é o número de fatias multiplicado por 512.

Número de fatias 2 3 4 5 6 7 8
Contagem de núcleo 1024 1536 2048 2560 3072 3584 4096
Para * iDG2HP128   iDG2HP256       iDG2HP512

Lembre-se, estamos assumindo que a Intel manterá a configuração de fatia de base do Gen11, porque obviamente eles podem não ter tempo para redesenhar completamente os gráficos gráficos até o próximo ano. O Gen11 é adequado para ser integrado e discreto com o design, é claro, mas alguns elementos devem mudar, como o backend de renderização que, se deixado inalterado, obstruirá um design multi-slice.

Arquitetura possível de 2048 núcleos (quatro fatias) Xe

Provas

Convenientemente, a Intel forneceu um poderoso pacote de evidências para apoiar essa hipótese. 1 motorista por engano, continha os nomes de vários produtos não lançados no final de julho; "IDG2HP512," "iDG2HP256" e "iDG2HP128;" interpretamos os códigos como "Intel gráficos discretos [modelo] dois de alta potência", seguido pelo número de unidades de execução.

Cada unidade de execução tem oito núcleos, portanto, obtemos "512" com quatro fatias e 4096 núcleos, "256" com duas fatias e 2048 núcleos e "128" com duas fatias e 1024 núcleos. Essas configurações suportam nossa análise perfeitamente.

A Intel também anunciou que está explorando maneiras de combinar fatias. No início de 2018, a Intel demonstrou um protótipo de GPU discreta contendo duas fatias Gen9 combinadas em uma única matriz e a implementou com o novo Iris Plus Graphics 650 integrado, combinando duas fatias Gen9.5 em uma matriz. Eles também estão experimentando uma abordagem de chips usando EMIB (ponte de conexão multi-matriz incorporada), que foi usado pela primeira vez em Kaby Lake G.

Projeto de Arquitetura EMIB

O EMIB basicamente combina dois ou mais moldes físicos em um molde virtual para economia massiva de custos e uma pequena penalidade de desempenho, “combinando de maneira econômica vários padrões heterogêneos em um pacote”. Como Nvidia 2017 Artigo de pesquisa porque “moldes muito grandes têm eficiência muito baixa devido a um grande número de defeitos de fabricação irreparáveis”.

Ao criar um grande número de pequenos padrões e combiná-los, a Intel reduz a probabilidade de erros ao produzi-los e torna mais barato eliminar esses erros. Embora o EMIB não esteja totalmente preparado para distribuição em massa, a Intel em abril aprovado Estou ansioso para a Anandtech nisso, pois em breve eles pretendem usar o EMIB para oferecer suporte a sua GPU.

Velocidades do relógio

Tempo do gráfico. Encontramos uma estimativa razoável dos números básicos, então vamos dar uma olhada no pior cenário para criar uma base. Ou seja, ele iguala a contagem de núcleos às velocidades de clock dos melhores gráficos integrados da Intel disponíveis em 1150 MHz. Para combinar velocidade e contagem de núcleo, faremos um gráfico em TFLOPs, uma medida teórica de desempenho com base nessas duas variáveis. Embora o TFLOPS seja um excelente indicador de desempenho em uma geração de GPU produzida pelo fabricante, vale a pena notar que é menos confiável comparar os dois fabricantes.

1,2 GHz'de TFLOPS

Embora a Intel seja competitiva na contagem de núcleos, eles não podem competir em 1150 MHz. Felizmente, este não é o caso em que estamos. Pelo menos sabemos que eles podem exceder as velocidades integradas porque são limitados pela saída térmica da CPU, o que não é um problema quando não há CPU. Em segundo lugar, os novos chips Xe da Intel usarão os 10 nm mais rápidos e superiores.

O processo de 10nm da Intel é considerado equivalente a 7nm de TSMC na melhor das hipóteses, que pode ficar a 1800 MHz ao jogar em uma Radeon 5700XT bem resfriada. A Intel tem uma longa história de compactação de seus processos em velocidades mais altas do que seus concorrentes. No entanto, essas são as GPUs de primeira geração da Intel, por isso o pessimismo cauteloso oferece mais precisão: digamos que a Intel pode gerenciar pelo menos 1700 MHz.

1,7 GHz'de TFLOPS

Nessas velocidades potencialmente mais realistas, a Intel parece um tanto competitiva no front TFLOPS. Observe, no entanto, que essas estimativas de velocidade não pretendem ser confiáveis, especialmente quando comparadas aos cálculos de contagem de núcleo.

Resumindo: as GPUs Xe discretas provavelmente terão o mesmo preço por núcleo que a Nvidia em 512 tempos de núcleo e velocidades competitivas de 1,7 GHz.

Programas

As GPUs são mais do que apenas hardware. A Nvidia contrata mais engenheiros de software do que engenheiros de hardware. Apoiar todos os jogos é um investimento caro e demorado, o que é parte da razão pela qual novos participantes no mercado de GPU de jogos estão quase desaparecendo. Exceto pela Intel, eles definitivamente não são novos em software, embora sejam novos em jogos de hardware separados. Imagine um tradutor entre jogos e hardware para drivers; apenas o hardware está mudando, portanto, a conversão de drivers integrados existentes em um sistema discreto é um processo simples.

Esses drivers não são bem protegidos e isso é algo que a Intel vem criticando há muito tempo. O tempo médio entre os últimos dez lançamentos de driver foi de vinte e cinco dias para Intel, dezoito dias para Nvidia e apenas dez dias para AMD. Felizmente, há uma boa chance da Intel forçar a barra para o Xe, considerando o quanto os drivers mais importantes são para GPUs discretas para GPUs integradas.

Mas nem tudo é ruim. A Intel está dando passos largos no ano passado e pavimentando o caminho para a Nvidia e a AMD com seu novo Command Center que oferece um controle muito melhor e mais indolor sobre GPUs e jogos do que a GeForce Experience da Nvidia. Ele oferece otimização de jogo com o que cada configuração faz e seu impacto no desempenho, configuração multitela rápida com taxa de atualização e sincronização de rotação, precisão de cores da tela e ajustes de estilo e controle de driver. E um detalhe trivial, mas interessante, a Intel também oferece suporte ao assíncrono, portanto, todos os produtos Xe oferecerão suporte a monitores e ecossistemas FreeSync na porta.

Mercado

Quando a posição de mercado dos produtos é incerta, pouco sobre a arquitetura ou o ecossistema importa. Sabemos muito pouco sobre isso. Custarão $ 100 ou $ 1.000? Um modelo, dois ou dez? Recentemente perguntado se o Xe poderia atingir o principal mercado de Raja Koduri respondeu:

“Nem todo mundo vai comprar um cartão de $ 500-600, mas há gente suficiente para comprar isso também - é um grande mercado. Portanto, não nos preocupamos realmente com a estratégia que buscamos, a gama de desempenho, a gama de custos e tudo, porque, eventualmente, nossa arquitetura tem que chegar ao mercado a partir de cerca de US $ 100, como disse o público. Para gráficos caros de data center com memórias HBM e tudo.

Temos que acertar tudo; onde você apenas começa Primeiro? O segundo? Terceiro? E a estratégia que tivemos em quase um período de tempo - vamos chamá-la de 2-3 anos para que o stack completo seja. "

E aqui está: a Intel lançará várias GPUs. Não é exatamente um insight valioso, mas espera-se que a Intel queira manter suas cartas fechadas. E como é a única palavra oficial neste tópico, devemos agora nos voltar para uma fonte alternativa: driver vazado.

Imagem: construção de conceito da Intel Cristiano Siqueira

As três GPUs, chamadas de drivers Intel para os primeiros drivers, têm 1024, 2048 e 4096 núcleos. Isso os tornará competitivos com o RTX 1650, RTX 2060 e RTX 2080 Ti com preços de $ 150, $ 350 e $ 1000 +, respectivamente. A Intel pode escolher superar o desempenho da Nvidia com velocidades mais altas ou valor mais baixo a preços mais baixos, ou simplesmente contar com outros recursos para combinar e diferenciar.

O driver também fornece uma perspectiva de longo prazo com duas placas de "desenvolvedor". O grupo, junto com os outros três, é um "iDG1LPDEV" que evolui para uma placa de "desenvolvedor de gráficos discretos Intel [modelo] 1 de baixo consumo", o que pode indicar que GPUs de notebook de baixo consumo estão sendo testados. Também há uma lista separada de "iATSHPDEV" mostrando o codinome "Arctic Sound" para a arquitetura do Xe, mas não pode ser verificado como uma GPU discreta.

Se há uma coisa a lembrar ... o que a Intel publicará é desconhecido e as especulações não implicam em conselhos de compra. Por outro lado, as coisas são promissoras. É muito promissor.

Atalhos de compras: