Эволюция видеокарт NVIDIA Tesla
В мире высокопроизводительных вычислений и искусственного интеллекта видеокарты линейки NVIDIA Tesla занимают особое место, став одними из первых профессиональных GPU, появившихся на рынке. С каждым годом технологии видеокарт данной линейки, официально получившей новое название (NVIDIA Data Center GPUs), стремительно развиваются и расширяют свои возможности для специализированных задач. В этой статье мы пройдемся по всем существующим поколениям видеокарт NVIDIA Tesla и рассмотрим основные нововведения и ключевые модели GPU в каждом из них.
Tesla

Одноименная архитектура Tesla, представленная в 2006 году, стала основой для первых массовых видеокарт, ориентированных на параллельные вычисления. Это поколение знаменовало переход от чисто графических функций к универсальным вычислениям. Tesla внедрила унифицированную архитектуру шейдеров и позволила разработчикам использовать технологию CUDA (Compute Unified Device Architecture), открыв возможности для высокопроизводительных вычислений. Одной из первых видеокарт линейки Tesla стала C870, нацеленная на научные расчеты и исследовательские задачи.
Архитектура | Название | Интерфейс | Базовая частота (МГц) | Boost частота (МГц) | Тип памяти | Объем памяти (ГБ) |
---|---|---|---|---|---|---|
Tesla | C870 | PCIe 1.0 x16 | 600 | - | GDDR3 | 1.5 |
Tesla | C1060 | PCIe 2.0 x16 | 610 | - | GDDR3 | 2 / 4 |
Tesla | C1080 | PCIe 2.0 x16 | 610 | - | GDDR3 | 4 |
Fermi

Архитектура Fermi появилась в 2010 году и пришла на замену Tesla, представив прорывные изменения: использование двоичной арифметики с двойной точностью, новое поколение видеопамяти GDDR5 и обновленную архитектуру кэша. Это поколение стало настоящим шагом в сторону профессиональных вычислений и искусственного интеллекта, но впервые было применено в потребительских видеокартах линейки GeForce 400. Карты вроде Tesla C2050 стали популярны для высокопроизводительных серверов и научных центров благодаря значительному увеличению числа CUDA-ядер и поддержке до 6 ГБ видеопамяти.
Архитектура | Название | Интерфейс | Базовая частота (МГц) | Boost частота (МГц) | Тип памяти | Объем памяти (ГБ) |
---|---|---|---|---|---|---|
Fermi | C2050 | PCIe 2.0 x16 | 574 | - | GDDR5 | 3 |
Fermi | C2070 | PCIe 2.0 x16 | 574 | - | GDDR5 | 6 |
Fermi | C2090 | PCIe 2.0 x16 | 651 | - | GDDR5 | 6 |
Kepler

В 2012 году NVIDIA выпустила Kepler, сделав акцент на энергоэффективность и увеличение производительности. Kepler представил динамическое управление частотой GPU Boost и стал первым поколением, поддерживающим виртуализацию GPU (vGPU) - технологию для разделения графических ресурсов, позволяющую значительно увеличить эффективность устройств. Tesla K20 была лидером среди вычислительных решений и широко использовалась в суперкомпьютерах благодаря поддержке вычислений двойной точности и увеличению числа ядер до 2496. В то же время Tesla K80, использующая сразу два специфических чипа GK210, до сих пор применяется в некоторых решениях за счет достойной производительности и относительно большого объема видеопамяти.
Архитектура | Название | Интерфейс | Базовая частота (МГц) | Boost частота (МГц) | Тип памяти | Объем памяти (ГБ) |
---|---|---|---|---|---|---|
Kepler | K10 | PCIe 3.0 x16 | 745 | - | GDDR5 | 4×2 |
Kepler | K20 | PCIe 2.0 x16 | 706 | - | GDDR5 | 5 / 6 |
Kepler | K40 | PCIe 3.0 x16 | 745 | - | GDDR5 | 12 |
Kepler | K80 | PCIe 3.0 x16 | 562 | - | GDDR5 | 12×2 |
Maxwell

Архитектура Maxwell, дебютировавшая в 2014 году, стала ещё более энергоэффективной благодаря новому дизайну потоковых мультипроцессоров (Streaming Maxwell Multiprocessor). Другим важным новшеством стало улучшение архитектуры памяти, что существенно повысило скорость обмена данными между графическим процессором и видеопамятью при меньших энергозатратах. Видеокарты с архитектурой Maxwell, такие как M40 и M60, использовались для ранних экспериментов с искусственным интеллектом.
Архитектура | Название | Интерфейс | Базовая частота (МГц) | Boost частота (МГц) | Тип памяти | Объем памяти (ГБ) |
---|---|---|---|---|---|---|
Maxwell | M4 | PCIe 3.0 x16 | 872 | 1072 | GDDR5 | 4 |
Maxwell | M40 | PCIe 3.0 x16 | 948 | 1112 | GDDR5 | 12 / 24 |
Maxwell | M60 | PCIe 3.0 x16 | 557 | 1178 | GDDR5 | 8×2 |
Maxwell | M10 | PCIe 3.0 x16 | 1033 | 1306 | GDDR5 | 8×4 |
Pascal

В 2016 году с архитектурой Pascal NVIDIA ввела поддержку высокопропускной памяти HBM2 (High Bandwidth Memory) и технологию NVLink, позволяющую эффективно использовать сразу несколько видеокарт. Поддержка смешанных вычислений FP16/FP32 (16-битный и 32-битный форматы) сделала видеокарты с архитектурой Pascal стандартом для машинного обучения до появления видеокарт с тензорными ядрами. Tesla P100, основанная на этой архитектуре, стала одной из первых видеокарт с применением памяти HBM2 и за счет своей производительности широко использовалась для различных задач. Вместе с базовой вариацией Tesla P100, подключаемой через стандартный интерфейс PCI-e, NVIDIA выпустила Tesla P100 SXM - первую высокопроизводительную видеокарту формата SXM для использования в системах с соответствующими сокетами.
Архитектура | Название | Интерфейс | Базовая частота (МГц) | Boost частота (МГц) | Тип памяти | Объем памяти (ГБ) |
---|---|---|---|---|---|---|
Pascal | P4 | PCIe 3.0 x16 | 886 | 1114 | GDDR5 | 8 |
Pascal | P10 | PCIe 3.0 x16 | 1025 | 1493 | GDDR5X | 24 |
Pascal | P40 | PCIe 3.0 x16 | 1303 | 1531 | GDDR5 | 24 |
Pascal | P100 PCIe | PCIe 3.0 x16 | 1190 | 1329 | HBM2 | 12 / 16 |
Pascal | P100 SXM2 | SXM2 | 1328 | 1480 | HBM2 | 16 |
Volta

Volta, представленная в 2017 году, пришла на замену архитектуре Pascal и расширила возможности для использования видеокарт в сфере ИИ. Она стала первым поколением с тензорными ядрами, которые ускорили матричные операции, используемые в глубоком машинном обучении. Большинство видеокарт на основе архитектуры Volta представлено различными вариантами модели Tesla V100, ставшей ключевым инструментом в системах для обучения нейронных сетей. Как и в случае с Tesla P100, видеокарта Tesla V100 производилась в SXM вариантах, подходящих для сокетов SXM2 и SXM3.
Архитектура | Название | Интерфейс | Базовая частота (МГц) | Boost частота (МГц) | Тип памяти | Объем памяти (ГБ) |
---|---|---|---|---|---|---|
Volta | V100 PCIe | PCIe 3.0 x16 | 1245 | 1380 | HBM2 | 16 / 32 |
Volta | V100 SXM2 | SXM2 | 1290 | 1530 | HBM2 | 16 / 32 |
Volta | V100 SXM3 | SXM3 | 1380 | 1597 | HBM2 | 32 |
Turing

С выходом архитектуры Turing в 2018 году NVIDIA представила революционные возможности трассировки лучей в реальном времени благодаря использованию RT-ядер. Кроме того, Turing предложила новую видеопамять поколения GDDR6 и тензорные ядра второго поколения, что значительно увеличило скорость выполнения задач глубокого обучения нейронных сетей. Среди небольшой линейки GPU на основе данной технологии можно выделить карты Tesla T4 и Tesla T10, предоставляющие высокую эффективность при работе с ИИ и другими высокопроизводительными вычислениями в уменьшенном (Single-slot) форм-факторе.
Архитектура | Название | Интерфейс | Базовая частота (МГц) | Boost частота (МГц) | Тип памяти | Объем памяти (ГБ) |
---|---|---|---|---|---|---|
Turing | T4 | PCIe 3.0 x16 | 585 | 1590 | GDDR6 | 16 |
Turing | T10 | PCIe 3.0 x16 | 1065 | 1395 | GDDR6 | 16 |
Turing | T40 | PCIe 3.0 x16 | 1305 | 1560 | GDDR6 | 24 |
Ampere

Архитектура Ampere, представленная в 2020 году в качестве преемника Volta и Turing, продемонстрировала удвоенную производительность вычислений FP32 и расширенные возможности тензорных ядер третьего поколения. Поддержка памяти HBM2e повысила скорость работы с большими наборами данных, а усовершенствованная технология NVLink 3.0 значительно увеличила эффективность взаимодействия нескольких видеокарт в одной системе. Вместе с выходом GPU на данной архитектуре NVIDIA прекратила использование бренда Tesla для новых поколений видеокарт, а сама линейка стала называться NVIDIA Data Center GPUs.
Архитектура | Название | Интерфейс | Базовая частота (МГц) | Boost частота (МГц) | Тип памяти | Объем памяти (ГБ) |
---|---|---|---|---|---|---|
Ampere | A2 | PCIe 4.0 x8 | 1440 | 1770 | GDDR6 | 16 |
Ampere | A10 | PCIe 4.0 x16 | 885 | 1695 | GDDR6 | 24 |
Ampere | A16 | PCIe 4.0 x16 | 1312 | 1755 | GDDR6 | 16×4 |
Ampere | A30 | PCIe 4.0 x16 | 930 | 1440 | HBM2e | 24 |
Ampere | A40 | PCIe 4.0 x16 | 1305 | 1740 | GDDR6 | 48 |
Ampere | A100 PCIe | PCIe 4.0 x16 | 765 / 1065 | 1410 | HBM2e | 40 / 80 |
Ampere | A100 SXM4 | SXM4 | 1095 / 1275 | 1410 | HBM2e | 40 / 80 |
Ampere | A800 PCIe | PCIe 4.0 x16 | 765 / 1065 | 1410 | HBM2e | 40 / 80 |
Ampere | A800 SXM4 | SXM4 | 1155 | 1410 | HBM2e | 80 |
Hopper

В 2022 году дебютировала архитектура Hopper, сосредоточенная на решении задач высокопроизводительных вычислений и искусственного интеллекта. Одним из ключевых нововведений Hopper стало внедрение тензорных ядер четвертого поколения, которые удвоили эффективность работы в области машинного обучения. Также архитектура представила технологию NVLink 4.0, продолжив совершенствовать взаимодействие между несколькими GPU. Hopper поддерживает память HBM2e и HBM3, предоставляя высокую пропускную способность, что делает её идеальным выбором для работы с большими наборами данных, характерными для генеративного ИИ. Флагманом линейки на архитектуре Hopper стала видеокарта NVIDIA H100, ориентированная на выполнение крайне требовательных задач в дата-центрах и суперкомпьютерах.
Архитектура | Название | Интерфейс | Базовая частота (МГц) | Boost частота (МГц) | Тип памяти | Объем памяти (ГБ) |
---|---|---|---|---|---|---|
Hopper | H100 PCIe | PCIe 5.0 x16 | 1095 | 1755 | HBM2e | 80 / 96 |
Hopper | H100 SXM5 | SXM5 | 1665 | 1980 | HBM3 | 64 / 80 / 96 |
Hopper | H800 PCIe | PCIe 5.0 x16 | 1095 | 1755 | HBM2e | 80 |
Hopper | H800 SXM5 | SXM5 | 1095 | 1755 | HBM3 | 80 |
Hopper | H200 PCIe | PCIe 5.0 x16 | 1365 | 1785 | HBM3e | 141 |
Hopper | H200 SXM | SXM5 | 1590 | 1980 | HBM3e | 141 |
Ada Lovelace

Параллельно архитектуре Hopper, NVIDIA представила архитектуру Ada Lovelace, преимущественно предназначенную для использования в видеокартах для потребительского рынка. Тем не менее, такие карты как L40 и L20, относящиеся к линейке Data Center GPUs, созданы на основе именно этой технологии. Помимо прочих нововведений, свойственных для потребительских видеокарт, Ada Lovelace наравне с Hopper получила тензорные ядра четвертого поколения, что сделало карты на её основе достойными вариантами для задач, связанных с ИИ. В отличии от предшествующих архитектур Ada Lovelace не поддерживает технологию NVLink.
Архитектура | Название | Интерфейс | Базовая частота (МГц) | Boost частота (МГц) | Тип памяти | Объем памяти (ГБ) |
---|---|---|---|---|---|---|
Ada Lovelace | L40 | PCIe 4.0 x16 | 735 | 2490 | GDDR6 | 24 / 48 |
Ada Lovelace | L4 | PCIe 4.0 x16 | 795 | 2040 | GDDR6 | 24 |
Ada Lovelace | L20 | PCIe 4.0 x16 | 1440 | 2520 | GDDR6 | 48 |
Сравним производительность нескольких видеокарт из разных поколений линейки Tesla:



Делая вывод, мы можем заметить, что современные видеокарты NVIDIA демонстрируют стремительное развитие, расширяя свои возможности для ИИ и других требовательных задач. Если вам необходимо подобрать графический ускоритель NVIDIA для реализации ваших проектов в сфере искусственного интеллекта или сервер для установки данных видеокарт, обращайтесь в InRack - наши менеджеры помогут вам абсолютно бесплатно.