Nvidia Tesla - Nvidia Tesla
Производитель | Nvidia |
---|---|
Введено | 2 мая 2007 г . |
Тип | Потребительские видеокарты |
Nvidia Tesla - это линейка продуктов Nvidia, предназначенных для потоковой обработки или универсальных графических процессоров (GPGPU), названная в честь новаторского инженера-электрика Николы Тесла . Ее продукты начали использовать графические процессоры серии G80 и продолжали сопровождать выпуск новых чипов. Их можно программировать с помощью API CUDA или OpenCL .
Линия продуктов Nvidia Tesla конкурировала с линейками AMD Radeon Instinct и Intel Xeon Phi в области глубокого обучения и видеокартами.
Nvidia отказалась от бренда Tesla в мае 2020 года, как сообщается, из-за возможной путаницы с маркой автомобилей . Его новые графические процессоры - это графические процессоры Nvidia Data Center , такие как графические процессоры Ampere A100.
Обзор
Предлагая вычислительную мощность, намного превышающую традиционные микропроцессоры , продукты Tesla нацелены на рынок высокопроизводительных вычислений . По состоянию на 2012 год на базе Nvidia Teslas находятся одни из самых быстрых суперкомпьютеров в мире , в том числе Summit в Национальной лаборатории Ок-Ридж и Tianhe-1A в Тяньцзине , Китай .
Карты Tesla обладают в четыре раза большей производительностью с двойной точностью, чем карты Nvidia GeForce на базе Fermi, с аналогичной производительностью с одинарной точностью. В отличие от потребительских карт Nvidia GeForce и профессиональных карт Nvidia Quadro, карты Tesla изначально не могли выводить изображения на дисплей . Однако последние продукты Tesla C-класса включали один порт Dual-Link DVI.
В рамках проекта Denver Nvidia намеревается встраивать процессорные ядра ARMv8 в свои графические процессоры. Это будет 64-битное продолжение 32-битных чипов Tegra .
Тесла Р100 использует TSMC «с 16 нанометрового FinFET процесс изготовления полупроводниковых , который является более продвинутой , чем 28-нанометрового процесса , ранее используемого AMD и Nvidia GPU , между 2012 и 2016 Р100 также использует Samsung » ы HBM2 памяти.
Приложения
Продукты Tesla в основном используются для моделирования и крупномасштабных вычислений (особенно вычислений с плавающей запятой), а также для создания высококачественных изображений в профессиональных и научных областях.
В 2013 году на оборонную промышленность приходилось менее одной шестой продаж Tesla, но Сумит Гупта прогнозировал увеличение продаж на рынке геопространственной разведки .
Характеристики
Модель |
Микро- архитектура |
Запуск | Чипсы | Частота ядра ( МГц ) |
Шейдеры | объем памяти | Вычислительная мощность ( GFLOPS ) | Вычислительная способность CUDA |
TDP (Вт) |
Примечания, form_factor | ||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Ядра Cuda (всего) |
Базовая частота ( МГц ) | Макс. Частота разгона ( МГц ) |
Тип автобуса | Ширина шины ( бит ) |
Размер ( ГБ ) |
Часы ( МТ / с ) |
Пропускная способность ( ГБ / с) |
Одинарная точность (MAD + MUL) |
Одинарная точность (MAD или FMA ) |
Двойная точность ( FMA ) |
||||||||
Единицы | МГц | МГц | W | |||||||||||||||
Вычислительный модуль C870 GPU | Тесла | 2 мая 2007 г. | 1 × G80 | 600 | 128 | 1350 | N / A | GDDR3 | 384 | 1.5 | 1600 | 76,8 | 518,4 | 345,6 | Нет | 1.0 | 170,9 | Внутренний графический процессор PCIe (полноразмерный, с двумя слотами) |
Настольный компьютер D870 | 2 мая 2007 г. | 2 × G80 | 600 | 256 | 1350 | N / A | GDDR3 | 2 × 384 | 2 × 1,5 | 1600 | 2 × 76,8 | 1036,8 | 691,2 | Нет | 1.0 | 520 | Внешние графические процессоры для настольного монтажа или монтажа в стойку 3U | |
Вычислительный сервер S870 GPU | 2 мая 2007 г. | 4 × G80 | 600 | 512 | 1350 | N / A | GDDR3 | 4 × 384 | 4 × 1,5 | 1600 | 4 × 76,8 | 2073,6 | 1382,4 | Нет | 1.0 | Внешние графические процессоры высотой 1U для монтажа в стойку , подключение через 2 × PCIe (× 16) | ||
Вычислительный модуль C1060 GPU | 9 апреля 2009 г. | 1 × GT200 | 602 | 240 | 1296 | N / A | GDDR3 | 512 | 4 | 1600 | 102,4 | 933,12 | 622,08 | 77,76 | 1.3 | 187,8 | Внутренний графический процессор PCIe (полноразмерный, с двумя слотами) | |
Вычислительный сервер S1070 GPU "400 конфигурация" | 1 июня 2008 г. | 4 × GT200 | 602 | 960 | 1296 | N / A | GDDR3 | 4 × 512 | 4 × 4 | 1538,4 | 4 × 98,5 | 3732,5 | 2488,3 | 311,0 | 1.3 | 800 | Внешние графические процессоры высотой 1U для монтажа в стойку , подключение через 2 × PCIe (× 8 или × 16) | |
Вычислительный сервер S1070 GPU "конфигурация 500" | 1440 | N / A | 4147,2 | 2764,8 | 345,6 | |||||||||||||
Вычислительный сервер S1075 GPU | 1 июня 2008 г. | 4 × GT200 | 602 | 960 | 1440 | N / A | GDDR3 | 4 × 512 | 4 × 4 | 1538,4 | 4 × 98,5 | 4147,2 | 2764,8 | 345,6 | 1.3 | Внешние графические процессоры высотой 1U для монтажа в стойку , подключение через 1 × PCIe (× 8 или × 16) | ||
Система визуальных вычислений Quadro Plex 2200 D2 | 2 × GT200GL | 648 | 480 | 1296 | N / A | GDDR3 | 2 × 512 | 2 × 4 | 1600 | 2 × 102,4 | 1866,2 | 1244,2 | 155,5 | 1.3 | Внешние графические процессоры для настольного монтажа или монтажа в стойку высотой 3U с 4 двухканальными выходами DVI | |||
Система визуальных вычислений Quadro Plex 2200 S4 | 4 × GT200GL | 648 | 960 | 1296 | N / A | GDDR3 | 4 × 512 | 4 × 4 | 1600 | 4 × 102,4 | 3732,5 | 2488,3 | 311,0 | 1.3 | 1200 | Внешние графические процессоры высотой 1U для монтажа в стойку , подключение через 2 × PCIe (× 8 или × 16) | ||
Вычислительный модуль C2050 GPU | Ферми | 25 июля 2011 г. | 1 × GF100 | 575 | 448 | 1150 | N / A | GDDR5 | 384 | 3 | 3000 | 144 | Нет | 1030,4 | 515,2 | 2.0 | 247 | Внутренний графический процессор PCIe (полноразмерный, с двумя слотами) |
Вычислительный модуль M2050 GPU | 25 июля 2011 г. | N / A | 3092 | 148,4 | Нет | 225 | ||||||||||||
Вычислительный модуль C2070 GPU | 25 июля 2011 г. | 1 × GF100 | 575 | 448 | 1150 | N / A | GDDR5 | 384 | 6 | 3000 | 144 | Нет | 1030,4 | 515,2 | 2.0 | 247 | Внутренний графический процессор PCIe (полноразмерный, с двумя слотами) | |
Вычислительный модуль C2075 GPU | 25 июля 2011 г. | N / A | 3000 | 144 | Нет | 225 | ||||||||||||
Вычислительный модуль M2070 / M2070Q GPU | 25 июля 2011 г. | N / A | 3132 | 150,336 | Нет | 225 | ||||||||||||
Вычислительный модуль M2090 GPU | 25 июля 2011 г. | 1 × GF110 | 650 | 512 | 1300 | N / A | GDDR5 | 384 | 6 | 3700 | 177,6 | Нет | 1331,2 | 665,6 | 2.0 | 225 | Внутренний графический процессор PCIe (полноразмерный, с двумя слотами) | |
Вычислительный сервер S2050 GPU | 25 июля 2011 г. | 4 × GF100 | 575 | 1792 | 1150 | N / A | GDDR5 | 4 × 384 | 4 × 3 | 3 | 4 × 148,4 | Нет | 4121,6 | 2060,8 | 2.0 | 900 | Внешние графические процессоры высотой 1U для монтажа в стойку , подключение через 2 × PCIe (× 8 или × 16) | |
Вычислительный сервер S2070 GPU | N / A | 4 × 6 | Нет | |||||||||||||||
Графический ускоритель K10 | Кеплер | 1 мая 2012 г. | 2 × ГК104 | N / A | 3072 | 745 | ? | GDDR5 | 2 × 256 | 2 × 4 | 5000 | 2 × 160 | Нет | 4577 | 190,7 | 3.0 | 225 | Внутренний графический процессор PCIe (полноразмерный, с двумя слотами) |
Графический ускоритель K20 | 12 ноября 2012 г. | 1 × GK110 | N / A | 2496 | 706 | 758 | GDDR5 | 320 | 5 | 5200 | 208 | Нет | 3524 | 1175 | 3.5 | 225 | Внутренний графический процессор PCIe (полноразмерный, с двумя слотами) | |
Графический ускоритель K20X | 12 ноября 2012 г. | 1 × GK110 | N / A | 2688 | 732 | ? | GDDR5 | 384 | 6 | 5200 | 250 | Нет | 3935 | 1312 | 3.5 | 235 | Внутренний графический процессор PCIe (полноразмерный, с двумя слотами) | |
Графический ускоритель K40 | 8 октября 2013 г. | 1 × ГК110Б | N / A | 2880 | 745 | 875 | GDDR5 | 384 | 12 | 6000 | 288 | Нет | 4291–5040 | 1430–1680 | 3.5 | 235 | Внутренний графический процессор PCIe (полноразмерный, с двумя слотами) | |
Графический ускоритель K80 | 17 ноября 2014 г. | 2 × ГК210 | N / A | 4992 | 560 | 875 | GDDR5 | 2 × 384 | 2 × 12 | 5000 | 2 × 240 | Нет | 5591–8736 | 1864–2912 | 3,7 | 300 | Внутренний графический процессор PCIe (полноразмерный, с двумя слотами) | |
Графический ускоритель M4 | Максвелл | 10 ноября 2015 г. | 1 × GM206 | N / A | 1024 | 872 | 1072 | GDDR5 | 128 | 4 | 5500 | 88 | Нет | 1786–2195 | 55,81–68,61 | 5.2 | 50–75 | Внутренний графический процессор PCIe (половинной высоты, один слот) |
Графический ускоритель M6 | 30 августа 2015 г. | 1 × GM204-995-A1 | N / A | 1536 | 722 | 1051 | GDDR5 | 256 | 8 | 4600 | 147,2 | Нет | 2218–3229 | 69,3–100,9 | 5.2 | 75–100 | Внутренний графический процессор MXM | |
Графический ускоритель M10 | 4 × GM107 | N / A | 2560 | 1033 | ? | GDDR5 | 4 × 128 | 4 × 8 | 5188 | 4 × 83 | Нет | 5289 | 165,3 | 5.2 | 225 | Внутренний графический процессор PCIe (полноразмерный, с двумя слотами) | ||
Графический ускоритель M40 | 10 ноября 2015 г. | 1 × GM200 | N / A | 3072 | 948 | 1114 | GDDR5 | 384 | 12 | 6000 | 288 | Нет | 5825–6844 | 182,0–213,9 | 5.2 | 250 | Внутренний графический процессор PCIe (полноразмерный, с двумя слотами) | |
Графический ускоритель M60 | 30 августа 2015 г. | 2 × GM204-895-A1 | N / A | 4096 | 899 | 1178 | GDDR5 | 2 × 256 | 2 × 8 | 5000 | 2 × 160 | Нет | 7365–9650 | 230,1–301,6 | 5.2 | 225–300 | Внутренний графический процессор PCIe (полноразмерный, с двумя слотами) | |
Графический ускоритель P4 | Паскаль | 13 сентября 2016 г. | 1 × GP104 | N / A | 2560 | 810 | 1063 | GDDR5 | 256 | 8 | 6000 | 192,0 | Нет | 4147–5443 | 129,6–170,1 | 6.1 | 50-75 | Карта PCIe |
Графический ускоритель P6 | 24 марта 2017 г. | 1 × GP104-995-A1 | N / A | 2048 | 1012 | 1506 | GDDR5 | 256 | 16 | 3003 | 192,2 | Нет | 6169 | 192,8 | 6.1 | 90 | Карта MXM | |
Графический ускоритель P40 | 13 сентября 2016 г. | 1 × GP102 | N / A | 3840 | 1303 | 1531 | GDDR5 | 384 | 24 | 7200 | 345,6 | Нет | 10007–11758 | 312,7–367,4 | 6.1 | 250 | Карта PCIe | |
Графический ускоритель P100 (мезонин) | 5 апреля 2016 г. | 1 × GP100-890-A1 | N / A | 3584 | 1328 | 1480 | HBM2 | 4096 | 16 | 1430 | 732 | Нет | 9519–10609 | 4760–5304 | 6.0 | 300 | Карта NVLink | |
Графический ускоритель P100 (карта 16 ГБ) | 20 июня 2016 г. | 1 × GP100 | N / A | 1126 | 1303 | Нет | 8071‒9340 | 4036‒4670 | 250 | Карта PCIe | ||||||||
Графический ускоритель P100 (карта 12 ГБ) | 20 июня 2016 г. | N / A | 3072 | 12 | 549 | Нет | 8071‒9340 | 4036‒4670 | ||||||||||
GPU-ускоритель V100 (мезонин) | Вольта | 1 × GV100-895-A1 | N / A | 5120 | Неизвестный | 1455 | HBM2 | 4096 | 16 или 32 | 1750 | 900 | Нет | 14899 | 7450 | 7.0 | 300 | Карта NVlink | |
Ускоритель графического процессора V100 (карта PCIe) | 21 июня 2017 г. | 1 × GV100 | N / A | Неизвестный | 1370 | Нет | 14028 | 7014 | 250 | Карта PCIe | ||||||||
Графический ускоритель V100 (карта PCIe FHHL) | 27 марта 2018 г. | 1 × GV100 | N / A | 937 | 1290 | 16 | 1620 | 829,44 | Нет | 13210 | 6605 | 250 | Карта PCIe FHHL | |||||
Графический ускоритель T4 (карта PCIe) | Тьюринг | 12 сентября 2018 г. | 1 × ТУ104-895-А1 | N / A | 2560 | 585 | 1590 | GDDR6 | 256 | 16 | Неизвестный | 320 | Нет | 8100 | Неизвестный | 7,5 | 70 | Карта PCIe |
Ускоритель графического процессора A10 (карта PCIe) | Ампер | 12 апреля 2021 г. | 1 × GA102-890-A1 | N / A | 9216 | 885 | 1695 | GDDR6 | 384 | 24 | Неизвестный | 600 | Нет | 31240 | 976 | 8,6 | 150 | Карта PCIe (однослотовая) |
Графический ускоритель A16 (карта PCIe) | 12 апреля 2021 г. | 4 × GA107 | N / A | 10240 | 885 | 1695 | GDDR6 | 4x 128 | 4x 16 | Неизвестный | 4x 231,9 | Нет | 34712 | 1084,8 | 8,6 | 250 | Карта PCIe (двухслотовая) | |
Графический ускоритель A30 (карта PCIe) | 12 апреля 2021 г. | 1 × GA100 | N / A | 3584 | 930 | 1440 | HBM2 | 3072 | 24 | Неизвестный | 933,1 | Нет | 10320 | 5161 | 8.0 | 165 | Карта PCIe (двухслотовая) | |
Ускоритель графического процессора A40 (карта PCIe) | 5 октября 2020 г. | 1 × GA102 | N / A | 10752 | 1305 | 1740 г. | GDDR6 | 384 | 48 | Неизвестный | 695,8 | Нет | 37420 | 1168 | 8,6 | 300 | Карта PCIe (двухслотовая) | |
Ускоритель графического процессора A100 (карта PCIe) | 14 мая 2020 | 1 × GA100-883AA-A1 | N / A | 6912 | 765 | 1410 | HBM2 | 5120 | 40 | Неизвестный | 1555 | Нет | 19500 | 9700 | 8.0 | 250 | Карта PCIe | |
Модель |
Микро- архитектура |
Запуск | Чипсы | Частота ядра ( МГц ) |
Шейдеры | объем памяти | Вычислительная мощность ( GFLOPS ) | Вычислительная способность CUDA |
TDP (Вт) |
Примечания, форм-фактор | ||||||||
Ядра Cuda (всего) |
Базовая частота ( МГц ) | Макс. Частота разгона ( МГц ) |
Тип автобуса | Ширина шины ( бит ) |
Размер ( ГБ ) |
Часы ( МТ / с ) |
Пропускная способность (общая) ( ГБ / с) |
Одинарная точность (MAD + MUL) |
Одинарная точность (MAD или FMA ) |
Двойная точность ( FMA ) |
Примечания
Смотрите также
- Список графических процессоров Nvidia
- Персональный суперкомпьютер Nvidia Tesla
- Ампер (микроархитектура)
- Fastra II