Нвидиа ГПУ-ови су прешли дуг пут, не само у погледу перформанси игара већ иу другим апликацијама, посебно вештачкој интелигенцији и машинском учењу. Два главна фактора одговорна за перформансе Нвидиа ГПУ-а су ЦУДА и Тенсор језгра присутна на скоро сваком модерном Нвидиа ГПУ-у који можете купити.

Али шта тачно раде ова језгра, и ако се обоје користе у апликацијама за вештачку интелигенцију и машинско учење, по чему се разликују?

Шта су ЦУДА језгра и за шта се користе?

ЦУДА је скраћеница од Цомпуте Унифиед Девице Арцхитецтуре, која не објашњава много њиховог присуства у ГПУ-у. Ова језгра су уведена у Нвидиа ГПУ линију у Маквелл архитектури за 2014. и специјализована су за паралелну обраду.

Они су прилично слични ЦПУ језгрима у смислу њиховог функционисања, али су бољи у руковању одређеним задатке, укључујући криптографске хешове, физичке машине, пројекте везане за науку о подацима, па чак и игре развој.

Кредит за слику: Нвидиа

Док смо већ покрили како ЦУДА језгра утичу на перформансе играња вашег рачунара

instagram viewer
, једнако су корисни у одређивању бројева. Иако чак и најмоћнији ЦПУ-ови имају језгра са двоцифреном цифром, Нвидиа ГПУ-ови долазе са неколико хиљада ЦУДА језгара што их чини много бржим при нумеричким радним оптерећењима. Поред тога, пошто они раде ове прорачуне паралелно, добијате много веће брзине са ЦУДА језграма.

ЦУДА језгра су бржа од стандардних ЦПУ језгара када су у питању критични бројеви, али још увек нису идеално решење. То је зато што никада нису били намењени да се користе на тај начин. ЦУДА језгра су наменски направљена за графичку обраду и да би Нвидиа ГПУ-ови били способнији за перформансе игара.

Шта су тензорска језгра и за шта се користе?

Како су ГПУ-ови почели да се користе за радна оптерећења вештачке интелигенције и машинског учења, Нвидиа је увела Тенсор језгра у Волта архитектуру за своје ГПУ-ове центара података почевши од 2017.

Међутим, требало је до Нвидиа Туринг архитектуре (РТКС 20-серије ГПУ) да ова језгра дођу до потрошачких ГПУ-а. Запамтити да иако су картице ГТКС 16 серије такође засноване на Туринг архитектури, оне не укључују праћење зрака или тензор језгра.

Док су ЦУДА језгра у најбољем случају била адекватна за рачунарска оптерећења, Тенсор језгра су повећала предност тиме што су била знатно бржа. Док ЦУДА језгра могу да изврше само једну операцију по циклусу такта, Тенсор језгра могу да обрађују више операција, дајући им невероватно повећање перформанси. У основи, све што Тенсор језгра раде је повећање брзине множења матрице.

Ово повећање брзине рачунара долази по цену тачности, при чему су ЦУДА језгра знатно прецизнија. Међутим, када је у питању обучавање модела машинског учења, Тенсор језгра су далеко ефикаснија у смислу брзине рачунара и укупне цене; стога се губитак у тачности често занемарује.

Како Тенсор и ЦУДА језгра утичу на перформансе ГПУ-а?

Као што до сада вероватно можете да претпоставите, док ЦУДА и Тенсор језгра могу да поднесу иста радна оптерећења, оба су специјализована језгра за графичко приказивање и нумеричка радна оптерећења, респективно.

То значи да ће у зависности од корисника коме је одређени ГПУ намењен, имати различит број језгара. На пример, ако узмемо у обзир РТКС 4090, Нвидијин најновији и најбољи графички процесор за игрице намењен потрошачима, добићете далеко више ЦУДА језгара него Тенсор језгара. 16.384 ЦУДА језгра до 512 Тенсор језгара, да будемо прецизни.

За поређење, Нвидиа Л40 ГПУ за дата центре, заснован на истој архитектури Ада Ловелаце као и РТКС 4090, има 18.176 ЦУДА језгара и 568 Тенсор језгара. Ово можда не изгледа као велика разлика, али може значајно утицати на перформансе ових ГПУ-ова.

Што се тиче теоретских перформанси, Л40 има 90,52 ТФлопса ФП16 и ФП32 перформанси, као и 1,414 ГФлопса ФП64 перформанси. Ово је огромно повећање перформанси у поређењу са 82,58 ТФлопса ФП16 и ФП32 перформанси РТКС 4090 и 1290 ГФлопс ФП64 перформанси.

Осим ако нисте добро упућени у бројеве нумеричких перформанси ГПУ-а, горе наведене бројке перформанси Нвидиа ГПУ-а у покретном зарезу можда вам неће много значити. Међутим, укратко, они показују да је Л40 много бржи од РТКС 4090 када су у питању нумерички прорачуни - они потребни за радна оптерећења заснована на вештачкој интелигенцији и машинском учењу.

Побољшање перформанси постаје још импресивније када се узме у обзир потрошња енергије два ГПУ-а. РТКС 4090 има оцену ТГП (да се не меша са ТДП-ом, постоји мала разлика) од 450В, док је Л40 оцењен на само 300В.

Оба ова ГПУ-а ће одлично покретати игре и тренирати ваш модел машинског учења. Међутим, РТКС 4090 ће бити бољи у покретању игара, а Л40 ће бити бољи у обуци модела машинског учења.

ЦУДА Цорес вс. Тензорска језгра: шта је важније?

Оба језгра су подједнако важна, без обзира да ли купујете свој ГПУ за играње игара или га стављате у рацк центра података. Нвидијини графички процесори за играње намењени потрошачима користе гомилу АИ функција (највише ДЛСС), а поседовање Тенсор језгара може бити од користи.

Што се тиче ГПУ-ова центара података, ЦУДА и Тенсор језгра ионако раде у тандему већину времена, тако да ћете добити оба без обзира на ГПУ који одаберете. Уместо да се фокусирате на одређени тип језгра у вашем ГПУ-у, требало би да се више фокусирате на оно што графичка картица ради у целини и на тип корисника коме је намењена.

ЦУДА језгра су специјализована за руковање графичким радним оптерећењима, док су Тенсор језгра боља у нумеричким. Они раде заједно и у извесној мери су заменљиви, али се баве сопственим специјализацијама, због чега и постоје.

Различити ГПУ-ови су специјализовани за различите аспекте. РТКС 4090 ће лако уништити сваку игру коју баците на њега, док РТКС 4060 може да поднесе само играње од 1080п. Ако не играте игрице користећи свој ГПУ и потребан вам је само за брушење бројева или обуку неуронских мрежа, ГПУ за центар података А серије као што је А100 или чак Л40 је ваша најбоља опклада.

Ваша ГПУ језгра су битна

Више ГПУ језгара ће вам дати боље укупне перформансе јер ће ваш ГПУ бити свестранији и имати наменске ресурсе за руковање различитим задацима. Међутим, слепо добијање ГПУ-а са највећим бројем језгара није најбоља одлука. Одвојите тренутак да пажљиво размотрите свој случај употребе, погледајте могућности ГПУ-а у целини, а затим направите свој избор.