գործի պաստառ

Արդյունաբերության նորություններ. Ջիմ Քելլերը գործարկել է նոր RISC-V չիպ

Արդյունաբերության նորություններ. Ջիմ Քելլերը գործարկել է նոր RISC-V չիպ

Ջիմ Քելլերի գլխավորած չիպերային Tenstorrent ընկերությունը թողարկել է իր հաջորդ սերնդի Wormhole պրոցեսորը AI աշխատանքային ծանրաբեռնվածության համար, որն ակնկալում է լավ կատարողականություն առաջարկել մատչելի գնով:Ընկերությունը ներկայումս առաջարկում է երկու լրացուցիչ PCIe քարտեր, որոնք կարող են տեղավորել մեկ կամ երկու Wormhole պրոցեսոր, ինչպես նաև TT-LoudBox և TT-QuietBox աշխատանքային կայաններ ծրագրային ապահովման մշակողների համար: Այսօրվա բոլոր հայտարարություններն ուղղված են մշակողներին, այլ ոչ թե նրանց, ովքեր օգտագործում են Wormhole տախտակները կոմերցիոն ծանրաբեռնվածության համար:

«Միշտ ուրախալի է մեր արտադրանքի ավելի շատ ձեռք բերել մշակողների ձեռքը: Մեր Wormhole™ քարտերի օգտագործմամբ թողարկվող զարգացման համակարգերը կարող են օգնել ծրագրավորողներին մեծացնել և զարգացնել բազմակի չիպային AI ծրագրակազմը», - ասել է Tenstorrent-ի գործադիր տնօրեն Ջիմ Քելլերը:Ի հավելումն այս մեկնարկի, մենք ոգևորված ենք տեսնելով այն առաջընթացը, որը մենք գրանցում ենք մեր երկրորդ սերնդի արտադրանքի՝ Blackhole-ի ժապավենի անջատման և հզորացման միջոցով»:

1

Յուրաքանչյուր Wormhole պրոցեսոր պարունակում է 72 Tensix միջուկներ (որոնցից հինգը աջակցում են RISC-V միջուկներին տվյալների տարբեր ձևաչափերով) և 108 ՄԲ SRAM, որն ապահովում է 262 FP8 TFLOPS 1 ԳՀց հաճախականությամբ 160 Վտ ջերմային նախագծման հզորությամբ: Մեկ չիպով Wormhole n150 քարտը հագեցած է 12 ԳԲ GDDR6 տեսահիշողությամբ և ունի 288 ԳԲ/վ թողունակություն։

Wormhole պրոցեսորներն ապահովում են ճկուն մասշտաբայնություն՝ բավարարելու աշխատանքային բեռների բազմազան կարիքները: Չորս Wormhole n300 քարտերով ստանդարտ աշխատանքային կայանի տեղադրման դեպքում պրոցեսորները կարող են միավորվել մեկ միավորի մեջ, որը հայտնվում է ծրագրային ապահովման մեջ որպես միասնական, լայն Tensix հիմնական ցանց: Այս կոնֆիգուրացիան թույլ է տալիս արագացուցիչին կարգավորել նույն ծանրաբեռնվածությունը, բաժանվել չորս մշակողների միջև կամ միաժամանակ գործարկել մինչև ութ տարբեր AI մոդելներ: Այս մասշտաբայնության հիմնական առանձնահատկությունն այն է, որ այն կարող է աշխատել լոկալ առանց վիրտուալացման անհրաժեշտության: Տվյալների կենտրոնի միջավայրում Wormhole պրոցեսորները կօգտագործեն PCIe՝ մեքենայի ներսում ընդլայնման համար, կամ Ethernet՝ արտաքին ընդլայնման համար:

Ինչ վերաբերում է կատարողականությանը, Tenstorrent-ի մեկ չիպով Wormhole n150 քարտը (72 Tensix միջուկ, 1 ԳՀց հաճախականություն, 108 ՄԲ SRAM, 12 ԳԲ GDDR6, 288 ԳԲ/վ թողունակություն) հասել է 262 FP8 TFLOPS՝ 160WW30, 160W30, իսկ the du: (128 Tensix միջուկ, 1 ԳՀց հաճախականություն, 192 ՄԲ SRAM, ագրեգացված 24 ԳԲ GDDR6, 576 ԳԲ/վ թողունակություն) ապահովում է մինչև 466 FP8 TFLOPS 300 Վտ հզորությամբ:

466 FP8 TFLOPS-ի 300 Վտ հզորությունը համատեքստի մեջ դնելու համար մենք այն կհամեմատենք արհեստական ​​ինտելեկտի շուկայի առաջատար Nvidia-ի հետ այս ջերմային դիզայնի հզորությամբ: Nvidia-ի A100-ը չի աջակցում FP8-ին, սակայն այն աջակցում է INT8-ին՝ 624 TOPS-ի առավելագույն կատարողականությամբ (1248 TOPS, երբ հազվադեպ է): Համեմատության համար, Nvidia-ի H100-ն աջակցում է FP8-ին և հասնում է 1670 TFLOPS-ի գագաթնակետին 300 Վտ հզորությամբ (3341 TFLOPS նոսրով), ինչը զգալիորեն տարբերվում է Tenstorrent-ի Wormhole n300-ից:

Այնուամենայնիվ, կա մեկ հիմնական խնդիր. Tenstorrent-ի Wormhole n150-ը վաճառվում է 999 դոլարով, մինչդեռ n300-ը վաճառվում է 1399 դոլարով: Համեմատության համար նշենք, որ մեկ Nvidia H100 գրաֆիկական քարտը վաճառվում է $30,000-ով՝ կախված քանակից: Իհարկե, մենք չգիտենք, թե չորս կամ ութ Wormhole պրոցեսորները կարող են իրականում ապահովել մեկ H300-ի կատարումը, բայց դրանց TDP-ները համապատասխանաբար 600W և 1200W են:

Բացի քարտերից, Tenstorrent-ն առաջարկում է նախապես կառուցված աշխատանքային կայաններ մշակողների համար, այդ թվում՝ 4 n300 քարտեր ավելի մատչելի Xeon-ի վրա հիմնված TT-LoudBox-ում՝ ակտիվ սառեցմամբ, և առաջադեմ TT-QuietBox-ը՝ EPYC-ի վրա հիմնված Xiaolong) հեղուկ սառեցման գործառույթով):


Հրապարակման ժամանակը՝ Հուլիս-29-2024