Ջիմ Քելլերի գլխավորած չիպերի արտադրող Tenstorrent ընկերությունը թողարկել է իր նոր սերնդի Wormhole պրոցեսորը արհեստական ինտելեկտի աշխատանքային բեռների համար, որը, ինչպես կանխատեսվում է, կապահովի լավ կատարողականություն մատչելի գնով։Ընկերությունն այժմ առաջարկում է երկու լրացուցիչ PCIe քարտեր, որոնք կարող են տեղավորել մեկ կամ երկու Wormhole պրոցեսոր, ինչպես նաև TT-LoudBox և TT-QuietBox աշխատանքային կայաններ ծրագրային ապահովման մշակողների համար: Այսօրվա բոլոր հայտարարությունները ուղղված են մշակողներին, այլ ոչ թե նրանց, ովքեր օգտագործում են Wormhole տախտակներ առևտրային աշխատանքային բեռների համար:
«Միշտ հաճելի է մեր արտադրանքի ավելի շատ մասը մշակողների ձեռքը հասցնելը: Մեր Wormhole™ քարտերն օգտագործող թողարկումների մշակման համակարգերը կարող են օգնել մշակողներին ընդլայնվել և մշակել բազմակիպ արհեստական բանականության ծրագրակազմ», - ասաց Tenstorrent-ի գործադիր տնօրեն Ջիմ Քելլերը:Այս թողարկումից բացի, մենք ոգևորված ենք տեսնելու մեր երկրորդ սերնդի՝ Blackhole արտադրանքի ժապավենի թողարկման և հզորացման հետ կապված մեր առաջընթացը։

Յուրաքանչյուր Wormhole պրոցեսոր պարունակում է 72 Tensix միջուկ (որոնցից հինգը աջակցում են RISC-V միջուկներ տարբեր տվյալների ձևաչափերով) և 108 ՄԲ SRAM, որը ապահովում է 262 FP8 TFLOPS 1 ԳՀց հաճախականությամբ և 160 Վտ ջերմային նախագծային հզորությամբ: Միաչիպային Wormhole n150 քարտը հագեցած է 12 ԳԲ GDDR6 տեսահիշողությամբ և ունի 288 ԳԲ/վ թողունակություն:
Wormhole պրոցեսորները ապահովում են ճկուն մասշտաբայնություն՝ աշխատանքային բեռների բազմազան կարիքները բավարարելու համար: Չորս Wormhole n300 քարտերով ստանդարտ աշխատանքային կայանի դեպքում պրոցեսորները կարող են միավորվել մեկ միավորի մեջ, որը ծրագրում հայտնվում է որպես միասնական, լայն Tensix միջուկային ցանց: Այս կոնֆիգուրացիան թույլ է տալիս արագացուցիչին կարգավորել նույն աշխատանքային բեռնվածությունը, բաժանել չորս մշակողների միջև կամ միաժամանակ աշխատեցնել մինչև ութ տարբեր արհեստական բանականության մոդելներ: Այս մասշտաբայնության հիմնական առանձնահատկությունն այն է, որ այն կարող է աշխատել տեղական մակարդակով՝ առանց վիրտուալիզացիայի անհրաժեշտության: Տվյալների կենտրոնի միջավայրում Wormhole պրոցեսորները կօգտագործեն PCIe՝ մեքենայի ներսում ընդլայնման համար, կամ Ethernet՝ արտաքին ընդլայնման համար:
Արդյունավետության առումով, Tenstorrent-ի միաչիպ Wormhole n150 քարտը (72 Tensix միջուկ, 1 GHz հաճախականություն, 108 MB SRAM, 12 GB GDDR6, 288 GB/s թողունակություն) հասել է 262 FP8 TFLOPS-ի 160 Վտ հզորությամբ, մինչդեռ երկակի չիպ Wormhole n300 քարտը (128 Tensix միջուկ, 1 GHz հաճախականություն, 192 MB SRAM, ագրեգացված 24 GB GDDR6, 576 GB/s թողունակություն) ապահովում է մինչև 466 FP8 TFLOPS 300 Վտ հզորությամբ։
466 FP8 TFLOPS-ի 300 Վտ հզորությունը համատեքստում դնելու համար մենք այն կհամեմատենք արհեստական բանականության շուկայի առաջատար Nvidia-ի առաջարկածի հետ այս ջերմային նախագծման հզորությամբ: Nvidia-ի A100-ը չի աջակցում FP8-ին, բայց աջակցում է INT8-ին՝ 624 TOPS (1,248 TOPS՝ նոսր ռեժիմում) առավելագույն արդյունավետությամբ: Համեմատության համար, Nvidia-ի H100-ը աջակցում է FP8-ին և հասնում է 1,670 TFLOPS առավելագույն արդյունավետության 300 Վտ-ում (3,341 TFLOPS՝ նոսր ռեժիմում), ինչը զգալիորեն տարբերվում է Tenstorrent-ի Wormhole n300-ից:
Այնուամենայնիվ, կա մեկ լուրջ խնդիր։ Tenstorrent-ի Wormhole n150-ը վաճառվում է 999 դոլարով, մինչդեռ n300-ը՝ 1399 դոլարով։ Համեմատության համար, մեկ Nvidia H100 տեսաքարտը վաճառվում է 30,000 դոլարով՝ կախված քանակից։ Իհարկե, մենք չգիտենք, թե արդյոք չորս, թե ութ Wormhole պրոցեսորները կարող են իրականում ապահովել մեկ H300-ի արտադրողականությունը, բայց դրանց TDP-ները համապատասխանաբար 600 Վտ և 1200 Վտ են։
Բացի քարտերից, Tenstorrent-ը առաջարկում է նախապես կառուցված աշխատանքային կայաններ մշակողների համար, այդ թվում՝ 4 n300 քարտեր ավելի մատչելի Xeon-ի վրա հիմնված TT-LoudBox-ում՝ ակտիվ սառեցմամբ, և առաջադեմ TT-QuietBox-ը՝ EPYC-ի վրա հիմնված Xiaolong հեղուկային սառեցման գործառույթով։
Հրապարակման ժամանակը. Հուլիս-29-2024