Արհեստական բանականության (ԱԲ) ոլորտում Nvidia-ի ճարտարապետական հեգեմոնիան սկսում է բախվել ապակենտրոնացման իր առաջին իրական փորձությանը: Վերջին մի քանի տարիների ընթացքում «Nvidia-ի հարկը»՝ H100 և Blackwell բարձրակարգ գրաֆիկական պրոցեսորներ (GPU) ձեռք բերելու հսկայական ծախսերը, ցանկացած ձեռնարկության համար դարձել էին անփոխարինելի կետ, եթե նրանք լրջորեն մտադիր էին մասշտաբավորել խոշոր լեզվական մոդելները (LLM): Այնուամենայնիվ, տեղի է ունենում տեկտոնական տեղաշարժ: Ուղղահայաց ինտեգրմանն անցնելով՝ ոլորտի հսկաները փորձում են չեզոքացնել մատակարարման շղթայի այն խցանումը, որը բնորոշ էր 2022-ից հետո սկսված ԱԲ-ի «ոսկե տենդին»:
OpenAI-ի և Broadcom-ի ռազմավարական գործընկերության արդյունքում ստեղծված Jalapeño մասնագիտացված ինֆերենսային (inference) չիպի ի հայտ գալը բեկումնային պահ է: Սա պարզապես ավելի արագ պրոցեսոր ստեղծելու փորձ չէ, այլ՝ հաշվարկված կառուցվածքային տեղաշարժ: OpenAI-ը, ինչպես և հիպերսկեյլերների (hyperscaler) ոլորտի իր գործընկերները, ձգտում է իր ենթակառուցվածքային ծախսերն անջատել մեկ մատակարարից կախվածության անկայունությունից:
Մասնագիտացված սիլիցիումի տնտեսագիտությունը. ընդհանուրից դեպի մասնավոր
Ձեռնարկության ղեկավարի համար ներքին արտադրության սիլիցիումի ի հայտ գալը ոչ միայն սարքավորումային նորություն է, այլ ԱԲ նախագծերի ներդրումների հետգնման (ROI) բնույթի հիմնարար փոփոխություն: Նախկինում ընկերությունները ստիպված էին ինֆերենսը՝ ԱԲ մոդելները գործարկելու գործընթացը, իրականացնել բարձրակարգ ուսուցողական չիպերի վրա, որոնք չափազանց հզոր էին և թանկ՝ կոնկրետ առաջադրանքների համար:
Jalapeño նախաձեռնությունը վկայում է դոմենային հատուկ ճարտարապետության (domain-specific architecture) անցման մասին: Երբ մոդելը հատուկ ստեղծված է որոշակի տեսակի սիլիցիումի վրա աշխատելու համար, արդյունավետության աճը լինում է էքսպոնենցիալ: Բիզնեսի ղեկավարների համար մասնագիտացված ենթակառուցվածքին անցումը մի քանի առանցքային առավելություն է տալիս.
- Ծախսերի կանխատեսելիություն. Երրորդ կողմի GPU-ների հատկացումներից կախվածության նվազեցումն օգնում է կայունացնել ԱԲ-ին միտված աշխատանքային հոսքերի երկարաժամկետ գործառնական ծախսերը (OpEx):
- Ջերմային և էներգետիկ արդյունավետություն. Ինֆերենսի համար օպտիմալացված հատուկ չիպերը զգալիորեն քիչ էներգիա են սպառում, ինչը կենսական ցուցանիշ է լայնածավալ տվյալների կենտրոններ կամ edge-computing միջավայրեր շահագործող ընկերությունների համար:
- Հապաղման նվազեցում. Սարքավորում-ծրագրակազմ կապը օպտիմալացնելու միջոցով բիզնեսները կարող են հասնել գրեթե ակնթարթային արձագանքման, ինչը նախապայման է իրական ժամանակում աշխատող CRM-ներում կամ հաճախորդների ավտոմատացված սպասարկման համակարգերում գործող ԱԲ գործակալների (AI agents) համար:
Այս տեղաշարժը նման է «Apple silicon»-ի ուղուն: Ինչպես Apple-ը փոխեց իր կատարողական ցուցանիշները՝ M-սերիայի չիպերը նախագծելով իր ծրագրային ապահովման հետ կատարյալ ինտեգրվելու համար, այնպես էլ OpenAI-ը խաղադրույք է կատարում այն բանի վրա, որ սարքավորումային շերտը վերահսկելով՝ իր օգտատերերին կարող է առաջարկել ավելի կայուն, հուսալի և ծախսարդյունավետ ԱԲ գործիքներ:
Ապամիջնորդավորման ռազմավարությունը
Սեփական սիլիցիում ստեղծող ընկերությունների ցանկը՝ Google-ը իր TPU-ներով, Apple-ը՝ Neural Engine-ով և SpaceX-ը՝ ներքին հատուկ լուծումներով, հստակ օրինաչափություն է ցույց տալիս. «մեկ չափը բոլորի համար» հաշվարկային դարաշրջանը մայրամուտին է: Ձեռնարկության համար «մեկ մատակարարի ռիսկը» այլևս միայն մատակարարման շղթայի խնդիր չէ, այլ՝ մրցակցային սպառնալիք:
Երբ ընկերությունը հիմնվում է բացառապես երրորդ կողմի էկոհամակարգի վրա, այն կախված է այդ մատակարարի գնային քաղաքականությունից և նորարարական ուղեգծից: Անցնելով հատուկ լուծումների՝ OpenAI-ը շուկային ազդարարում է, որ ինֆերենսը՝ ժամանակակից թվային փոխակերպման հիմնական շարժիչ ուժը, դառնում է մասսայական հասանելի մոդել: Սա հիանալի նորություն է ավելի լայն էկոհամակարգի համար: Քանի որ մասնագիտացված սիլիցիումը մտնում է հիմնական հոսք, ընկերության վաճառքի ձագարը կառավարելու կամ բեք-օֆիսի փաստաթղթերի մշակումն ավտոմատացնելու ունակ ԱԲ գործակալի տեղակայման միավորի արժեքն անխուսափելիորեն կնվազի:
Մենք մտնում ենք մի փուլ, որտեղ մոդելի «ինտելեկտը» արժեքավոր է այնքան, որքան դրա առաքման «արդյունավետությունը»: Բիզնեսը, որը կարող է գործարկել բարդ, գործակալների վրա հիմնված աշխատանքային հոսք ընթացիկ ծախսերի մի փոքր մասով, բնականաբար, կգերազանցի այն մրցակցին, որը կաշկանդված է թանկարժեք, ընդհանուր նշանակության սարքավորումների պարտքով:
Ինֆերենսային հեղափոխությանը նախապատրաստվելը
CTO-ների և CIO-ների համար եզրակացությունը պարզ է՝ մի ենթադրեք, որ ընթացիկ սարքավորումային կախվածությունները մշտական են: Ձեռնարկության ԱԲ-ի ճանապարհային քարտեզը պետք է առաջնահերթություն տա ճկունությանը: Քանի որ ինֆերենսը դառնում է ավելի մատչելի Jalapeño-ի նման նվաճումների շնորհիվ, ավտոնոմ գործակալների տեղակայման մուտքի խոչընդոտները՝ այն գործակալների, որոնք ունակ են CRM կամ ERP համակարգերում ծայրից ծայր առաջադրանքներ կատարել, կվերանան:
Այն ընկերությունները, որոնք ներկայումս հետաձգում են լայնածավալ ԱԲ տեղակայումները հաշվարկների չափազանց բարձր գնի պատճառով, պետք է այս սարքավորումային տեղաշարժը դիտարկեն որպես շրջադարձային կետ: 2026 թվականի և դրանից հետո ընկած ճանապարհային քարտեզը կձևավորվի ավելի փոքր, ավելի արդ



