„Tether’s QVAC Fabric“ integruoja „BitNet LoRA“, kad būtų galima tiksliai suderinti ir paleisti kelių milijardų parametrų AI modelius vartotojų GPU ir pavyzdiniuose telefonuose, todėl rimtas AI darbas nustumiamas į kraštus.
Santrauka
- „QVAC Fabric“ suteikia „BitNet LoRA“ koregavimą ir išvadas apie AMD ir „Intel“ GPU, „Apple“ metalinį krūvą ir aukščiausios klasės mobiliuosius GPU, 2–11 kartų padidindamas greitį, palyginti su procesoriaus bazinėmis linijomis, ir iki 90 % mažesnio atminties naudojimo.
- „Tether“ teigia, kad sureguliavo modelius iki 3,8 milijardo parametrų „Pixel 9“, „Galaxy S25“ ir „iPhone 16“ įrenginiuose ir iki 13 milijardų parametrų „iPhone 16“, todėl įrenginio AI gerokai pranoksta šiandienines įprastas sub-3B demonstracines versijas.,
- Šis leidimas atitinka „Tether“ kryptį nuo gryno stabilių monetų leidėjo iki infrastruktūros žaidėjo, papildydamas ankstesnes QVAC iniciatyvas, pvz., 41 milijardo žetonų „Genesis I“ duomenų rinkinį ir vietinį AI Workbench, siekiant iššūkį „Big Tech“ AI grioviui.
„Tether“ dirbtinio intelekto padalinys tyliai pristatė vieną agresyviausių iki šiol nestabilių monetų statymų: kelių platformų „BitNet LoRA“ sistemą, integruotą į „QVAC Fabric“ pluoštą, kuri gali treniruoti ir paleisti kelių milijardų parametrų kalbų modelius tiesiogiai vartotojams skirtuose GPU ir pavyzdiniuose išmaniuosiuose telefonuose. Jei skaičiai nepatenka į „Tether“ etalonus, įrenginio AI iš „mielos demonstracinės“ teritorijos perkeliama į kažką sistemiškai svarbaus tiek aparatūros pardavėjams, tiek kriptovaliutų infrastruktūros investuotojams.
Naujasis „QVAC Fabric“ leidimas suteikia „BitNet LoRA“ koregavimą ir išvadas apie AMD ir „Intel“ GPU, „Apple“ metalo ekosistemą ir daugybę mobiliųjų GPU vienoje sistemoje. Tether teigia, kad pavyzdiniuose įrenginiuose GPU pagrindu daroma išvada yra nuo 2 iki 11 kartų greitesnė nei pagrindinės procesoriaus linijos, o atminties naudojimas sumažėja net 90 %, palyginti su visiško tikslumo modeliais. Praktiškai tai reiškia, kad galite įdėti žymiai didesnius modelius arba daugiau vienu metu vykstančių seansų į tą patį aparatinės įrangos apvalkalą – tai labai svarbu telefonams ir nešiojamiesiems kompiuteriams, kuriuose šiluminės ir RAM lubos yra nediskutuojamos.
Antraštės skaičiai yra provokuojantys: „Tether“ komanda teigia užbaigusi modelių iki 3,8 milijardo parametrų derinimą įrenginiuose, tokiuose kaip „Pixel 9“, „Galaxy S25“ ir „iPhone 16“, ir padidinusi iki 13 milijardų parametrų konkrečiau iPhone 16. Tai labai skiriasi nuo dabartinės normos, kai dauguma „įrenginio AI“ rinkodaros vis dar sukasi apie sub-3B parametrų modelius arba perkelia didesnį darbo krūvį į debesį. Jei galima atkurti, tai rodo ateitį, kai rimtas personalizavimas ir pritaikymas pagal domeną gali vykti vietoje, nesiunčiant vartotojo duomenų iš įrenginio.
Strategiškai tai tinka „Tether“ nuolat keičiasi nuo gryno stabilių monetų leidėjo iki platesnio infrastruktūros operatoriaus. Bendrovė jau skyrė milijardus energetikai, kasybai ir žiniasklaidai; dabar prie portfelio pridedamas „Edition-AI“ įrankis, o susijęs QVAC ir „BitNet LoRA“ kodas yra atviro kodo „GitHub“, kad kūrėjai galėtų juos patikrinti ir tobulinti. Atviras šaltinis nėra altruizmas – tai platinimas. Jei QVAC taps numatytuoju keliu nepriklausomiems kūrėjams ir mažoms laboratorijoms, perkeliant modelius į vartotojų aparatinę įrangą, „Tether“ perka kultūrinę ir techninę svarbą rinkinyje, kuris yra gerokai už tiesioginės bankininkystės reguliavimo ugnies linijos.,
Rinkoms tiesioginis poveikis yra pasakojimas, o ne P&L. Čia nėra jokio žetono, jokio akivaizdaus kampo „augink šį derlių“. Tačiau yra aiški makro istorija: kai daugiau dirbtinio intelekto darbų pereina į kraštus, infrastruktūros galia pereina nuo centralizuotų hiperskalerių prie to, kas valdo pagrindines įrankių grandines ir aparatinės įrangos abstrakcijos sluoksnius. Tether signalizuoja, kad ketina būti vienu iš tų žaidėjų, savo balansą panaudodamas pradiniams primityvams, kurie sumažina priklausomybę nuo bet kurio debesies ar jurisdikcijos. Kalbant apie kriptovaliutą, ekosistemą, kuri vis labiau apsėsta žaidimų, susijusių su dirbtiniu intelektu, tai primena, kad ne prie kiekvieno rimto statymo reikia pritvirtinti žymeklio simbolį.,
Šiuo metu akivaizdūs klausimai yra techniniai: kaip „BitNet LoRA“ spartinimas ir atminties sumažinimas lyginamas su esamais operatoriais, tokiais kaip llama.cpp, MLC arba „Qualcomm“ SDK tuose pačiuose įrenginiuose; kaip atrodo energijos ir šilumos kompromisai naudojant realų pasaulį; ir kiek leidžiamos licencijos komerciniam diegimui. Tačiau jei net konservatyvi Tether teiginių dalis pasitvirtintų atliekant nepriklausomą lyginamąją analizę, QVAC Fabric BitNet LoRA integracija bus apčiuopiamas žingsnis link aukščiausios klasės išmaniųjų telefonų pavertimo gyvybingais vidutinio dydžio kalbų modelių mokymo ir išvadų įrenginiais – dirbtinis intelektas bus perkeltas dar vienu žingsniu arčiau skaitmeninės infrastruktūros.

