Byg Wiki

Byg Wiki

En referenceserie om opbygning, netværk, drift og drift af AI-beregning – for købere og integratorer, der dimensionerer deres næste 4-GPU-boks, 8-GPU-server eller robotlaboratorium.

Hver artikel er skrevet ud fra ægte Kentino-projekter. Intet fyld. Med meninger, hvor ingeniørkunsten kræver det. Ærlig omkring grænser.

20artikler live 9emnespor 2nyt om ugen · tirs + tors

Grundlæggende AI-server W-serien

Hvis du specificerer en multi-GPU-boks, så læs disse først. Hukommelse, PCIe, strøm og GPU-shortlist.

W01RAM og VRAM: Hvordan de relaterer sig i en AI-serverEn 4-GPU-boks med 192 GB VRAM og 32 GB RAM er i stykker. Det rigtige forhold afhænger af, hvad du rent faktisk kører.
W02PCIe-baner og topologi i en AI-server med flere GPU'er"PCIe x8 vs x16 spiller ingen rolle for inferens" er for det meste korrekt - og de folk, der gentager det, ved normalt ikke hvorfor.
W03GPU-risers: Hvornår du har brug for dem, og hvad der går i stykkerHvor signalintegriteten stille og roligt dør, links stille og roligt omskoles til Gen3, og bænke, der består, begynder at miste en GPU om dagen.
W04PSU-størrelse og dobbelt-PSU-konfigurationerMatematikken, formfaktor-virkeligheden og den ærlige framing for 4-GPU og 8-GPU strømforsyning.
W07GPU-valg: 5090, 4090, RTX Pro 6000, L40, L4Ærlig direkte sammenligning med reelle præstationstal, afvejninger og et beslutningsflow, vi rent faktisk bruger i kundeopkald.

netværk N-serien

NVLink-virkelighed, klyngetopologier (blad-ryg, fedt-træ, guldsmed, switchless), latenstidsdissektion, routing og RDMA-opsætning i praksis.

N03NVLink og NVSwitch: Når det gælderDGX marketing praler af NVLink-båndbredde på terabyte pr. sekund. Til de fleste Kentino-arbejdsbelastninger behøver du ikke noget af det.
N04Skiftede topologier: Fedttræ, bladryg, guldsmed, tesseractHvert klyngediagram starter på samme måde. Det virkelige valg er hvilken topologi, hvor meget overabonnement, hvilken hastighed pr. port.
N05Switchless topologier: Mesh, Ring, Direct-ConnectEn 32-ports 400 GbE-switch lander på mellem 40 og 80 euro i midten af ​​2026. For 2 til 4 noder behøver du ikke en.
N06Latenstidsdissektion: Hvor hvert mikrosekund går henFolk måler netværk med båndbreddediagrammer. Så viser deres allreduce-benchmark et tal, der slet ikke er i nærheden af ​​linjehastighed.
N07Routing: ECMP, adaptiv routing, DCQCNHvad sker der over kabler, NIC'er, switche: hvordan pakker finder en sti, og hvad forhindrer stoffet i at kollapse under total reduktion.
N08RDMA-opsætning i praksis + Cluster Uplink DesignPraktisk: installer drivere, bevis stien, aktivér GPUDirect, valider NCCL, og tag derefter skridtet videre og design uplinket til hele klyngen.

klyngedannelse K-serien

Når én node ikke er nok. Beslutning om enkelt- vs. flere noder, distribueret træning, inferensklynger og delt lagring.

K01Single-Node Multi-GPU vs. Multi-Node: Hvornår skal man skalere udDen dyreste fejl er at opdele et GPU-budget på tværs af to noder, når én større node ville have gjort jobbet.
K02Distribueret træning i 2026: DDP, FSDP2, DeepSpeed, MegatronFire open source-stakke, fem parallelitetsakser, og hvilken en man rent faktisk skal vælge til hvilket job.
K03Inferensklynger: vLLM Tensor Parallel, Pipeline ParallelEn 70B-model passer ikke på én GPU med den nyttige KV-cache. En 405B passer ikke på én node. Hvordan du skærer modellen til, bestemmer, hvad den koster.
K04Klyngelagring: NFS, BeeGFS, Luster, objektlagreDelt lagring er den del af en distribueret klynge, som ingen tænker på, før GPU'erne udnytter den med 40 %.

Integration I-serien

At sætte det hele sammen – robot-plus-server-arkitekturen, der binder hele serien ned til rigtig hardware.

I01Edge AI-arkitektur: Robot ↔ On-Prem Inference ServerGuldstandardartiklen. En humanoid, du har købt, er kun halvdelen af ​​systemet; dette er den anden halvdel, og hvordan de to halvdele er forbundet.

Robotics R-serien · blog

En moderne humanoid er seks eller syv ingeniørdiscipliner boltet sammen. Købsprocessen, hvorfor robotter har brug for dedikeret edge computing, og den banebrydende VLM-drevne verdensmodelstak.

R07Køb af robot: Leveringstider, told, supportAt købe robothardware i EU er ikke som at købe en arbejdsstation. Sådan ser leveringstider, told og eftersalgssupport rent faktisk ud.
R08Hvorfor robotter har brug for dedikeret Edge ComputeLatensargumentet. Hvorfor det at placere din model bag en cloud-API ødelægger den use case, kunden rent faktisk ønsker.
R09Automatisk mærkning med VLM-drevne verdensmodellerDen banebrydende perceptionsstak — Qwen2.5-VL, Grounded-SAM 2, Florence-2, NVIDIA Cosmos — anvendt til robotteknologisk ground truth.

Casestudier C-serien · blog

Ægte Kentino-byggerier med ægte opmålte tal. Fotografier, styklister, benchmarks og ærlige obduktioner.

C01Casestudie: 4× RTX 4090 AI-arbejdsstationEPYC 7542, 512 GB DDR4 ECC, 4× RTX 4090. 651.6 TFLOPS målt. 179.3 tok/s vedvarende på vLLM. 73°C peak. Reelle tal fra en leveret build.

Nye artikler hver tirsdag og torsdag

Denne wiki er et voksende bibliotek — nye artikler om byggeri, netværk, klyngedannelse, energi og robotteknologi udgives frem til 2026, hver især hentet fra et rigtigt Kentino-byggeprojekt. Hvis du ønsker et specifikt emne prioriteret, kan du skrive til info@kentino.com.