Kentino sro
K-AI 192 Rome ArcProB70 TBD — 6× Intel Arc Pro B70 — EPYC Milan (Forudbestilling)
K-AI 192 Rome ArcProB70 TBD — 6× Intel Arc Pro B70 — EPYC Milan (Forudbestilling)
Kunne ikke indlæse afhentningstilgængelighed
UNDER FORBEREDELSE
Forudbestilling — Leveringsmål for Intel Arc Pro B70 i 3. kvartal 2026
K-AI 192 Rom ArcProB70 TBD
192 GB VRAM Intel Xe2 Inference Server
6x Arc Pro B70 | EPYC Milan | TOPS TBD
Budgetorienteret high-VRAM-build målrettet Intels open source-inferensstak. Prisfastsættelsen er låst ved Intels tilgængelighed.
En 4U rackmonteret inferensserver med seks Intel Arc Pro B70 Creator-kort (32 GB Xe2-HPG "Battlemage" hver, 192 GB samlet), én AMD EPYC 7643 Milan CPU (48C/96T), 384 GB DDR4 ECC, 2 TB NVMe boot og en 2 kW ATX PSU (opgradering med to PSU'er anbefales kraftigt). Bygget til Intel-softwareøkosystemet: OpenVINO 2025+, IPEX-LLM, llama.cpp SYCL backend og vLLM-Intel forks. Kun CUDA-arbejdsbelastninger kører ikke på denne hardware.
Hardware
| Component | Detalje |
|---|---|
| GPU'er | 6x Intel Arc Pro B70 Creator 32 GB (Xe2-HPG "Battlemage", 250 W, PCIe 5.0 x16, dobbelt slot) |
| VRAM-pulje | 192 GB samlet på tværs af 6 kort (ingen inter-card fabric — peer-trafik over PCIe) |
| CPU | AMD EPYC 7643 Milan (48C/96T, 225 W, 128x PCIe 4.0-baner) |
| Bundkort | ASRock Rack ROMED8-2T (SP3, 7x PCIe 4.0 x16, 8x DDR4 ECC, 2x 10 GbE, IPMI) |
| System RAM | 384 GB DDR4-2666 ECC RDIMM (6x 64 GB) |
| Opbevaring / bagagerum | 2 TB NVMe M.2 (PCIe 4.0 x4) |
| Strømforsyning | 1x 2 kW ATX strømforsyning (dobbelt 2 kW synkroniseret opgradering anbefales kraftigt) |
| Chassis | 4U rackmontering (layout med 6 slots) |
| Køling | SP3 tårnkøler (Arctic Freezer 4U-M) + rettet luftstrøm fra forsiden til bagsiden (industrielle ventilatorer) |
| Netværk | Indbygget dobbelt 10 GbE (Intel X550) |
Power kuvert
- GPU-forbrug: 6 x 250 W = 1500 W (Intel-publiceret TDP)
- Systemtotal ved fuld belastning: ~4080 W
- Strømforsyning i alt: 2.000 W (enkelt) — kun 8.75 % headroom
- Dobbelt 2 kW synkroniseret anbefales kraftigt — gendanner ~45 % headroom
Banetopologi
ROMED8-2T leverer 7x PCIe 4.0 x16-baner. Seks slots er udfyldt; én er ledig til NIC-upsalg. Arc Pro B70 er PCIe Gen5 native; ROMED8-2T kører på Gen4 — båndbreddepåvirkningen er ubetydelig for inferens ved 32 GB pr. kort. Ingen PCIe-switch. Ingen Xe-Link-ækvivalent.
Hvad du kan løbe
Alle kompatibilitetspåstande er Intel-software-stak-stier (OpenVINO, IPEX-LLM, llama.cpp SYCL, vLLM-Intel). CUDA-arbejdsbelastninger kører ikke på denne hardware. Alle tal citerer offentliggjorte eksterne kilder og er underlagt uafhængig verifikation, når kortene sendes.
LLM'er — tekst / ræsonnement / kodning
den kinesiske grænse
- Qwen3 / Qwen3.5 (Alibaba): Qwen3-235B-A22B Q4 (~132 GB) med lang kontekst-headroom; Qwen3-Coder-480B-A35B Q2 (~160 GB); Qwen3.5-397B-A17B Q3 (~170 GB)
- GLM / Z.ai: GLM-4.5 / 4.6 / 4.7 Q4 (~177 GB) — passer til moderat KV
- Tencent Hunyuan: Hunyuan-Large Q3 (~160 GB); Hunyuan-A13B fp8 (~80 GB) hvis Xe2 fp8-sti er eksponeret i driveren
- Andet: Baidu ERNIE-4.5-424B Q3 (~180 GB); MiniMax-M1 Q3 (~180 GB); DeepSeek-R2 32B (6x samtidige streams)
Vestgrænsen
- Meta Lama: Llama 3.3 70B Q6-Q8 med generøs KV; Llama 4 Scout 109B/17B Q4 (~63 GB) komfortabel
- Mistral: Mistral Lille 3 / Magistral Lille / Devstral Lille 2 (24B) ved bf16; Pixtral Stor Q4-Q6
- OpenAI (åbne vægte): gpt-oss-120b MXFP4 native (~80 GB) — hvis MXFP4-dequant er tilgængelig i Intel-stakken
- NVIDIA Nemotron: Llama-3.1-Nemotron Ultra 253B Q4 (~120 GB)
- Andet: Gemma 3 27B bf16 multimodal; Phi-4 / Phi-4-ræsonnement 14B; Sammenhængskommando R+ 104B Q4
Vision-sprog modeller
Qwen3-VL-8B / 32B; Qwen3-VL-30B-A3B MoE; InternVL3 op til 78B; InternVL3.5-38B; Llama 3.2 90B Vision Q4; Pixtral 12B; Molmo 72B Q4; Gemma 3 12B/27B multimodal; MiniCPM-V 2.6 / MiniCPM-o 2.6. Intels OpenVINO har stærk understøttelse af Vision-tower — VLM er en plausibel styrke fra dag ét.
Billedgenerering
FLUX.1 [dev] / [schnell] fp8 eller Q4 GGUF via llama.cpp SYCL; SDXL / SD 3.5 Large via OpenVINO genAI runtime; HunyuanDiT; HunyuanImage-2.1 bf16 (~34 GB); farver 2.0; AuraFlow; OmniGen; PixArt-Sigma.
Video generation
Wan 2.2 T2V-A14B / I2V-A14B MoE (~54 GB bf16); Wan 2.2 TI2V-5B; HunyuanVideo 13B bf16; HunyuanVideo 1.5; CogVideoX-5B; Open-Sora 2.0; LTX-Video; Pyramid Flow; Mochi-1 Q4. Video er den svageste Intel-sti i dag — forvent funktionel, men ikke optimal gennemløbshastighed ved levering.
Lyd / Tale / TTS
- ASR: Whisper v3 large / turbo via OpenVINO (førsteklasses Intel Whisper-understøttelse); Parakeet-TDT; Canary; SenseVoice
- TTS: CosyVoice 2/3; Kokoro 82M; Stabil lyd åben; XTTS v2; StyleTTS 2; Step-Audio-EditX
- Realtid / S2S: Kyutai Moshi; MusicGen / AudioGen / Bark; SeamlessM4T v2
Multimodel-/multi-lejer-servering
- 6 samtidige streams af en 32 GB Q4-model (én pr. kort) — f.eks. 6x Qwen3-32B Q4-agenter
- Embedding-flåde i stor skala — 6x parallelle BGE-M3 / E5 / Nomic Embed-strømme (OpenVINO-optimeret)
- Blandet residency — 70B Q4 (tensor-parallel over 3 kort) + FLUX.1 (1 kort) + Whisper-turbo (1 kort) + Moshi (1 kort)
Målrettede arbejdsbyrder
- Intel-softwareevalueringspilot til CUDA-alternativ LLM-servering
- Integrering/genrangering af backend, hvor VRAM-per EUR dominerer gennemløbskravene
- Budget Q4 frontier-MoE inferens (Qwen3-235B, GLM-4.5/4.6/4.7) for små interne udviklingsteams
- Implementering af OpenVINO-native modeller sammen med eksisterende Intel Xeon/Arc Pro-pipelines
- VLM / OCR / dokumentbehandlingsbackend (Intels OpenVINO-styrke)
Målt ydeevne
Intel-offentliggjorte specifikationer | Med forbehold for uafhængig verifikation, når kortene sendes
| Spec | Værdi |
|---|---|
| VRAM pr. kort | 32 GB GDDR6 |
| Hukommelsesbåndbreddeklasse | ~450 GB/s pr. kort |
| Xe Matrix Extensions (XMX) | Accelereret via OpenVINO / IPEX-LLM |
| fp8-sti | Xe2 silicium — verificér førereksponering under skibsfart |
Ingen Kentino-målte data. Intel-publicerede specifikationer er underlagt uafhængig verifikation. Kentino vil offentliggøre førsteparts tok/s/QPS/båndbreddetal, når den første enhed har bestået burn-in.
Ikke ideel til
- CUDA-native arbejdsbelastninger — ingen CUDA på Intel, forvent migreringsfriktion
- Produktions-SLA-kritiske implementeringer indtil Intel Arc Pro-forsyning og -værktøjer stabiliserer sig
- Frontier 600B+ MoE ved Q4+ (kræver 6x RTX Pro 6000 / 576 GB pool)
- Træningsbelastninger — Arc Pro er inferensorienteret, rammeværkets modenhed til distribueret træning er begrænset
- Kunder, der ønsker målte benchmarks før køb — denne SKU er forudbestilling
Garanti og leveringstid
Kentinos standardgaranti (2 år på dele, 1 år på arbejdskraft); Intels distributionsvilkår erstatter, hvor strengere. Byggeprocessen inkluderer samling, BIOS-konfiguration, driverinstallation, burn-in-test og funktionel verifikation. Reserver dit første leveringstidspunkt via Kentinos kontaktformular. 30-dages prisbindingsvindue ved bestilling.
Anbefalede tilføjelser
- Opgradering til dobbelt 2 kW synkroniseret strømforsyning (den begrænsede headroom med én strømforsyning er begrænset med et forbrug på 1825 W – anbefales kraftigt)
- Opgrader RAM til 512 GB DDR4 (2x 64 GB — to pladser åbne)
- 4 TB NVMe sekundært drev til modelbibliotek
Del
