Gå til produktinformation
1 of 7

Kentino sro

K-AI 192 Rome ArcProB70 TBD — 6× Intel Arc Pro B70 — EPYC Milan (Forudbestilling)

K-AI 192 Rome ArcProB70 TBD — 6× Intel Arc Pro B70 — EPYC Milan (Forudbestilling)

Regelmæssig pris € 20.793,00 EUR
Regelmæssig pris Udsalgspris € 20.793,00 EUR
Udsalg Udsolgt
Skatter inkluderet. Levering beregnet ved kassen.

UNDER FORBEREDELSE

Forudbestilling — Leveringsmål for Intel Arc Pro B70 i 3. kvartal 2026

K-AI 192 Rom ArcProB70 TBD

192 GB VRAM Intel Xe2 Inference Server
6x Arc Pro B70 | EPYC Milan | TOPS TBD

TBD
INT8 TOPPER
192 DK
VRAM-pulje
Intel
Xe2 Battlemagic
6-kort
OpenVINO / SYCL

Budgetorienteret high-VRAM-build målrettet Intels open source-inferensstak. Prisfastsættelsen er låst ved Intels tilgængelighed.

En 4U rackmonteret inferensserver med seks Intel Arc Pro B70 Creator-kort (32 GB Xe2-HPG "Battlemage" hver, 192 GB samlet), én AMD EPYC 7643 Milan CPU (48C/96T), 384 GB DDR4 ECC, 2 TB NVMe boot og en 2 kW ATX PSU (opgradering med to PSU'er anbefales kraftigt). Bygget til Intel-softwareøkosystemet: OpenVINO 2025+, IPEX-LLM, llama.cpp SYCL backend og vLLM-Intel forks. Kun CUDA-arbejdsbelastninger kører ikke på denne hardware.

Hardware

Component Detalje
GPU'er 6x Intel Arc Pro B70 Creator 32 GB (Xe2-HPG "Battlemage", 250 W, PCIe 5.0 x16, dobbelt slot)
VRAM-pulje 192 GB samlet på tværs af 6 kort (ingen inter-card fabric — peer-trafik over PCIe)
CPU AMD EPYC 7643 Milan (48C/96T, 225 W, 128x PCIe 4.0-baner)
Bundkort ASRock Rack ROMED8-2T (SP3, 7x PCIe 4.0 x16, 8x DDR4 ECC, 2x 10 GbE, IPMI)
System RAM 384 GB DDR4-2666 ECC RDIMM (6x 64 GB)
Opbevaring / bagagerum 2 TB NVMe M.2 (PCIe 4.0 x4)
Strømforsyning 1x 2 kW ATX strømforsyning (dobbelt 2 kW synkroniseret opgradering anbefales kraftigt)
Chassis 4U rackmontering (layout med 6 slots)
Køling SP3 tårnkøler (Arctic Freezer 4U-M) + rettet luftstrøm fra forsiden til bagsiden (industrielle ventilatorer)
Netværk Indbygget dobbelt 10 GbE (Intel X550)

Power kuvert

  • GPU-forbrug: 6 x 250 W = 1500 W (Intel-publiceret TDP)
  • Systemtotal ved fuld belastning: ~4080 W
  • Strømforsyning i alt: 2.000 W (enkelt) — kun 8.75 % headroom
  • Dobbelt 2 kW synkroniseret anbefales kraftigt — gendanner ~45 % headroom

Banetopologi

ROMED8-2T leverer 7x PCIe 4.0 x16-baner. Seks slots er udfyldt; én er ledig til NIC-upsalg. Arc Pro B70 er PCIe Gen5 native; ROMED8-2T kører på Gen4 — båndbreddepåvirkningen er ubetydelig for inferens ved 32 GB pr. kort. Ingen PCIe-switch. Ingen Xe-Link-ækvivalent.

Hvad du kan løbe

Alle kompatibilitetspåstande er Intel-software-stak-stier (OpenVINO, IPEX-LLM, llama.cpp SYCL, vLLM-Intel). CUDA-arbejdsbelastninger kører ikke på denne hardware. Alle tal citerer offentliggjorte eksterne kilder og er underlagt uafhængig verifikation, når kortene sendes.

LLM'er — tekst / ræsonnement / kodning

den kinesiske grænse

  • Qwen3 / Qwen3.5 (Alibaba): Qwen3-235B-A22B Q4 (~132 GB) med lang kontekst-headroom; Qwen3-Coder-480B-A35B Q2 (~160 GB); Qwen3.5-397B-A17B Q3 (~170 GB)
  • GLM / Z.ai: GLM-4.5 / 4.6 / 4.7 Q4 (~177 GB) — passer til moderat KV
  • Tencent Hunyuan: Hunyuan-Large Q3 (~160 GB); Hunyuan-A13B fp8 (~80 GB) hvis Xe2 fp8-sti er eksponeret i driveren
  • Andet: Baidu ERNIE-4.5-424B Q3 ​​(~180 GB); MiniMax-M1 Q3 (~180 GB); DeepSeek-R2 32B (6x samtidige streams)

Vestgrænsen

  • Meta Lama: Llama 3.3 70B Q6-Q8 med generøs KV; Llama 4 Scout 109B/17B Q4 (~63 GB) komfortabel
  • Mistral: Mistral Lille 3 / Magistral Lille / Devstral Lille 2 (24B) ved bf16; Pixtral Stor Q4-Q6
  • OpenAI (åbne vægte): gpt-oss-120b MXFP4 native (~80 GB) — hvis MXFP4-dequant er tilgængelig i Intel-stakken
  • NVIDIA Nemotron: Llama-3.1-Nemotron Ultra 253B Q4 (~120 GB)
  • Andet: Gemma 3 27B bf16 multimodal; Phi-4 / Phi-4-ræsonnement 14B; Sammenhængskommando R+ 104B Q4

Vision-sprog modeller

Qwen3-VL-8B / 32B; Qwen3-VL-30B-A3B MoE; InternVL3 op til 78B; InternVL3.5-38B; Llama 3.2 90B Vision Q4; Pixtral 12B; Molmo 72B Q4; Gemma 3 12B/27B multimodal; MiniCPM-V 2.6 / MiniCPM-o 2.6. Intels OpenVINO har stærk understøttelse af Vision-tower — VLM er en plausibel styrke fra dag ét.

Billedgenerering

FLUX.1 [dev] / [schnell] fp8 eller Q4 GGUF via llama.cpp SYCL; SDXL / SD 3.5 Large via OpenVINO genAI runtime; HunyuanDiT; HunyuanImage-2.1 bf16 (~34 GB); farver 2.0; AuraFlow; OmniGen; PixArt-Sigma.

Video generation

Wan 2.2 T2V-A14B / I2V-A14B MoE (~54 GB bf16); Wan 2.2 TI2V-5B; HunyuanVideo 13B bf16; HunyuanVideo 1.5; CogVideoX-5B; Open-Sora 2.0; LTX-Video; Pyramid Flow; Mochi-1 Q4. Video er den svageste Intel-sti i dag — forvent funktionel, men ikke optimal gennemløbshastighed ved levering.

Lyd / Tale / TTS

  • ASR: Whisper v3 large / turbo via OpenVINO (førsteklasses Intel Whisper-understøttelse); Parakeet-TDT; Canary; SenseVoice
  • TTS: CosyVoice 2/3; Kokoro 82M; Stabil lyd åben; XTTS v2; StyleTTS 2; Step-Audio-EditX
  • Realtid / S2S: Kyutai Moshi; MusicGen / AudioGen / Bark; SeamlessM4T v2

Multimodel-/multi-lejer-servering

  • 6 samtidige streams af en 32 GB Q4-model (én pr. kort) — f.eks. 6x Qwen3-32B Q4-agenter
  • Embedding-flåde i stor skala — 6x parallelle BGE-M3 / E5 / Nomic Embed-strømme (OpenVINO-optimeret)
  • Blandet residency — 70B Q4 (tensor-parallel over 3 kort) + FLUX.1 (1 kort) + Whisper-turbo (1 kort) + Moshi (1 kort)

Målrettede arbejdsbyrder

  • Intel-softwareevalueringspilot til CUDA-alternativ LLM-servering
  • Integrering/genrangering af backend, hvor VRAM-per EUR dominerer gennemløbskravene
  • Budget Q4 frontier-MoE inferens (Qwen3-235B, GLM-4.5/4.6/4.7) for små interne udviklingsteams
  • Implementering af OpenVINO-native modeller sammen med eksisterende Intel Xeon/Arc Pro-pipelines
  • VLM / OCR / dokumentbehandlingsbackend (Intels OpenVINO-styrke)

Målt ydeevne

Intel-offentliggjorte specifikationer | Med forbehold for uafhængig verifikation, når kortene sendes

Spec Værdi
VRAM pr. kort 32 GB GDDR6
Hukommelsesbåndbreddeklasse ~450 GB/s pr. kort
Xe Matrix Extensions (XMX) Accelereret via OpenVINO / IPEX-LLM
fp8-sti Xe2 silicium — verificér førereksponering under skibsfart

Ingen Kentino-målte data. Intel-publicerede specifikationer er underlagt uafhængig verifikation. Kentino vil offentliggøre førsteparts tok/s/QPS/båndbreddetal, når den første enhed har bestået burn-in.

Ikke ideel til

  • CUDA-native arbejdsbelastninger — ingen CUDA på Intel, forvent migreringsfriktion
  • Produktions-SLA-kritiske implementeringer indtil Intel Arc Pro-forsyning og -værktøjer stabiliserer sig
  • Frontier 600B+ MoE ved Q4+ (kræver 6x RTX Pro 6000 / 576 GB pool)
  • Træningsbelastninger — Arc Pro er inferensorienteret, rammeværkets modenhed til distribueret træning er begrænset
  • Kunder, der ønsker målte benchmarks før køb — denne SKU er forudbestilling

Garanti og leveringstid

2 år
reservedelsgaranti
1 år
arbejdsgaranti
Q3 2026
målforsendelse

Kentinos standardgaranti (2 år på dele, 1 år på arbejdskraft); Intels distributionsvilkår erstatter, hvor strengere. Byggeprocessen inkluderer samling, BIOS-konfiguration, driverinstallation, burn-in-test og funktionel verifikation. Reserver dit første leveringstidspunkt via Kentinos kontaktformular. 30-dages prisbindingsvindue ved bestilling.

Anbefalede tilføjelser

  • Opgradering til dobbelt 2 kW synkroniseret strømforsyning (den begrænsede headroom med én strømforsyning er begrænset med et forbrug på 1825 W – anbefales kraftigt)
  • Opgrader RAM til 512 GB DDR4 (2x 64 GB — to pladser åbne)
  • 4 TB NVMe sekundært drev til modelbibliotek
Se detaljer