# ADR-0016: IOChiplet NoC와 메모리 데이터 경로 ## Status Accepted ## Context ADR-0003 D2는 IO chiplet을 PCIe-EP 및 IO_CPU 인터페이스를 제공하는 SIP 레벨 컴포넌트로 정의하지만, IO chiplet 내부의 라우팅은 명세하지 않는다. ADR-0015 D4는 Memory R/W에 대한 M_CPU 우회를 문서화하도록 갱신되었지만, 이 라우팅을 가능하게 하는 IO chiplet의 내부 NoC 아키텍처는 형식적으로 문서화되지 않았다. IO chiplet은 다음을 위해 내부 라우팅 패브릭(io_noc)을 필요로 한다: - pcie_ep, io_cpu, 그리고 큐브당 UCIe PHY 포트들을 연결한다 - 메모리 연산(MemoryWrite/Read)을 io_cpu를 거치지 않고 큐브 패브릭으로 직접 라우팅한다 - 커널 런치 명령을 명령 해석을 위해 io_cpu를 통해 라우팅한다 ## Decision ### D1. IOChiplet 내부 NoC (io_noc) 각 IO chiplet 인스턴스는 다음을 연결하는 내부 NoC 노드(`io_noc`)를 포함한다: - `pcie_ep` — 호스트 대면 PCIe 엔드포인트 - `io_cpu` — 커널 런치 해석용 명령 프로세서 - `io_ucie-{PHY}.conn{N}` — 큐브 UCIe 포트들로 가는 PHY별 연결 노드 io_noc은 오버헤드가 0인 포워딩 전용 패브릭(`forwarding_v1` 구현)이다. 모든 라우팅 결정은 io_noc 자체가 아니라 메시지 타입에 기반하여 시뮬레이션 엔진이 내린다. ### D2. IOChiplet UCIe 분해 각 IO chiplet PHY 포트는 다음으로 분해된다: - `io_ucie-{PHY}` — UCIe 프로토콜 엔드포인트(overhead = 8ns) - `io_ucie-{PHY}.conn{N}` — io_noc과 io_ucie 사이의 N개 연결 노드 이는 큐브 측 UCIe 분해(ADR-0015 D1)를 미러링하며, PHY당 여러 독립적인 NoC-UCIe 연결을 허용한다. ### D3. Memory R/W 경로 (M_CPU 우회) 메모리 연산(MemoryWrite, MemoryRead)은 pcie_ep에서 io_noc을 거쳐 대상 큐브로 직접 라우팅되며, io_cpu를 완전히 우회한다: ```text pcie_ep → io_noc → conn → io_ucie → [cube UCIe] → router mesh → hbm_ctrl ``` 이는 순수 데이터 전송에 대해 10ns의 io_cpu 오버헤드를 회피한다. 시뮬레이션 엔진의 `_process_memory_direct()` 메서드는 pcie_ep에서 대상 HBM 노드까지의 최단 경로를 해석하는 `find_memory_path()`를 사용한다. ### D4. 커널 런치 경로 (io_cpu 경유) 커널 런치 명령은 명령 해석 및 PE 팬아웃 설정을 위해 io_cpu를 필요로 한다: ```text pcie_ep → io_noc → io_cpu → io_noc → conn → io_ucie → [cube UCIe] → noc → m_cpu → PE ``` 엔진의 `_entry_points()` 메서드는 KernelLaunchMsg를 pcie_ep(진입)와 io_cpu(명령 처리) 양쪽 모두를 통해 라우팅한다. ### D5. IOChiplet-to-큐브 포트 매핑 각 IO chiplet 인스턴스는 자신이 연결되는 큐브 포트를 선언한다: ```yaml cube_ports: - { cube: {xy: [0,0]}, cube_side: N, phy: P0, distance_mm: 2.0 } - { cube: {xy: [1,0]}, cube_side: N, phy: P1, distance_mm: 2.0 } ``` 토폴로지 빌더는 io_ucie PHY 노드에서 해당 큐브 UCIe 포트 노드로의 엣지를 지정된 거리 및 IO chiplet의 `per_connection_bw_gbs`를 링크 대역폭으로 하여 생성한다. ## Consequences - IO chiplet은 잘 정의된 내부 라우팅 패브릭을 가진다 - 메모리 연산은 불필요한 io_cpu 오버헤드를 회피한다 - 커널 런치 명령은 여전히 적절한 명령 해석을 받는다 - io_noc 패턴은 큐브 레벨 NoC 설계와 일관된다 - ADR-0003 D2는 본 ADR에 의해 확장된다(모순되지 않는다) ## Links - ADR-0003 D2 (IO chiplet 정의) - ADR-0015 D4 (Memory R/W 및 커널 런치의 패브릭 경로) - ADR-0012 D1 (호스트-IO_CPU 메시지 스키마)