← 웹진 목록
웹진

[알고몽 소식] DGX Spark 기반 추론 인프라 고도화

✍️ 알고몽 👁 2

알고몽은 자체 DGX Spark 인프라 위에서 대규모 언어모델을 직접 서빙합니다.

vLLM 기반 상주 커널과 도메인 적응 프롬프트로 응답 품질과 속도를 동시에 끌어올렸습니다.

댓글 0

아직 댓글이 없습니다. 첫 댓글을 남겨보세요.

댓글 작성

작성된 댓글은 관리자 승인 후 표시됩니다.

← 웹진 목록으로