하나의 알고리즘이 꿈을 현실로 — 자체 인프라 위에서 한국어 자율 비즈니스 AI가 어떻게 태어났고, 지금 어떻게 사고하고 작동하는지 기록합니다.
알고몽 이전, W-WEBSOFT는 한국어 LLM과 추론 인프라를 직접 연구·개발했습니다. 자체 토크나이저, from-scratch 모델 실험, 파인튜닝 파이프라인 — 지금의 알고몽을 떠받치는 기술 자산이 이때 축적됐습니다.
'알고리즘(Algorithm)'과 '꿈(夢)'의 결합. 축적한 연구를 제품으로 — 한국 기업 현장에서 실제로 일하는 자율 비즈니스 AI를 목표로 회사를 세웠습니다.
NVIDIA DGX Spark(GB10)를 온프레미스로 두고 vLLM 서빙 스택을 구축. 클라우드 토큰 원가에서 자유로워지고 데이터 주권을 확보했습니다.
단순 응답을 넘어 작업을 분해·실행·검증하는 자율 에이전트(CONDUCTOR·AUTODEV)와 실시간 웹·도메인 엔진을 라이브 제품으로 운영하고 있습니다.
질문 하나가 답이 되기까지, 6단계 파이프라인이 실시간으로 작동합니다.
오타·변칙 입력을 정규화하고 의도(질문·코딩·문서·검색·업무)를 분류합니다.
대화 기억(AMRC)·실시간 웹검색·도메인 엔진에서 필요한 근거만 모읍니다.
복잡한 일은 CONDUCTOR가 작업을 분해하고 AUTODEV가 직접 실행·검증합니다.
DGX Spark 위 vLLM이 한국어 특화 모델로 응답을 생성합니다. 외부 의존 없이.
KAIR가 한자·외국어 누출을 차단하고, 자기검증으로 환각·회피를 줄입니다.
사고 과정·출처·토큰을 투명하게 보여주며 스트리밍으로 답합니다.
남의 API를 감싼 래퍼가 아닙니다. 추론 인프라부터 안전 알고리즘까지 자체 보유합니다.
계층적 오케스트레이터 — 리드가 작업을 분해하고 워커가 병렬 실행 후 종합.
자율 개발 루프 — 계획→코딩→도커 실행→자가 수정으로 스스로 검증합니다.
한국어 무결성 — 한자·외국어 누출을 차단해 깔끔한 한국어 응답을 보장합니다.
GB10 위 자체 서빙 — 양자화·연속 배칭으로 추론 처리량을 끌어올립니다.
자체 RSS 인덱스 + 메타검색으로 외부 키 의존 없이 최신 정보를 근거로 씁니다.
자기성찰·추론품질 평가 — 대화에서 약점을 찾아 스스로 개선 데이터를 만듭니다.