AI Research Engineer | 셀렉트스타 주식회사

AI Research Engineer | 셀렉트스타 주식회사

[직군] AI Engineering (AI Research Engineer) | 셀렉트스타

💡 Forbes 아시아가 선정한 100대 스타트업인 셀렉트스타는 AI 학습데이터의 구축부터 기획, 판매까지 아우르는All-in-One 서비스를 제공하며 글로벌 AI 기업들의 핵심 파트너로 성장하고 있습니다.국내 최초로 생성형 AI 신뢰성 검증 자동화 솔루션 &lsqu

AI Research Engineer

[직군] AI Engineering
AI Research Engineer
정규직
셀렉트스타
채용 시 마감
지원하기

💡 Forbes 아시아가 선정한 100대 스타트업인 셀렉트스타는 AI 학습데이터의 구축부터 기획, 판매까지 아우르는All-in-One 서비스를 제공하며 글로벌 AI 기업들의 핵심 파트너로 성장하고 있습니다.국내 최초로 생성형 AI 신뢰성 검증 자동화 솔루션 ‘다투모 이밸(Datumo Eval)’을 출시했으며, 국가대표 AI 데이터 기업으로도 성장하고 있습니다. 누적 투자 379억원으로 시리즈B라운드를 마치고 글로벌 AI 기업으로 도약하고 있는 셀렉트스타와 함께할 여러분들을 기다리고 있습니다!

AI R&D Eval Team

셀렉트스타 AI 제품 연구개발팀은 생성형 AI를 포함한 핵심 기술 전반에 걸쳐 연구개발을 수행하고 있습니다.

그중에서도 Eval 팀은 다음 두 가지 핵심 축을 중심으로 LLM 평가(Evaluation)와 Human Alignment 기술에 집중하고 있습니다.

Evaluation & Benchmarks

  • AI 기반 서비스 전반을 대상으로 한 자동 평가 기술 개발
  • 한국어 및 도메인 특화, 멀티모달 벤치마크 설계 및 구축

sLM Training & Human Alignment

  • sLM 및 Reward Model 기반의 LLM 학습 및 최적화
  • Human-in-the-loop 접근을 통한 모델 적응 및 정교한 튜닝

저희는 연구 성과를 실제 제품과 고객 문제 해결로 연결할 수 있는 분을 찾고 있습니다.단순히 아이디어 제안이나 논문 쓰는데 머무르지 않고, 직접 연구설계, 구현까지 수행하여 Datumo Eval 제품에 기술을 반영하고,필요 시 고객 현장에서 문제를 파악해 적극적으로 대응할 수 있는 실행력을 중요한 역량으로 보고 있습니다.

담당 업무

성공적인 AI 제품 개발과 실제 고객 환경에서의 문제 해결을 위해 LLM 평가 및 정렬(Alignment) 기반의 AI 연구개발을 맡게 됩니다.이 과정에서 아래와 같은 업무들을 수행하게 됩니다.

  • LLM 성능에 대한 객관적 평가 연구 및 실험 설계
    • LLM as Judge 구조, 평가 루브릭 및 프롬프트 설계
    • 신뢰성과 재현성을 갖춘 평가 방식 연구
    • 다양한 벤치마크 기획 및 구축
  • Human Alignment & Auto Adapt 연구
    • 프롬프트 자동 최적화 실험
    • 실제 고객 피드백과 사용 로그를 반영한 Human-in-the-loop 평가 구조 설계
  • 고객 문제 정의 및 해결을 위한 가설 설정 및 검증
    • 고객사/내부 이해관계자와 함께 문제 정의 및 우선순위 설정
    • 실험 설계 → 데이터/모델 구성 → 결과 분석 → 인사이트 도출까지의 전 과정 수행
    • 연구 결과를 Datumo Eval 및 신규 솔루션으로 연결하기 위한 제안 및 PoC 수행


필수 요건

전공/학위 무관하나, 아래 기준을 충족해야 합니다.

  • 학사 졸업 후 약 3년차 (만 2년이상) 경력에 준하는 실전 경험
  • 기본적인 ML/딥러닝 이해 및 Python & PyTorch 기반 모델 실험 경험
  • LLM 평가 및 정렬 관련 핵심 업무 중 일부라도 독립적으로 설계하고 끝까지 수행한 경험
  • * 병역 특례 및 외국인 지원 불가


필요 역량

담당 업무를 스스로 설계하고 끝까지 밀어붙일 수 있으며,그 과정과 결과를 논리적으로 설득력 있게 설명할 수 있는 역량을 중요하게 봅니다.다음 중 여러 항목에 해당하신다면 잘 맞으실 수 있습니다.

  • LLM / 딥러닝 기반 NLP 모델을 직접 구현·실험해 본 경험
    • 예) HuggingFace Transformers를 활용한 파인튜닝, vLLM/DeepSpeed/FSDP 기반 서빙/실험 등
  • LLM 또는 NLP 모델의 평가 지표·벤치마크를 설계하거나 개선해 본 경험
    • 예) QA/요약/대화/Reasoning/RAG 등 태스크에 대한 custom metric이나 평가 파이프라인 운영
  • 실험 설계, 지표 정의, 통계적 분석을 통해 결과를 비즈니스/서비스 관점에서 해석할 수 있는 역량
  • 영어 논문을 읽고, 내용을 구현·실험으로 연결할 수 있는 능력
  • 다양한 이해관계자(내부 PM, 엔지니어, 외부 고객 등)와 명확하고 논리적으로 소통할 수 있는 커뮤니케이션 능력

 ✅ [추가 안내]

  • 연차 & 학위 자체는 절대적 기준이 아닙니다.
  • 다만, 위 핵심 업무 중 일부라도 독립적으로 리드하고 끝까지 수행해 본 경험은 필수 요건입니다

우대 사항

  • RAG System, LLM Evaluation, LLM Alignment 등 유관 분야 프로젝트 경험자
  • LLM 평가(LLM-as-Judge, Reward Model, RLHF/RLAIF, DPO 등) 관련 실무 또는 연구 경험자
  • Multi-Agent LLM 시스템, Tool-use 기반 평가 경험자
  • 한국어 및 특정 도메인(금융, 법률 등) 데이터셋/벤치마크 구축 및 어노테이션 파이프라인 경험자
  • Prompt Backprops, Task-vector, LoRA 등 경량 적응 기법 실험 경험자
  • LLM 시스템 전체 파이프라인(데이터 → 모델 → 평가 → 서빙) 설계 경험자
  • 논문 작성 경험자 (학회/저널 관련 경험 우대)


근무 및 급여 조건

  • 채용 형태: 정규직 (3개월 수습 기간)
  • 급여 및 연봉: 개인 역량에 따라 협의를 통해 결정
  • 근무 시작일: 협의를 통해 결정
  • 근무 장소: 서울 강남구 테헤란로38길 8 오피스B 역삼2호점 8F - 11F


채용 절차

서류 접수 ▶ 과제 전형 ▶ 직무 및 컬쳐핏 면접 ▶ 처우 협의 ▶ 최종 합격

  • 이력서(필수)는 pdf 파일로 변환하여 제출해주세요.
  • 추가로 제출하시고자 하는 서류가 있다면 함께 제출해주시면 됩니다.
  • 제출해주신 지원 서류는 담당부서에서 검토하여 결과 안내드리고 있으며, 서류 검토에는 최대 5영업일이 소요될 수 있습니다.
  • 상황에 따라 2차 인터뷰, 레퍼런스 체크 등이 진행될 수 있으며, 각 절차 진행 전 사전에 안내드릴 예정입니다.
Created by
AI Research Engineer
지원하기