SK텔레콤, ICLR 2026에서 ‘C-APO’ 추천 모델 논문 발표 — 단기 클릭 대신 ‘일관된 신호’로 진짜 선호 찾는다
SK텔레콤이 4월 28일, AI 분야 대표 국제학회 ICLR 2026에서 자체 개발한 추천 모델 ‘C-APO(Conflict-Aware Direct Preference Optimization, 충돌 선호 최적화)’ 논문을 발표했다고 밝혔다. 학회는 4월 24일부터 28일까지 브라질 리우데자네이루에서 열렸다.
이 논문의 핵심은 추천에 쓰는 사용자 선호 신호를 다시 정의하는 데 있다. 기존 추천 시스템은 사용자가 방금 누른 클릭, 방금 본 영상 같은 단기 행동을 그대로 선호로 받아들이는 경향이 강하다. 그런데 사용자는 종종 평소 취향과 모순되는 단기 탐색 행동을 보이고, 이걸 그대로 학습하면 추천이 흔들린다. C-APO는 사용자의 장기 행동 패턴 중 반복적으로 나타나는 신호를 ‘일관된 선호’로 정의하고, 단기 신호와 장기 신호가 서로 충돌할 때 가중치를 낮춘다. 두 신호가 정렬되어 있으면 가중치를 올린다. 이렇게 노이즈를 줄여 모델이 진짜 원하는 항목을 찾도록 유도한다는 게 SKT 설명이다.
기술적으로 보면 이 접근은 최근 LLM 정렬에서 표준이 된 RLHF와 그 단순화 버전인 직접선호최적화(DPO, Direct Preference Optimization) 계열의 변형이다. DPO는 보상 모델 없이 선호 쌍 비교만으로 모델을 정렬하는 기법인데, C-APO는 여기에 “선호 쌍이 서로 충돌하는 경우”를 명시적으로 다룬다는 점이 추가된다. 추천 시스템이 LLM 정렬 기법을 차용해 들어가는 흐름의 한 단면이다.
SKT는 이 연구를 단순 추천 엔진을 넘어 에이전트 기반 추천 시스템에 적용하겠다는 로드맵을 함께 공개했다. 단계는 세 갈래다.
| 단계 | 역할 | 예시 |
|---|---|---|
| 1단계 | 사용자 사용 맥락 해석 | ”오후 7시, 출퇴근 종료 직후 모바일 접속” 같은 상황 정의 |
| 2단계 | 추천 후보 생성 | C-APO로 일관된 선호와 정렬된 후보 풀 추출 |
| 3단계 | 결과 검증·조정 | 사용자 피드백 루프로 후보 재정렬, 최종 추천 결정 |
자료: SK텔레콤 뉴스룸(2026-04-28), 헤럴드경제(2026-04-28). 단계별 명세는 보도자료 본문 정리.
긍정 시각은 학계와 산업계 모두에서 무게감이 있다. ICLR은 머신러닝 학회 중에서도 채택률이 낮고 동료 평가 강도가 높은 곳이라, 통과 자체가 기술적 진정성에 대한 일정한 검증 신호로 받아들여진다. 또 통신사가 직접 추천·정렬 분야 핵심 학회에 지속해서 논문을 내는 것은 한국 빅테크 R&D의 깊이를 보여주는 사례로 해석할 만하다.
부정·우려도 짚어둘 부분이 있다. 첫째, 이번 발표는 논문 게재와 일반화 가능성을 보장하지만, 실제 SKT 서비스(예: T우주, ifland, T다이렉트샵)에서 어떤 지표가 얼마나 개선됐는지에 대한 공개 수치는 아직 없다. 둘째, 단기·장기 선호의 충돌을 가중치로 해소하는 접근은 사용자의 합리적 탐색까지 노이즈로 처리할 위험이 따른다 — 새 장르를 시도해보는 사용자에게 “당신은 평소 안 하던 행동을 했다”며 추천을 닫는 식의 부작용 가능성을 후속 검증에서 살펴봐야 한다. 다만 이 부정 시각은 현재까지 외부 연구자의 명시적 비판이 보고된 단계는 아니므로, 가능한 우려의 범주로만 적어둔다.
전망은 두 가지로 정리된다. 단기로는 C-APO 논문 본문이 공개되면(ICLR 프로시딩스 또는 OpenReview), 같은 데이터셋에서 SOTA 비교가 어떻게 정리됐는지가 관전 지점이다. 중장기로는 SKT가 발표한 3단계 에이전트 추천 구조가 자사 서비스에 어느 시점에 들어가고, 그때 사용자 만족도·체류시간 같은 운영 지표가 실제로 움직이는지가 결과 데이터다.
출처 및 참고 자료
- SKT, 대표적 국제 AI 학회 ICLR에서 ‘진짜 선호’ 찾아내는 AI 추론 모델 논문 발표 — SK텔레콤 뉴스룸, 2026-04-28
- 일관된 신호로 ‘진짜 선호’ 찾는다…SKT, AI 추론 모델 발표 — 헤럴드경제, 2026-04-28
- SK Telecom presents AI recommendation model at ICLR 2026 — Telecompaper, 2026-04-28
함께 보면 좋은 글
- ICLR 2026 학회 공식 페이지 — 같은 주에 발표된 다른 추천·정렬 분야 논문 흐름과 함께 살펴볼 수 있는 학회 일정·세션 구성 자료