배달의민족, AI가 음식 사진 읽어준다 — 시각장애인 접근성 기능 4.5/5점 받고 정식 도입
배달의민족을 운영하는 우아한형제들이 어제(4월 19일) “음식 사진을 AI가 음성으로 설명해주는 기능”을 개발했다고 공식 발표했다. 오늘(4월 20일) 장애인의 날을 하루 앞두고 타이밍을 맞춘 발표다. 이 기능의 핵심은 기존 스크린리더가 ‘텍스트만’ 읽어주는 한계를 넘어, 멀티모달 AI 모델{{multimodal-model}}이 이미지를 분석해 음식의 색감·조리 상태·식재료의 시각적 형태 같은 감각적 정보를 이미지 캡셔닝{{image-captioning}} 방식으로 음성화한다는 데 있다. “후라이드 치킨”이라고 적힌 메뉴명 대신, “노릇하게 튀겨진 갈색 치킨 조각 위에 파슬리가 뿌려져 있고, 옆에는 붉은 양념이 담겨 있다”처럼 구체적으로 설명한다는 얘기다.
개발은 AI 스타트업 커넥트브릭과 협력해 진행됐다. 우아한형제들은 올해 2월부터 개발을 시작했고, 3월 31일부터 4월 2일까지 서울 관악구 실로암시각장애인복지관에서 파일럿 테스트를 거쳤다. 이후 소셜벤처 미션잇과 손잡고 시각장애인 30명을 대상으로 유용성 평가를 진행했는데, 5점 만점에 4.5점을 받았다. 단순 내부 검수가 아니라 실사용자 커뮤니티의 객관적 피드백까지 받은 결과라는 점이 이 수치의 무게를 더한다. 배민은 이 기능을 앱에 정식 도입해 시각장애인 사용자들이 비장애인과 동등한 수준의 정보를 받고 메뉴를 선택하도록 만들겠다는 계획이다.
긍정적인 관점에서 보자. 한국 O2O·플랫폼 업계에서 접근성(accessibility)은 오랫동안 ‘법적 최소 요건’ 수준에 머물렀다. 이번 배민의 접근은 그 기준을 한 단계 위로 올린다. 첫째, ‘이미지 기반 메뉴 선택’이라는 배달앱 핵심 UX를 시각장애인에게 동일하게 제공한다는 발상 자체가 중요하다. 음식 사진이 감각적으로 ‘식욕을 자극’하기 위해 찍힌 콘텐츠라는 점을 고려하면, 단순 텍스트 읽기보다 이미지 설명이 훨씬 의미 있는 정보다. 둘째, AI 접근성{{ai-accessibility}} 기능이 대기업 R&D 부서가 아닌 배달 플랫폼에서 출발한 것도 주목할 만하다. 플랫폼은 매일 수백만 건의 이미지·거래 데이터를 갖고 있고, 이 데이터를 활용해 특정 도메인(음식)에 최적화된 설명을 만들 수 있다. 셋째, 커넥트브릭 같은 스타트업과 협업한 방식이다. 내부 풀스택 개발 대신 전문 스타트업과 손잡는 접근은 접근성 기능 개발 속도·품질을 동시에 끌어올리는 현실적 선택이다.
부정적·비판적 시각도 짚어야 한다. 첫째, AI가 생성하는 이미지 설명은 본질적으로 확률적이다. 잘못된 색상·재료·조리 상태를 그럴듯하게 서술하는 할루시네이션이 발생할 수 있고, 이 오류가 시각장애인 사용자의 선택을 왜곡할 가능성이 있다. 4.5점이라는 점수는 평균적 만족도이지, 특정 메뉴·특정 이미지에서 오류가 없다는 뜻이 아니다. 둘째, 프롬프트 엔지니어링{{prompt-engineering}}·모델 튜닝 품질이 사장·가맹점마다 업로드한 사진의 다양성을 얼마나 견뎌낼지가 관건이다. 배달앱에 올라오는 사진은 조명·각도·해상도가 천차만별이라 어려운 입력이 계속 들어온다. 셋째, 기능을 일부 대형 가맹점 메뉴 위주로 먼저 적용하고 중소 가맹점 사진은 늦게 지원하는 식의 ‘부분 접근성’으로 시작하면, 오히려 정보 비대칭을 만들 수 있다. 배민이 어느 범위까지 동시에 적용하는지가 실질 효과의 관건이다.
한국 개발자·서비스 기획자 입장에서 참고할 포인트는 세 가지다. 첫째, 멀티모달 모델의 실제 비즈니스 적용 케이스로 가치 있는 레퍼런스다. ChatGPT·Claude·Gemini의 API만 붙여 놓는 수준이 아니라, ‘음식 도메인’에 특화된 프롬프트 설계·후처리·음성 합성까지 묶인 엔드투엔드 파이프라인이다. 둘째, 국내 B2C 서비스에서 접근성을 UX 필수 요건으로 끌어올릴 계기가 된다. 쿠팡이츠·요기요·배민·야놀자 같은 플랫폼이 동일한 이미지 설명 기능을 내놓을 가능성이 열렸고, 공정거래위원회·방송통신위원회도 접근성 가이드라인을 AI 시대에 맞게 개정해야 하는 압력을 받는다. 셋째, 오픈 데이터·오픈소스 커뮤니티의 할 일이다. 음식 이미지 설명 품질은 한국어 캡션 학습 데이터가 많을수록 좋아지는데, 정부·학계·플랫폼이 익명화된 학습 데이터를 공개·공유하는 구조가 빠르게 설계되면 후속 스타트업들도 유사한 접근성 기능을 내놓기 쉬워진다.
정리하자. 오늘 장애인의 날을 하루 앞두고 국내 배달앱 1위 사업자가 내놓은 이 발표는, 당일 마케팅 이벤트가 아니라 2월부터 3개월간 진행된 실사용자 테스트를 거친 정식 기능이다. 접근성 기능이 ‘의무’가 아니라 ‘제품 경쟁력’의 일부로 편입되는 흐름의 시작이 되기를 기대할 만한 지점이다. 동시에 AI가 잘못 설명한 이미지가 사용자 선택을 오히려 오도할 수 있다는 리스크도 함께 모니터링돼야 한다는 점을 잊으면 안 된다.
출처 및 참고 자료
- 배민, AI가 음식 사진 설명한다…시각장애인 지원 기능 개발 — 서울경제, 2026-04-19
- 배민, 음식 사진 ‘읽어주는’ AI 도입…시각장애인 이용 편의 높인다 — 디지털데일리, 2026-04-19
- LGU+, 장애인의날 앞두고 인식개선 콘서트 진행 — ZDNet Korea, 2026-04-19 (맥락 자료)
- 우아한형제들, AI 음성 설명 기능 개발…시각장애인 접근성 강화 — 소셜밸류, 2026-04-19
- 프롬프트 엔지니어링으로 메뉴 이미지 품질 검수하기: GPT 기반 업무 자동화 — 우아한형제들 기술블로그 (배경 자료)
- LG유플러스, 장애인의 날 맞아 인식개선 콘서트 진행 — 아주경제, 2026-04-19 (맥락 자료)