26.07.02 THUTHURSDAY, JULY 2, 2026

LG가 최신 LLM을 내놨지만, 다운로드 1위는 서울대의 4년 전 소형 모델이었다

LG가 최신 LLM을 내놨지만, 다운로드 1위는 서울대의 4년 전 소형 모델이었다

한국 AI 기업들이 잇달아 대형 언어모델(LLM)을 공개했지만, 개발자가 직접 내려받아 쓰는 오픈 모델의 다운로드 1위는 LG의 최신 LLM이 아니라 서울대 연구실이 2022년 공개한 금융 텍스트 분류 모델이었다.

LG의 EXAONE, 업스테이지의 SOLAR, SK텔레콤의 A.X. 한국 AI 기업들은 저마다 대형 언어모델을 공개하며 경쟁하고 있다. 이 경쟁의 상당 부분은 각 사의 상용 API와 서비스에서 벌어진다. 다만 개발자가 모델 파일을 직접 내려받아 자기 서버에서 돌리는 수요는 따로 있고, 이 수요는 AI 모델 공유 플랫폼 허깅페이스(HuggingFace)의 다운로드 수로 집계된다. 뉴스에포크가 한국 AI 조직·연구자 계정의 최근 30일 다운로드를 집계한 결과, 이 영역의 수요는 발표된 경쟁 구도와 크게 달랐다.

다운로드 1위는 4년 전 금융 분류 모델

최근 30일 기준 추적 계정의 다운로드 합계는 263만 건이다. 이 가운데 가장 많이 다운로드된 단일 모델은 서울대 자연어처리연구실이 2022년 공개한 금융 텍스트 분류 모델 KR-FinBert로, 25만 6천 건을 기록해 LG가 올해 공개한 최신 모델 EXAONE-4.5-33B(24만 7천 건)를 앞섰다.

순위

모델

발행

최근 30일 다운로드

유형

1

snunlp/KR-FinBert

2022

256,265

금융 텍스트 분류

2

LGAI-EXAONE/EXAONE-4.5-33B

2026

246,862

생성형 LLM

3

naver-clova-ix/Donut

2022

175,650

문서 OCR

4

beomi/KcBERT

2022

164,482

언어모델(BERT)

5

monologg/KoELECTRA

2022

156,930

질의응답

6

LGAI-EXAONE/EXAONE-3.5-32B

2024

142,369

생성형 LLM

자료: 허깅페이스 Hub API(2026년 7월 1일 수집), 최근 30일 다운로드.

EXAONE을 제외하면 상위권은 문서 OCR 모델 Donut, 언어모델 KcBERT, 질의응답 모델 KoELECTRA 등 2022년에 나온 소형 작업 모델이다. 이런 모델은 API로 호출하기보다 검색·분류·문서처리 파이프라인에 직접 넣어 쓰는 것이어서, 다운로드 수가 실사용에 가깝다. 대형 LLM이 잇달아 공개된 뒤에도 실무 파이프라인이 내려받는 모델은 이전 세대에 머물러 있다는 뜻이다.

생성형 LLM 다운로드는 EXAONE에 쏠렸다

계정 단위로 보면 1위는 LG AI연구원의 EXAONE 계정으로, 88만 5천 건을 기록해 전체의 33.6%를 차지했다. 생성형 LLM 다운로드는 대부분 EXAONE으로, LG를 제외하면 나머지 계정의 생성형 모델을 모두 합쳐도 전체의 1%에 못 미친다. 업스테이지 SOLAR의 대표 모델은 6만 4천 건, SK텔레콤 A.X의 대표 모델은 3만 1천 건으로, EXAONE 대표 모델의 각각 4분의 1, 8분의 1 수준이다.

다만 SOLAR와 A.X는 각 사가 상용 API로도 제공하는 모델이어서, 다운로드가 적다고 전체 사용량이 적다고 단정할 수는 없다. 다운로드 수가 보여주는 것은 모델을 직접 내려받아 운영하는 수요이며, 이 수요에서 생성형 LLM은 EXAONE에 집중돼 있다.

직접 내려받아 쓰는 오픈 모델은 소수다

개발자가 직접 내려받아 쓰는 영역에서 생성형 LLM 수요는 EXAONE 한 곳에 집중돼 있고, 다운로드 1위는 최신 LLM이 아니라 4년 전 소형 작업 모델이다.

다운로드 수에는 한계가 있다. 소형 모델 다운로드에는 라이브러리와 자동화 파이프라인이 반복 호출하는 몫이 섞여 있어, 사용자가 어떤 모델을 의식적으로 선택했는지까지는 알 수 없다. 그러나 이를 감안해도 EXAONE과 나머지 생성형 모델의 격차, 최신 LLM이 4년 전 소형 모델에 밀리는 구도가 뒤집히지는 않는다. 새 LLM을 공개한 기업은 여럿이지만, 개발자가 실제로 내려받아 쓰는 오픈 모델은 소수다.


이 기사는 News Epoch가 한국 AI 오픈소스 생태계를 정량 추적하기 위해 운영하는 OpenIndex를 기반으로 작성했습니다. 데이터는 허깅페이스 Hub API로 2026년 7월 1일 수집한 최근 30일 다운로드이며, 상용 API·서비스를 통한 사용은 포함하지 않습니다.

염지수 기자

기업 재무 데이터 · 투자 리포트 · 창업 분석을 한 곳에서

Pitchdeck 체험하기

매주 엄선된 뉴스, 이메일로 받아보세요

매주 금요일 발행 · 1초 해지

#AI#Data