26.04.04 SATSATURDAY, APRIL 4, 2026

한국 AI 9곳 첫 집계, 코드 관심과 모델 실사용은 달랐다

한국 AI 9곳 첫 집계, 코드 관심과 모델 실사용은 달랐다
  • 한국 AI 9곳 GitHub·HuggingFace 첫 집계… 코드 공개와 모델 실사용 간극 최대 254배

  • LG, 코드 관심도 최하위에도 모델 다운로드 93만 건 1위… 엔씨소프트는 3,676건

  • 네이버 CLOVA·카카오브레인 활동 중단… 조직개편과 OpenAI 파트너십, 각자의 길

AI 기업은 자체 기술을 외부에 무료로 공개한다. 의무가 아니라 전략이다. 구글이 안드로이드를 무료로 풀어 스마트폰 생태계를 장악한 것처럼, AI 모델을 공개하면 개발자들이 그 위에 서비스를 만들고, 인재가 몰리고, 외부 개발자가 성능을 개선해주면서 긍정의 순환이 생긴다. 이것이 오픈소스 전략의 핵심이다.

이 전략이 실제로 통하는지를 보려면 두 플랫폼을 봐야 한다. 코드를 올리는 GitHub(깃허브)와 AI 모델을 올리는 HuggingFace(허깅페이스)다. 깃허브에서 개발자들이 누르는 '스타'는 코드에 대한 관심을, 허깅페이스의 다운로드 수는 모델의 실사용을 보여준다. 해외에서는 허깅페이스 공식 리포트나 깃허브 옥토버스 같은 정기 분석이 나오지만, 한국 AI 기업을 두 플랫폼에서 교차 분석한 보도는 없었다. 뉴스에포크가 지난해 한국 정부가 국가 AI 챔피언으로 지정한 LG AI Research, SK텔레콤, Naver Cloud, NC AI, 업스테이지 5개사를 포함해 네이버, 카카오, 마음AI, 크래프톤까지 한국 AI 기업 9곳의 깃허브 스타와 허깅페이스 다운로드를 처음으로 집계했다. 허깅페이스 분석에는 비교 기준으로 학계(서울대 NLP)와 산업 AI 활용사(야놀자)를 추가했다.

코드 공개의 명암, GitHub에 나타난 한국 AI

기업

공개 프로젝트 수

스타(관심도)

마지막 코드 업데이트

상태

네이버

60

13,239

2026-03-24

활동 중

네이버(구 CLOVA)

30

9,250

2024-12

비활성

카카오

30

8,744

2024-07

비활성

엔씨소프트

49

5,209

2025-12

간헐

마음AI

16

3,984

2026-01

활동 중

업스테이지

34

1,426

2026-03-25

활동 중

크래프톤

23

1,286

2026-03-24

활동 중

SK텔레콤

6

1,229

2026-02

간헐

LG AI Research

22

1,171

2026-03-16

활동 중

GitHub API 2026-03-25 기준.

깃허브에는 명확한 분기점이 있었다. 5곳은 2026년 3월까지 활발하게 코드를 공개했지만, 네이버 CLOVA와 카카오브레인은 각각 2024년 12월과 7월을 마지막으로 새 코드를 올리지 않았다. 그러나 두 회사가 멈춘 이유는 전혀 달랐다.

네이버는 2023년 CLOVA 사업을 네이버클라우드로 통합하면서 새로운 계정으로 코드를 옮겼다. 오픈소스 전략은 유지한 채 간판만 바꾼 것이다. 카카오는 2024년 8월 카카오브레인을 본사 AI 조직으로 합병했고, 같은 해 OpenAI와 파트너십을 맺으며 코드를 공개하는 새 계정을 만들지 않기로 했다. 직접 만들어 공개하던 회사가 외부 기술을 가져다 쓰는 쪽을 택했다.

활동 중인 기업 사이에서도 결이 달랐다. 마음AI는 16개 프로젝트에 스타 3,984개로 효율이 가장 높았지만 허깅페이스에 공개 모델이 없었다. 코드는 공개하되 모델은 비공개로 두는 전략이다. 게임사 크래프톤도 비슷했다. 23개 프로젝트를 활발히 업데이트하면서도 허깅페이스에는 진출하지 않았다.

모델 실사용, 254배 차이가 나는 이유

허깅페이스 다운로드는 깃허브 스타와 전혀 다른 그림을 보여줬다.

기업

공개 모델 수

다운로드(최근 30일)

Likes(관심도)

LG AI Research

20

933,454

2,607

SK텔레콤

11

728,018

864

서울대 NLP

49

553,000

170

네이버

9

289,000

672

업스테이지

22

103,000

2,481

야놀자

2

37,900

563

카카오

12

6,800

259

엔씨소프트

9

3,676

291

HuggingFace API 2026-03-25 기준.

1위는 LG그룹의 AI 연구소인 LG AI Research였다. 78억 개 파라미터 규모의 한영 이중언어 모델 EXAONE-3.5-7.8B-Instruct 하나가 33만 건을 기록했고, 20개 모델 전체로는 93만 건이다. 2025년에야 모델을 처음 공개한 LG가 정부 챔피언 5개사 가운데 가장 큰 존재감을 확보했다.

통신사 SK텔레콤은 72만 건으로 2위였지만 실체를 들여다보면 다르다. 2021년에 공개한 한국어 텍스트 생성 모델 ko-gpt2-base-v2 하나가 전체의 94%인 68만 건을 차지했다. 올해 1월 공개한 대형 모델 A.X-K1은 9,517건에 그쳤다. 순위는 높지만 현재 경쟁력을 반영하는 숫자는 아니었다.

다운로드와 커뮤니티 관심도 다른 이야기였다. AI 스타트업 업스테이지는 다운로드가 LG의 9분의 1인 10만 건이었지만, likes는 2,481건으로 LG(2,607건)와 거의 같았다. 개발자가 주목하는 모델과 실제로 활용하는 모델은 달랐다. 깃허브에서 5,209개 스타를 받은 게임사 엔씨소프트는 허깅페이스에서 다운로드 3,676건, likes 291건으로 최하위였다. 코드 관심도와 모델 실사용의 간극이 가장 큰 기업이었다.

비교 기준으로 포함한 서울대 NLP 연구실은 49개 모델에 55만 건으로 3위에 올랐다. 기업이 아닌 학계가 네이버보다 많은 다운로드를 기록한 것이다. 야놀자는 모델 2개로 3만 8천 건을 기록했는데, AI 전문 기업이 아닌 여행 플랫폼이 카카오(6,800건)와 엔씨소프트(3,676건)를 앞질렀다.


코드 공개와 모델 채택은 다른 게임

두 플랫폼의 숫자를 나란히 놓으면 순위가 뒤집힌다.

기업

GitHub 스타(코드 관심)

HuggingFace 다운로드(모델 실사용)

LG AI Research

1,171

933,454

SK텔레콤

1,229

728,018

네이버

13,239

289,000

업스테이지

1,426

103,000

카카오

8,744

6,800

엔씨소프트

5,209

3,676

스타: 누적. 다운로드: 최근 30일.

엔씨소프트의 깃허브 스타는 LG의 4.4배였다. 그러나 허깅페이스 다운로드에서는 LG가 엔씨소프트의 254배다. 카카오도 마찬가지였다. 스타 8,744개에 다운로드 6,800건으로, 코드에 대한 관심이 모델 채택으로 이어지지 않았다.

반면 LG와 업스테이지는 깃허브 스타가 각각 1,171개, 1,426개로 적었지만 허깅페이스 다운로드는 93만 건, 10만 건을 기록했다. 엔씨소프트는 깃허브에 49개 프로젝트를 올렸지만 허깅페이스 모델은 9개였고, LG는 깃허브 프로젝트 22개에 허깅페이스 모델이 20개다. 무엇을 공개했느냐의 차이가 채택의 차이로 나타났다.

정부가 지정한 AI 챔피언 5개사만 놓고 보면 격차는 더 뚜렷했다. 허깅페이스 다운로드 기준 LG(93만 건)와 SK텔레콤(72만 건)이 압도적이었고, 업스테이지(10만 건)가 뒤를 이었다. Naver Cloud(네이버클라우드 계정 기준)와 NC AI는 각각 28만 9천 건, 3,676건으로 챔피언 안에서도 최대 254배 차이가 났다. 정부 지정이 곧 기술 채택을 의미하지는 않았다.

공개한 기술이 실제로 쓰이는지는 정부 지정도, 깃허브 스타 수도 알려주지 않았다. 허깅페이스 다운로드만이 그 답을 갖고 있었다.


이 기사는 News Epoch가 한국 AI 오픈소스 생태계를 정량 추적하기 위해 만든 OpenIndex를 기반으로 작성했습니다.

염지수기자

기업 재무 데이터 · 투자 리포트 · 창업 분석을 한 곳에서

Pitchdeck 무료 체험하기

매주 엄선된 뉴스, 이메일로 받아보세요

뉴스에포크 뉴스레터 · 무료 · 언제든 해지 가능

#AI#Data