최종편집:2024-05-04 09:20 (토)
LG, 초거대AI '엑사원 2.0' 공개 …"신소재·신약개발에 활용"
상태바
LG, 초거대AI '엑사원 2.0' 공개 …"신소재·신약개발에 활용"
  • 이강미 기자
  • 승인 2023.07.19 15:28
  • 댓글 0
이 기사를 공유합니다

문헌 4500만건·이미지 3억5000만장 학습
한국어·영어 '이중언어' 모델 전문가 대화형 등 맞춤형 AI 플랫폼 선봬
오는 3~4분기 서비스 시작예정 ... "상위 1% 전문가 AI 개발중"
배경훈 LG AI연구원장이 19일 서울 마곡 LG사이언스파크 컨버전스홀에서 열린 LG AI 토크 콘서트에서 엑사원(EXAONE) 2.0을 발표하고 있다. ⓒ
배경훈 LG AI연구원장이 19일 서울 마곡 LG사이언스파크 컨버전스홀에서 열린 LG AI 토크 콘서트에서 엑사원(EXAONE) 2.0을 발표하고 있다. ⓒLG(주)

[매일산업뉴스]LG가 신소재, 신물질, 신약 등의 개발에 활용할 수 있는 초거대 인공지능(AI) '엑사원(EXAONE) 2.0'을 선보였다.

LG AI연구원은 19일 서울 강서구 마곡 LG사이언스파크 컨버전스홀에서 'LG AI 토크 콘서트 2023'을 열고 엑사원 2.0을 공개했다.

초거대 AI는 대용량 연산이 가능한 컴퓨팅 인프라를 기반으로 대규모 데이터를 스스로 학습해 인간처럼 사고·학습·판단하는 AI다.

LG AI연구원은 LG가 2020년 설립한 그룹 AI 연구의 싱크탱크 역할을 하는 조직이다. LG는 2018년 구광모 ㈜LG 대표 취임 이후 AI를 미래 성장 동력으로 집중 육성하고 있다. 지난해에는 향후 5년 간 AI·데이터 분야 연구개발에 3조6000억원을 투입해 미래 기술을 선점하고 인재 영입에도 적극 나서고 있다.

이번에 공개한 엑사원 2.0은 LG AI연구원이 2021년 12월 첫 선을 보인 '엑사원'에서 한단계진화된 버전이다.

세상의 지식을 이해하고 발견하는 상위 1%의 전문가 AI를 표방하는 엑사원 2.0은 LG 계열사와 국내외 파트너사를 통해 확보한 특허와 논문 등 전문 문헌 약 4500만 건과 이미지 3억5000만장을 학습했다.

학습 데이터양도 기존 모델보타 4배 이상 늘렸다. 저작권, 신뢰성 등 AI 윤리원칙도 준수하며 데이터 학습을 진행했다.

특히 초거대 AI의 고비용 이슈를 해결하고자 대규모 언어모델(LLM), 이미지와 언어 등 여러정보를 동시에 처리하는 멀티모달 모델의 경량화에 힘을 쏟았다.

연구원은 현존 전문 지식데이터의 상당수가 영어로 된 점을 고려해 엑사원 2.0을 한국어와 영어를 동시에 이해하고 답변할 수 있는 이중언어 모델로 개발했다.

엑사원 2.0의 언어모델은 기존 모델과 동일한 성능을 유지하면서도 추론(Inference) 처리 시간은 25% 단축하고, 메모리 사영량은 70%줄여 비용을 약 78%절감했다.

언어와 이미지간 양방향 생성이 가능한 멀티모달 모델은 이미지 생성 품질을 높이기 위해 기존 모델 대비 메모리 사용량을 2배 늘렸지만, 추론 처리시간을 83%단축해 66%의 비용절감을 달성했다고 연구원측은 설명했다.

고객들이 엑사원 2.0을 원하는 용도나 예산에 맞게 모델 크기부터 종류(언어·비전·멀티모달)까지 맞춤형으로 설계할 수 있다고 연구원은 설명했다.

19일 서울 마곡 LG사이언스파크 컨버전스홀에서 열린 LG AI 토크 콘서트에서 엑사원 디스커버리(EXAONE Discovery)를 발표하고 있는 배경훈 LG AI연구원장. ⓒLG(주)
19일 서울 마곡 LG사이언스파크 컨버전스홀에서 열린 LG AI 토크 콘서트에서 엑사원 디스커버리(EXAONE Discovery)를 발표하고 있는 배경훈 LG AI연구원장. ⓒLG(주)

이날 연구원은 엑사원의 3대 플랫폼 ▲유니버스 ▲디스커버리 ▲아틀리에를 함께 소개했다.

엑사원 유니버스는 전문가용 대화형 AI 플랫폼이다. 전문성이 필요한 분야의 질문에 대해 근거에 기반한 정확한 답변을 생성한다. 사전 학습한 데이터는 물론 각 분야 최신 전문 데이터까지 포함해 근거를 찾아내며 추론한 답변을 제시한다.

엑사원 디스커버리는 화학·바이오 분야 발전을 앞당길 신소재·신물질·신약 개발 플랫폼이다. 멀티모달 AI 기술을 활용해 전문 문헌의 텍스트뿐 아니라 분자 구조, 수식, 차트, 테이블, 이미지 등 비텍스트 정보까지 데이터베이스화하는 기술을 적용했다. AI와 대화하며 전문 문헌 검토, 소재 구조 설계, 소재 합성 예측까지 가능하며 연구개발 소요 시간을 40개월에서 5개월로 단축할 것으로 연구원은 예상했다. 회사 측은 "LG의 심층 문서 이해 기술이 세계 최고 수준"이며 "화학 및 바이오 분야의 발전을 앞당길 것"이라고 밝혔다.

엑사원 아틀리에는 이미지를 언어로 표현하고 언어를 이미지로 시각화하는 멀티모달 AI 플랫폼이다. 저작권을 확보한 이미지와 텍스트가 짝을 이룬 페어 데이터 3억5000만장을 학습한 엑사원 2.0을 기반으로 이미지 생성과 이해에 특화한 기능을 제공한다.

연구원은 엑사원 유니버스·디스커버리·아틀리에 서비스를 LG 그룹 내 연구진 등을 대상으로 올해 3∼4분기에 시작할 예정이다.

배경훈 LG AI연구원장은 "LG는 국내에서 유일하게 이중 언어 모델과 양방향 멀티모달 모델을 모두 상용화한 기업이며, 세상의 지식을 이해하고 발견하는 상위 1%의 전문가 AI를 개발하고 있다"고 말했다.

이어 "국내외 파트너사와 협력해 성공 사례를 만들어가며 다른 생성형 AI와는 차별화된 고객 가치를 창출하는 글로벌 경쟁력을 갖춘 AI 컴퍼니로 발전해 나갈 것"이라고 포부를 밝혔다.


관련기사

댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
0 / 400
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.
주요기사