- 보도자료
SenseTime, “SenseNova 5.0” AI 거대 모델 전면 업그레이드!
2024년 4월23일 - 선도적인 글로벌 인공지능 기업 센스타임(SenseTime)이 지난 4월23일 상하이, 선전 등 도시에서 Tech-day 행사를 열고 업계 최초로 '클라우드-엣지-엔드' 전 스택 거대모델 제품 매트릭스를 발표하여 다양한 규모의 시나리오에서의 응용 요구를 충족시키고, "SenseNova 5.0" AI 거대 모델 시스템을 새롭게 업그레이드하였다. 이 시스템의 종합 능력은 GPT-4 Turbo와 전면적으로 비교되며, 기술 선두에서 생성형 AI의 산업 착륙을 가속화하고, 거대 모델의 필요에 따른 획득을 실현한다.
인공지능 발전의 가장 기본적인 법칙인 '스케일링 법칙'의 원칙 하에, 센스타임은 최적의 데이터 비율을 지속적으로 추구하고 데이터 품질 평가 체계를 구축하여 자체 거대모델 연구 개발을 추진함과 동시에 업계 파트너들에게 거대모델 훈련, 미세 조정, 배포 및 다양한 생성형 AI의 능력 및 서비스를 제공한다.
센스타임의 이사장 겸 CEO인 쉬리(Xu Li)는 "센스타임은 스케일링 법칙의 지침 하에, 거대 모델의 KRE 3단계 구조 (지식-추론-실행) 능력을 지속적으로 탐색하고, 거대모델 능력의 경계를 끊임없이 돌파할 것입니다."라고 밝혔다.
“SenseNova 5.0” 문과 및 이과 능력 대폭 향상, 멀티모달 인터랙션 추가
2023년 4월 첫 발표 이후, 센스타임 “SenseNova” 거대모델 시스템은 이미 다섯 번의 주요 버전 업데이트를 거쳤다. 10TB 이상의 토큰으로 훈련되고 많은 합성 데이터를 포함한 새로운 “SenseNova 5.0”은 하이브리드 전문가 아키텍처를 채택하고 추론 시 문맥 창을 약 200K까지 효과적으로 확장할 수 있다.
이번 업데이트는 주로 지식, 수학, 추론 및 코딩 능력을 강화하여 전반적으로 GPT-4 Turbo에 필적하며 주요 객관적인 평가에서 GPT-4 Turbo와 같거나 이를 초과하는 성능을 보인다.
문과 능력 면에서, “SenseNova 5.0”의 창의적 글쓰기 능력, 추론 능력 및 요약 능력이 크게 향상되었으며, 동일한 중국어 지식 주입 후 더 나은 이해, 요약 및 질문 응답을 제공하여 교육, 콘텐츠 산업 등 수직 응용 시나리오에 강력한 지원을 제공한다.
이과 능력 면에서, “SenseNova 5.0”의 수학적 능력, 코딩 능력 및 추론 능력은 업계 최고 수준에 도달하여 금융, 데이터 분석 등 시나리오의 적용에 견고한 기초를 제공한다.
이번 “SenseNova 5.0”의 또 다른 주요 지표는 멀티모달 능력으로, 센스타임의 멀티모달 거대 모델의 그림 및 텍스트 인식 능력은 세계 최고 수준에 도달하였으며, 멀티모달 거대 모델의 권위 있는 종합 벤치마크 테스트인 MMBench에서 종합 점수 1위를 차지하였고, 유명 멀티모달 랭킹인 MathVista, AI2D, ChartQA, TextVQA, DocVQA, MMMU에서 선두적인 성적을 거두었다.
“SenseNova 5.0”은 응용 제품 측면에서도 더 뛰어난 멀티모달 능력을 실현하였으며, 고해상도 긴 그림의 해석 및 이해, 텍스트에서 그림으로의 상호작용 생성, 복잡한 문서 간 지식 추출 및 요약 질문 응답 표시를 실현할 수 있으며, 풍부한 멀티모달 상호작용 능력을 갖추고 있다.
엔드 포인트 모델 업계 1위, 엣지 포인트에서는 기업용 애플리케이션 올인원 출시
중앙화된 컴퓨팅 파워 수요가 엔드 포인트로 확장되는 미래 트렌드와 기업의 엣지 포인트 AI 수요를 예견하여, 센스타임은 업계 최초로 “클라우드-엣지-엔드” 전 스택 거대 모델제품 매트릭스를 선보였다. 여기에는 엔드 디바이스에 적용되는 “센스타임 엔드 포인트 거대 모델”과 금융, 코딩, 의료, 행정 등 여러 분야를 위한 엣지 제품인 “센스타임 기업용 올인원 거대모델”이 포함된다.
모바일 엔드 포인트 사용자들이 거대 모델기술을 활용할 수 있도록 하기 위해, 센스타임은 SenseNova 엔드 포인트 거대 모델을 출시했다. 이 모델은 동일한 스케일에서 최고의 성능을 발휘하며, 모든 스케일에서 우수한 성능을 자랑한다.
센스타임은 또한 엔드와 클라우드의 협업 솔루션을 출시하여, 지능형 판단을 통해 엔드와 클라우드 각각의 장점을 극대화할 수 있다. 네트워크 연결이 필요한 검색이나 복잡한 시나리오를 처리할 때는 클라우드로 분산 처리하고, 일부 시나리오에서는 엔드 포인트 처리가 80%를 넘어 이를 통해 비용을 크게 줄일 수 있다.
센스타임의 엔드 포인트 거대 언어 모델은 업계에서 가장 빠른 추론 속도를 자랑하며, 중급 플랫폼에서 초당 18.3자, 플래그십 플랫폼에서는 초당 78.3자의 평균 생성 속도를 구현한다.
확산 모델 또한 엔드 포인트에서 업계에서 가장 빠른 추론 속도를 실현할 수 있다. 엔드 측 LDM-AI 확장 기술은 한 주요 플랫폼에서 추론 속도가 1.5초 이하로, 경쟁사의 클라우드 앱보다 10배 빠르다. 이는 1200만 화소 이상의 고해상도 이미지를 출력할 수 있으며, 엔드에서 비율 확장, 자유 확장, 회전 확장 등의 이미지 편집 기능을 신속하게 지원한다.
센스타임 엔드 포인트 비즈니스 SDK 출시와 함께 금융, 코딩, 의료, 행정 등 주요 산업의 엣지 포인트에서 증가하는 AI 응용 수요를 충족시키기 위해, 센스타임은 기업용 올인원 거대 모델도 출시하였다. 이 모델은 기업용 1000억 규모 모델 가속과 지식 검색 하드웨어 가속을 동시에 지원하여, 현지 배포가 가능하고, 즉시 사용할 수 있으며, 기업의 거대모델 응용 진입 장벽을 낮춘다. 업계 유사 제품과 비교하였을때 추론 비용은 80% 절감되고, 검색 속도는 크게 향상되며, CPU 작업 부하는 50% 감소된다.
에코 시스템 파트너와 함께 AI 2.0 시대의 혁신적인 제품 응용을 선도하며 새로운 생산력 창출
이번 행사 현장에서 센스타임은 킹소프트 오피스, 하이퉁 증권, 샤오미, YUEWEN 그룹, 화웨이 등 여러 에코 시스템 파트너를 초청하여 거대 모델기술이 오피스, 금융, 이동 등 다양한 분야에서의 응용과 전망에 대해 공동으로 논의하고 교류했다.
2023년부터 센스타임은 킹소프트 오피스와 깊은 협력을 맺고 “SenseNova” 거대모델의 뛰어난 코드 생성 및 도구 호출 능력을 기반으로 WPS 365가 더 높은 효율로 다양한 시나리오에서 능력을 발휘할 수 있는 새로운 생산력 플랫폼을 구축하도록 지원했다. 킹소프트 오피스 CEO 장칭위안은 “오피스 응용 시나리오에서 센스타임의 거대 모델은 매우 뛰어난 성과를 보였으며, 우리 사용자들이 오피스에서 복잡한 문제를 해결하고 효율을 높이는 데 큰 도움을 줄 수 있습니다.”라고 말했다.
금융분야에서 하이퉁 증권과 센스타임은 공동으로 금융 업계 멀티모달 전 스택 거대 모델을 발표했다. 양측은 지능형 고객 서비스, 준법 감시, 코드 보조, 비즈니스 오피스 도우미 등 분야에서 업무 구현을 촉진하고, 지능형 투자 자문, 여론 모니터링 등 업계 최첨단 시나리오를 공동 연구하며, 증권 업계 거대모델의 전 스택 구현 능력을 통합했다. 하이퉁 증권 부총경리 겸 최고 정보 책임자인 마오위싱은 “센스타임과의 협력을 통해 거대 모델기술을 활용하여 하이퉁 증권의 디지털 전환을 실현했습니다. 앞으로 우리는 전 스택 AI 능력을 결합하여 업무 프로세스, 상호 작용 혁신 및 디지털 비즈니스 시스템 재구성을 진행할 것입니다.”라고 언급했다.
개인 이동 시나리오에서 최근 시장에서 큰 인기를 끌고 있는 샤오미 자동차 SU7의 스마트 카 실내에는 센스타임의 거대 모델기술이 적용되었다. 센스타임의 엔드-클라우드 거대 모델솔루션을 기반으로 샤오미 샤오아이는 차주에게 지능형 상호 작용 경험을 제공한다. 샤오미 그룹의 샤오아이 총괄 매니저인 왕강은 센스타임의 공동 창업자 겸 최고 과학자인 왕샤오강과의 대화에서 "센스타임의 클라우드-엣지-엔드 전 스택 조합은 샤오미 사물인터넷(IoT) 생태계에 매우 잘 적용되고 적응할 수 있습니다. 우리는 센스타임과 함께 사용자들에게 더 지능적인 제품 경험을 제공하기를 희망합니다."라고 말했다.
또한 센스타임은 Ascend 네이티브를 기반으로 한 업계 거대 모델을 발표하여 금융, 의료, 행정, 코딩 등 다양한 분야의 거대 모델산업 생태계를 공동으로 구축했다.
자체 응용 측면에서, 센스타임의 “SenseNova 5.0”은 SenseMirage, SenseAvatar, SenseThings, SenseSpace, SenseChat-DaYi 등 제품에 중요한 업데이트를 적용했다.
"Text-to-video"시대, 센스타임은 AGI 시대를 향해 나아가고 있다.
이번 Tech day의 마지막 단계에서, 센스타임의 회장 겸 CEO인 쉬리는 오로지 거대 모델로 생성된 세 개의 동영상을 선보였으며, Text-to-video 생성 플랫폼이 인물, 동작 및 시나리오의 제어 가능성에 대해 강조했다.
센스타임의 기술은 Text-to-video 생성 분야에서도 기술적으로 큰 발전을 이루었다. 미래에는 한 문구나 완전한 설명을 입력함으로써 동영상을 생성할 수 있으며, 인물의 의상, 헤어 스타일, 시나리오는 미리 설정된 대로 유지되어 동영상 내용의 일관성이 유지된다.
현재, "SenseNova" 거대모델 체계는 자연어 처리, 비디오 생성, 딥러닝 최적화 등 여러 가지 측면에서 혁신을 이루고 있다.
센스타임은 창립 초기부터 "원천 기술을 유지하고, AI가 인류의 발전을 이끄는 것"을 사명과 비전으로 하고 있으며, 거대모델 기술과 제품은 의료, 교육, 법률, 산업 등 다양한 업종에서 실용적으로 적용되고 있다. "SenseNova" 거대모델은 항상 일반적 인공 지능의 목표를 향해 굳건히 나아가며, 데이터 및 컴퓨팅 역량의 제약을 극복하고 거대모델의 혁신과 실용화를 선도할 것이다.