DeepSeek은 AI의 기억 능력을 향상시키는 새로운 방법을 찾았을 수도 있습니다
인공지능/AI 전문 정보
중국 AI 회사 DeepSeek가 출시한 AI 모델은 AI의 “기억” 능력을 크게 향상시킬 수 있는 새로운 기술을 사용합니다. 지난 주에 출시된 OCR(광학 문자 인식) 모델은 이미지에서 텍스트를 추출하여 기계가 읽을 수 있는 단어로 변환하는 방식으로 작동합니다. 이는 스캐너 앱, 사진 속 텍스트 번역, 다양한 접근성 도구를 지원하는 기술과 동일합니다. OCR은 이미 수많은 고성능 시스템을 갖춘 성숙한 분야이며, 논문과 일부 초기 리뷰에 따르면 DeepSeek의 새 모델은 주요 벤치마크에서 최고 모델과 동등한 성능을 발휘합니다.
핵심 특징
고품질
검증된 정보만 제공
빠른 업데이트
실시간 최신 정보
상세 분석
전문가 수준 리뷰
상세 정보
핵심 내용
중국 AI 회사 DeepSeek가 출시한 AI 모델은 AI의 “기억” 능력을 크게 향상시킬 수 있는 새로운 기술을 사용합니다. 지난 주에 출시된 OCR(광학 문자 인식) 모델은 이미지에서 텍스트를 추출하여 기계가 읽을 수 있는 단어로 변환하는 방식으로 작동합니다. 이는 스캐너 앱, 사진 속 텍스트 번역, 다양한 접근성 도구를 지원하는 기술과 동일합니다. OCR은 이미 수많은 고성능 시스템을 갖춘 성숙한 분야이며, 논문과 일부 초기 리뷰에 따르면 DeepSeek의 새 모델은 주요 벤치마크에서 최고 모델과 동등한 성능을 발휘합니다. 그러나 연구자들은 이 모델의 주요 혁신은 정보를 처리하는 방식, 특히 기억을 저장하고 검색하는 방식에 있다고 말합니다. AI 모델이 정보를 “기억”하는 방식을 개선하면 실행에 필요한 컴퓨팅 성능이 줄어들어 AI의 대규모(그리고 증가하는) 탄소 발자국을 완화할 수 있습니다. 현재 대부분의 대규모 언어 모델은 텍스트를 토큰이라는 수천 개의 작은 단위로 나눕니다. 이는 텍스트를 모델이 이해할 수 있는 표현으로 변환합니다
상세 분석
. 그러나 최종 사용자와의 대화가 길어짐에 따라 이러한 토큰을 저장하고 계산하는 데 비용이 빨리 듭니다. 사용자가 AI와 오랫동안 채팅할 때 이러한 문제로 인해 AI는 들은 내용을 잊어버리고 정보가 혼란스러워질 수 있습니다. 이러한 문제를 일부에서는 “컨텍스트 부패”라고 부릅니다. DeepSeek에서 개발하고 최신 논문에 발표한 새로운 방법은 이 문제를 극복하는 데 도움이 될 수 있습니다. 단어를 토큰으로 저장하는 대신, 시스템은 마치 책의 페이지를 사진으로 찍는 것처럼 쓰여진 정보를 이미지 형태로 압축합니다.
정리
이를 통해 모델은 훨씬 적은 수의 토큰을 사용하면서도 거의 동일한 정보를 유지할 수 있다고 연구진은 밝혔습니다. 본질적으로 OCR 모델은 더 많은 정보를 AI 모델에 보다 효율적으로 담을 수 있는 이러한 새로운 방법에 대한 테스트 베드입니다. 텍스트 토큰 대신 시각적 토큰을 사용하는 것 외에도 모델은 인간의 기억이 사라지는 방식과 다르지 않은 계층형 압축 유형을 기반으로 구축되었습니다. 오래되거나 덜 중요한 콘텐츠는 공간을 절약하기 위해 약간 더 흐릿한 형식으로 저장됩니다. 그럼에도 불구하고 이 논문의 저자는 높은 수준의 시스템 효율성을 유지하면서 이 압축된 콘텐츠를 백그라운드에서 계속 액세스할 수 있다고 주장합니다. 텍스트 토큰은 오랫동안 AI 시스템의 기본 구성 요소였습니다. 대신 시각적 토큰을 사용하는 것은 파격적이며 결과적으로 DeepSeek의 모델은 연구자들의 관심을 빠르게 끌고 있습니다. 전 Tesla AI 책임자이자 OpenAI의 창립 멤버인 Andrej Karpathy는 X에 대한 논문을 칭찬하며 이미지는 궁극적으로 B가 될 수 있다고 말했습니다.
자주 묻는 질문
Q. 어떤 정보를 제공하나요?
A. 인공지능/AI 관련 최신 정보를 제공합니다.
Q. 신뢰할 수 있나요?
A. 검증된 출처만 선별합니다.
Q. 더 궁금한 점은?
A. 댓글로 문의하세요.
원문 출처
이 글은 원본 기사를 참고하여 작성되었습니다.