바이두, 도면 분석까지 가능한 고성능 ‘VLM 추론 모델’ 오픈 소스 출시
인공지능/AI 전문 정보
바이두가 구글과 오픈AI의 최신 모델을 능가한다고 주장하는 새로운 비전-언어 모델(VLM)을 공개했다. 이미지 분석에 추론을 더해, 복잡한 도면까지 파악할 수 있다는 것을 장점으로 꼽았다.바이두는 11일(현지시간) ‘어니-4.5-VL-28B-A3B-싱킹(ERNIE-4.5-VL-28B-A3B-Thinking)’를 허깅 페이스를 통해 오픈 소스로 출시했다.특히, 문서 이해와 시각적 추론 등 여러 벤치마크에서 구글의 ‘제미나이 2.5 프로’와 오픈AI의 ‘GPT-5 하이(High)’보다 우수한 성능을 보였다고 강조했다.또 효율성이 강점으
핵심 특징
고품질
검증된 정보만 제공
빠른 업데이트
실시간 최신 정보
상세 분석
전문가 수준 리뷰
상세 정보
핵심 내용
바이두가 구글과 오픈AI의 최신 모델을 능가한다고 주장하는 새로운 비전-언어 모델(VLM)을 공개했다
상세 분석
.
정리
이미지 분석에 추론을 더해, 복잡한 도면까지 파악할 수 있다는 것을 장점으로 꼽았다.바이두는 11일(현지시간) ‘어니-4.5-VL-28B-A3B-싱킹(ERNIE-4.5-VL-28B-A3B-Thinking)’를 허깅 페이스를 통해 오픈 소스로 출시했다.특히, 문서 이해와 시각적 추론 등 여러 벤치마크에서 구글의 ‘제미나이 2.5 프로’와 오픈AI의 ‘GPT-5 하이(High)’보다 우수한 성능을 보였다고 강조했다.또 효율성이 강점으
자주 묻는 질문
Q. 어떤 정보를 제공하나요?
A. 인공지능/AI 관련 최신 정보를 제공합니다.
Q. 신뢰할 수 있나요?
A. 검증된 출처만 선별합니다.
Q. 더 궁금한 점은?
A. 댓글로 문의하세요.
원문 출처
이 글은 원본 기사를 참고하여 작성되었습니다.