본문 바로가기

AI/AI 동향16

DeepSeek R1: 오픈 소스 AI의 새로운 지평을 열다 2025년 1월 20일, 중국의 AI 연구 기업 DeepSeek에서 개발한 혁신적인 추론 모델 DeepSeek R1이 공개되었습니다. DeepSeek은 모든 모델을 오픈 소스로 공개한다는 목표를 가지고 있습니다. DeepSeek R1은 OpenAI의 o1과 같은 최첨단 추론 모델과 비교해도 손색없는 성능을 보여주면서도, 훨씬 저렴한 비용으로 개발되었다는 점에서 AI 업계에 큰 파장을 일으키고 있습니다.    1. DeepSeek R1 이란?DeepSeek R1은 중국 AI 기업 DeepSeek에서 개발한 고급 추론 모델입니다. DeepSeek은 2015년 설립된 중국 양적 헤지 펀드 High-Flyer의 딥러닝 부서인 Fire-Flyer에서 시작된 AI 연구소입니다. High-Flyer는 금융 데이터 분.. 2025. 1. 29.
카카오의 AI 전략 AI Native 소개 카카오의 AI 네이티브 전략과 그 구현 과정에 대한 깊은 통찰을 제공합니다. 카카오가 AI 기술을 단순한 기능 추가가 아닌, 조직 문화와 프로세스 전반에 깊이 통합시켜 새로운 사용자 경험을 창출하고자 하는 노력을 보여줍니다. 특히, AI 버디와 코드 버디와 같은 도구를 통해 업무 효율성을 높이고, 개발자가 더욱 나은 코드를 작성하도록 돕는 과정이 자세히 설명됩니다. 카카오는 AI 기술의 발전을 통해 일상에서의 혁신을 추구하며, 궁극적으로 모든 사용자가 더욱 편리한 일상으로 나아갈 수 있도록 하는 목표를 가지고 있습니다 ⏲️ Time Stamps 00:00 오프닝01:08 카카오의 AI native03:20 AI Native 성숙도 4단계04:00 1단계 탐색05:49 2단계 적용06:26 AI Buddy.. 2024. 11. 8.
OpenAI o1 출시 이후 OpenAI o1 공개 이후 몇 일이 지나지 않았지만 SNS에서는 그래서 과연 o1 이 기존 GPT-4o 와 뭐가 달라졌는가? 하는 의견들이 정말 많이 올라온 것 같습니다. 샘 알트만은 아래와 같은 트윗을 통해 미국 수학올림피아드에 준하는 AIME(American Invitational Mathematics Examination) 시험에서 기존 GPT4o가 13.4점을 받은 반면, o1-preview는 56.7점, o1은 83.3점이라고 밝히며 수학에서의 o1 성능이 월등하게 올랐음을 알렸습니다. 뿐만 아니라 CodeForce 점수를 통해 프래그래밍 영역도 크게 올랐으며, GPQA (Google-Proof Q&A) 를 통해 과학, 생물학, 물리학, 화학 분야에서도 AI 추론능력이 크게 올랐음을 알렸습니다.. 2024. 9. 17.
Google Bard가 Gemini 로 변경되고 Advanced 구독이 추가되었습니다. https://gemini.google.com Google Bard가 Gemini 로 서비스가 변경되었으며, Gemini Ultra 1.0 모델이 적용된 Gemini Advanced 구독이 추가되었습니다. Gemini Ultra는 ChatGPT의 GPT-4 와 비슷한 성능으로 알려져 있습니다. 구독 방식은 기존 구글 One Premium 혜택에 Gemini Advance 가 더 해진 AI Premium 이 추가되었습니다. 월 2만9천원이며, 2달간 무료로 사용 가능합니다. 앞으로 몇 달 안에 확장된 멀티 모달 기능, 더욱 향상된 코딩 기능, 파일, 문서, 데이터 등을 업로드하고 더 심층적으로 분석할 수 있는 기능이 추가될 예정이며, 조만간 Gmail, Docs 등의 구글 앱에서도 AI 기능을 사용할 수 .. 2024. 2. 8.
Google, GPT를 넘어선 Gemini 시대가 열렸습니다. Google 에서 Gemini 를 전격 공개했습니다. Gemini는 처음부터 멀티모달로 구축되었기 때문에 텍스트, 코드, 오디오, 이미지, 동영상 등 다양한 유형의 정보를 일반화하고 원활하게 이해하며, 여러 정보에 걸쳐 작동하고 결합할 수 있다고 합니다. Gemini 의 소개에 앞서 Gemini 의 멀티모달 기능을 이용하여 AI 와 상호작용 하는 영상을 먼저 시청할 것을 추천드려봅니다. 소리를 켜고 한글 자막 적용 후 아래 영상을 시청해보세요! Hands-on with Gemini: Interacting with multimodal AI - YouTube 1. Gemini는 3가지 사이즈로 제공됩니다. 첫 번째 버전인 Gemini 1.0 은 3가지 크기에 맞춰 공개되었는데요. 데이터 센터부터 모바일 기기.. 2023. 12. 7.
GPT-4V 로 살펴보는 LMM(Large Multimodal model)s 시대의 서막 - 1부 최근 마이크로소프트에서 "The Dawn of LMMs" 이란 제목의 논문을 발표했습니다. 여기서는 정량적 벤치마킹 대신 정성적 결과를 사용하여 GPT-4V의 새로운 기능과 잠재적인 새로운 사용 사례를 엿볼 수 있었습니다. 물론 아직까지는 완전히 신뢰할 수 없는 새로운 기능일지라도 GPT-4V가 이미 수행할 수 있는 기능을 발견하고 미리 살펴보데 의의를 두고 있다고 합니다. 이 논문에서는 세부 카테고리별로 프롬프트와 이미지를 통한 GPT-4V 의 결과를 소개하고 있으며, 무려 124개의 이미지 사례를 포함하고 있습니다. 여기서는 모든 사례를 소개할 수 없으므로 한번쯤은 해당 논문을 참고하여 살펴보시는 것을 권장드립니다. https://arxiv.org/pdf/2309.17421.pdf * PDF 논문을 .. 2023. 10. 7.