본문 바로가기

AI/AI 동향15

카카오의 AI 전략 AI Native 소개 카카오의 AI 네이티브 전략과 그 구현 과정에 대한 깊은 통찰을 제공합니다. 카카오가 AI 기술을 단순한 기능 추가가 아닌, 조직 문화와 프로세스 전반에 깊이 통합시켜 새로운 사용자 경험을 창출하고자 하는 노력을 보여줍니다. 특히, AI 버디와 코드 버디와 같은 도구를 통해 업무 효율성을 높이고, 개발자가 더욱 나은 코드를 작성하도록 돕는 과정이 자세히 설명됩니다. 카카오는 AI 기술의 발전을 통해 일상에서의 혁신을 추구하며, 궁극적으로 모든 사용자가 더욱 편리한 일상으로 나아갈 수 있도록 하는 목표를 가지고 있습니다 ⏲️ Time Stamps 00:00 오프닝01:08 카카오의 AI native03:20 AI Native 성숙도 4단계04:00 1단계 탐색05:49 2단계 적용06:26 AI Buddy.. 2024. 11. 8.
OpenAI o1 출시 이후 OpenAI o1 공개 이후 몇 일이 지나지 않았지만 SNS에서는 그래서 과연 o1 이 기존 GPT-4o 와 뭐가 달라졌는가? 하는 의견들이 정말 많이 올라온 것 같습니다. 샘 알트만은 아래와 같은 트윗을 통해 미국 수학올림피아드에 준하는 AIME(American Invitational Mathematics Examination) 시험에서 기존 GPT4o가 13.4점을 받은 반면, o1-preview는 56.7점, o1은 83.3점이라고 밝히며 수학에서의 o1 성능이 월등하게 올랐음을 알렸습니다. 뿐만 아니라 CodeForce 점수를 통해 프래그래밍 영역도 크게 올랐으며, GPQA (Google-Proof Q&A) 를 통해 과학, 생물학, 물리학, 화학 분야에서도 AI 추론능력이 크게 올랐음을 알렸습니다.. 2024. 9. 17.
Google Bard가 Gemini 로 변경되고 Advanced 구독이 추가되었습니다. https://gemini.google.com Google Bard가 Gemini 로 서비스가 변경되었으며, Gemini Ultra 1.0 모델이 적용된 Gemini Advanced 구독이 추가되었습니다. Gemini Ultra는 ChatGPT의 GPT-4 와 비슷한 성능으로 알려져 있습니다. 구독 방식은 기존 구글 One Premium 혜택에 Gemini Advance 가 더 해진 AI Premium 이 추가되었습니다. 월 2만9천원이며, 2달간 무료로 사용 가능합니다. 앞으로 몇 달 안에 확장된 멀티 모달 기능, 더욱 향상된 코딩 기능, 파일, 문서, 데이터 등을 업로드하고 더 심층적으로 분석할 수 있는 기능이 추가될 예정이며, 조만간 Gmail, Docs 등의 구글 앱에서도 AI 기능을 사용할 수 .. 2024. 2. 8.
Google, GPT를 넘어선 Gemini 시대가 열렸습니다. Google 에서 Gemini 를 전격 공개했습니다. Gemini는 처음부터 멀티모달로 구축되었기 때문에 텍스트, 코드, 오디오, 이미지, 동영상 등 다양한 유형의 정보를 일반화하고 원활하게 이해하며, 여러 정보에 걸쳐 작동하고 결합할 수 있다고 합니다. Gemini 의 소개에 앞서 Gemini 의 멀티모달 기능을 이용하여 AI 와 상호작용 하는 영상을 먼저 시청할 것을 추천드려봅니다. 소리를 켜고 한글 자막 적용 후 아래 영상을 시청해보세요! Hands-on with Gemini: Interacting with multimodal AI - YouTube 1. Gemini는 3가지 사이즈로 제공됩니다. 첫 번째 버전인 Gemini 1.0 은 3가지 크기에 맞춰 공개되었는데요. 데이터 센터부터 모바일 기기.. 2023. 12. 7.
GPT-4V 로 살펴보는 LMM(Large Multimodal model)s 시대의 서막 - 1부 최근 마이크로소프트에서 "The Dawn of LMMs" 이란 제목의 논문을 발표했습니다. 여기서는 정량적 벤치마킹 대신 정성적 결과를 사용하여 GPT-4V의 새로운 기능과 잠재적인 새로운 사용 사례를 엿볼 수 있었습니다. 물론 아직까지는 완전히 신뢰할 수 없는 새로운 기능일지라도 GPT-4V가 이미 수행할 수 있는 기능을 발견하고 미리 살펴보데 의의를 두고 있다고 합니다. 이 논문에서는 세부 카테고리별로 프롬프트와 이미지를 통한 GPT-4V 의 결과를 소개하고 있으며, 무려 124개의 이미지 사례를 포함하고 있습니다. 여기서는 모든 사례를 소개할 수 없으므로 한번쯤은 해당 논문을 참고하여 살펴보시는 것을 권장드립니다. https://arxiv.org/pdf/2309.17421.pdf * PDF 논문을 .. 2023. 10. 7.
MistralAI - 최고의 성능까지 갖춘 최초의 Apache 2.0 라이선스 LLM 모델 등장 현재 X (트위터) 에서 가장 많이 언급되고 있는 키워드가 아마도 Mistral이 아닐까 싶은데요. 아마도 Meta의 Llama2 가 이끌고 있던 오픈 LLM 진영에 새로운 돌풍이 일고 있는 것 같습니다. 현재 공개된 모델은 73억(7.3B) 매개변수를 가진 Mistral 7B 입니다. LLM으로는 처음으로 Apache 2.0 라이선스로 공개하였으며, 제한 없이 사용할 수 있습니다. 참고로 Meta의 Llama는 처음에 GPLv3 로 공개했다가, 사용 제약등으로 인해 현재는 LLAMA 2 COMMUNITY LICENSE 로 오픈소스로 분류되진 않고 있습니다. (LLaMa 2 라이선스는 오픈 소스가 아닙니다.) Mistral 7B는 사용 제한도 없는데다가 성능까지도 획기적으로 올라간 벤치마크도 공개했습니다.. 2023. 10. 6.