본문 바로가기

전체 글254

카카오의 AI 전략 AI Native 소개 카카오의 AI 네이티브 전략과 그 구현 과정에 대한 깊은 통찰을 제공합니다. 카카오가 AI 기술을 단순한 기능 추가가 아닌, 조직 문화와 프로세스 전반에 깊이 통합시켜 새로운 사용자 경험을 창출하고자 하는 노력을 보여줍니다. 특히, AI 버디와 코드 버디와 같은 도구를 통해 업무 효율성을 높이고, 개발자가 더욱 나은 코드를 작성하도록 돕는 과정이 자세히 설명됩니다. 카카오는 AI 기술의 발전을 통해 일상에서의 혁신을 추구하며, 궁극적으로 모든 사용자가 더욱 편리한 일상으로 나아갈 수 있도록 하는 목표를 가지고 있습니다 ⏲️ Time Stamps 00:00 오프닝01:08 카카오의 AI native03:20 AI Native 성숙도 4단계04:00 1단계 탐색05:49 2단계 적용06:26 AI Buddy.. 2024. 11. 8.
OpenAI o1 출시 이후 OpenAI o1 공개 이후 몇 일이 지나지 않았지만 SNS에서는 그래서 과연 o1 이 기존 GPT-4o 와 뭐가 달라졌는가? 하는 의견들이 정말 많이 올라온 것 같습니다. 샘 알트만은 아래와 같은 트윗을 통해 미국 수학올림피아드에 준하는 AIME(American Invitational Mathematics Examination) 시험에서 기존 GPT4o가 13.4점을 받은 반면, o1-preview는 56.7점, o1은 83.3점이라고 밝히며 수학에서의 o1 성능이 월등하게 올랐음을 알렸습니다. 뿐만 아니라 CodeForce 점수를 통해 프래그래밍 영역도 크게 올랐으며, GPQA (Google-Proof Q&A) 를 통해 과학, 생물학, 물리학, 화학 분야에서도 AI 추론능력이 크게 올랐음을 알렸습니다.. 2024. 9. 17.
차원이 다른 AI 번역: 더 똑똑해진 한글 자막 생성기를 소개합니다 영상 콘텐츠의 급증과 함께 자막의 중요성도 크게 증가하고 있습니다. 특히 영어에서 한국어로 번역할 때, 자막의 정확성과 자연스러움은 시청 경험에 결정적인 영향을 미칩니다. 이를 해결하기 위해, 제가 직접 만들어 사용하고 있는 더 똑똑해진 AI 한글 자막 생성기를 소개합니다. 이 도구는 기존 번역기의 한계를 넘어서, 더 자연스럽고 오류 없는 고품질의 한글 자막을 제공합니다. 지난 9월 초 Josh Long의 Spring Boot 이 한국을 방문해 밋업을 진행했었는데요. 영상의 한글 자막을 만드는데도 해당 자막 생성기를 사용했습니다. 처음에는 일반 AI 번역으로 시도를 했다가 프롬프트 엔지니어링을 적용해서 다시 자막을 생성했습니다. 아래 스크린샷에서 위쪽은 일반 AI 번역, 아래는 프롬프트 엔지니어링이 적용.. 2024. 9. 14.
Google Bard가 Gemini 로 변경되고 Advanced 구독이 추가되었습니다. https://gemini.google.com Google Bard가 Gemini 로 서비스가 변경되었으며, Gemini Ultra 1.0 모델이 적용된 Gemini Advanced 구독이 추가되었습니다. Gemini Ultra는 ChatGPT의 GPT-4 와 비슷한 성능으로 알려져 있습니다. 구독 방식은 기존 구글 One Premium 혜택에 Gemini Advance 가 더 해진 AI Premium 이 추가되었습니다. 월 2만9천원이며, 2달간 무료로 사용 가능합니다. 앞으로 몇 달 안에 확장된 멀티 모달 기능, 더욱 향상된 코딩 기능, 파일, 문서, 데이터 등을 업로드하고 더 심층적으로 분석할 수 있는 기능이 추가될 예정이며, 조만간 Gmail, Docs 등의 구글 앱에서도 AI 기능을 사용할 수 .. 2024. 2. 8.
오픈소스로 완성하는 AI Full Stack AI와 관련된 수 많은 오픈소스들이 쏟아지면서 오픈소스 생태계는 그야말로 AI 오픈소스 르네상스를 맞이하고 있습니다. LangChain의 성공을 시작으로 많은 오픈소스들이 나오면서 AI 업계 시스템을 빠르게 메꾸고 있기도 합니다. 여러 계층의 AI의 Stack 별로 인기를 누리고 있는 오픈소스를 한번 살펴보려고 합니다. Open LLM 생성형 AI의 핵심인 LLM(Large Language Model)은 GPT를 필두로 한 Closed LLM과 Llama 진영의 Open LLM 두 축으로 나뉘는데, Mistral 팀의 모델이 오픈소스 라이선스로 모델을 공개하였고, 뛰어난 성능까지 발휘하여 많은 이들의 관심을 받고 있습니다. Open LLM 은 주로 허깅페이스를 통해 관리하고 제공됩니다. Mixtral-8.. 2024. 1. 23.
Google, GPT를 넘어선 Gemini 시대가 열렸습니다. Google 에서 Gemini 를 전격 공개했습니다. Gemini는 처음부터 멀티모달로 구축되었기 때문에 텍스트, 코드, 오디오, 이미지, 동영상 등 다양한 유형의 정보를 일반화하고 원활하게 이해하며, 여러 정보에 걸쳐 작동하고 결합할 수 있다고 합니다. Gemini 의 소개에 앞서 Gemini 의 멀티모달 기능을 이용하여 AI 와 상호작용 하는 영상을 먼저 시청할 것을 추천드려봅니다. 소리를 켜고 한글 자막 적용 후 아래 영상을 시청해보세요! Hands-on with Gemini: Interacting with multimodal AI - YouTube 1. Gemini는 3가지 사이즈로 제공됩니다. 첫 번째 버전인 Gemini 1.0 은 3가지 크기에 맞춰 공개되었는데요. 데이터 센터부터 모바일 기기.. 2023. 12. 7.