본문 바로가기

AI/AI 동향13

오픈소스로 가자! OpenLLaMA 의 등장 현재 OpenAI의 GPT, Google의 LaMDA, Meta의 LLaMA, Amazon의 Titan 등 많은 LLM이 있습니다. 아래 차트를 보더라도 정말 많은 LLM(Large Language Model) 이 있죠. 이미지 출처 : https://github.com/Mooler0410/LLMsPracticalGuide 차트에서 진하게 음영처리 된 것은 오픈소스로 공개된 것이며, 테두리만 표시된 것은 소스가 공개되지 않은 것입니다. 설령 LLM이 오픈소스로 공개되었다고 해도, 학습 결과인 가중치(weights)가 공개되어 있지 않아 모델을 실행해 볼 수는 없었습니다. 하지만 Meta의 LLaMA 는 오픈소스로 공개 (GitHub) 하면서 일부 사용자들에게 승인 과정을 통해 모델 가중치 및 토크나이저를.. 2023. 5. 5.
GitHub Trend 로 보는 AI 오픈소스들 GitHub 에서는 현재 HOT 한 오픈소스를 GitHub Trend 에서 지속적으로 갱신하여 보여주고 있습니다. GitHub에 등록된 오픈소스의 별점(Star) 수 와 Fork 수, 기여자 수등을 고려하여 Trend 순위가 매겨집니다. 현재는 ChatGPT 열풍에 힘 입어, AI 와 관련된 오픈소스들이 거의 도배되고 있다고 보면 되는데요. 몇 가지 주목받고 있는 오픈소스들 위주로 짧게 공유드리고자 합니다. https://github.com/trending 1. 매일 상위에 올라오는 오픈소스 살펴보기 Trending 에서 날짜 기간을 Today 로 하게 되면 하루 단위로 이슈가 되는 오픈소스들을 살펴볼 수 있어요. 4월 12일 기준 아래와 같은 오픈소스들이 상위에 보여지네요. 상위 2개 정도를 살펴볼께요.. 2023. 4. 12.
벡터 데이터베이스 1. Pinecone - 관리형 벡터 데이터베이스 - 빠르고 확장 가능하며 프로덕션에 신속하게 배포 가능 - 하이브리드 검색 지원 - 네이티브 SPLADE 스파스 벡터 지원 2. Weaviate - 오픈 소스 벡터 검색 엔진 - 수십억 개의 데이터 개체로 확장 - 즉시 사용 가능한 하이브리드 검색 - 자체 호스팅 또는 관리형 배포 옵션 3. Zilliz - 관리형 클라우드 네이티브 벡터 데이터베이스 - 수십억 개 규모의 데이터 지원 - 다중 인덱싱 알고리즘, 거리 메트릭, 스칼라 필터링, 시간 여행 검색, 스냅샷을 통한 롤백 - 완전한 RBAC, 99.9% 가동 시간, 분리된 스토리지 및 컴퓨팅, 다국어 SDK 4. Milvus - 오픈 소스, 클라우드 네이티브 벡터 데이터베이스 - 수십억 개의 벡터로 .. 2023. 4. 12.
LangChain 을 알아볼까요? LangChain 에 대해 들어보셨나요? LangChain 은 LLM 에서 구동되는 APP을 개발하기 위한 프레임워크입니다. LangChain 에서 제공되는 라이브러리들을 사용하여 보다 쉽게 LLM 기술들을 활용할 수 있습니다. 현재는 javascript 와 python 으로 구분해서 관리되고 있습니다. 적용하려는 언어에 맞춰 사용하면 됩니다. LangChain은 단순히 API 엑세스 하는 기능도 있지만 그 외에도 다양한 컴포넌트들이 준비되어 있으며, 아래와 같이 크게 두 가지 원칙에 기반하여 작성되었다고 합니다. - Be data-aware : 언어 모델을 다른 데이터 원본에 연결합니다. - Be agentic : 언어 모델이 해당 환경과 상호 작용할 수 있도록 허용합니다. LangChain 사이트에서.. 2023. 4. 1.
Open AI, GPT-4 출시 GPT-4가 출시되었습니다. Open AI 사이트에서 GPT-4 주요 내용을 살펴보실 수 있습니다. https://openai.com/product/gpt-4 1. Live Demo 공개 2023.03.15 05시 (한국시) https://www.youtube.com/live/outcGtbnMuQ?feature=share 데모 시연 내용 기록 language model - 긴 문장을 G 로 시작하는 단어로만 요약하기 -> gpt-3.5 안됨 -> gtp-4 동작 -> 한개 단어 (AI) 가 포함되어서 교정해줌 -> Discord 에서 Q 로 시작하는 단어 요청 -> 정상 동작 AI Programming assitant - ChatGPT 와 Discord 연동하는 jupiter 코드 작성 요청 -> 에러남.. 2023. 3. 15.
Github의 Copilot for Business 출시. But.. Github은 기업용 버전인 Copilot for Business 가 지난해 12월 부터 진행된 베타 단계를 거쳤으며 2023년 2월 15일부터 정식으로 사용 가능하다고 발표했습니다. 요금제는 유저 당 월 19달러로 책정되었으며, 기존 개인용 기능에 간단한 라이선스 관리 및 조직 차원의 정책관리, 프라이버시 강화등의 기능을 추가했다고 합니다. 또한 최신 업데이트를 통해 생성되는 코드의 보안 취약성도 개선했다고 하네요. Copilot 사용 현황 GitHub Copilot은 100만명이 넘는 사용자와 400개 이상의 조직에서 사용중이라고 합니다. 그리고 Copilot 사용자 대상으로 연구를 진행하기도 했는데요. Copilot 을 사용한 개발자가 사용하지 않은 개발자보다 55% 정도 더 빠르게 작업을 완료했다.. 2023. 2. 19.