AI/AI 동향

GitHub Trend 로 보는 AI 오픈소스들

RevFactory 2023. 4. 12. 02:41
GitHub 에서는 현재 HOT 한 오픈소스를 GitHub Trend 에서 지속적으로 갱신하여 보여주고 있습니다.
GitHub에 등록된 오픈소스의 별점(Star) 수 와 Fork 수, 기여자 수등을 고려하여 Trend 순위가 매겨집니다.
현재는 ChatGPT 열풍에 힘 입어, AI 와 관련된 오픈소스들이 거의 도배되고 있다고 보면 되는데요.
몇 가지 주목받고 있는 오픈소스들 위주로 짧게 공유드리고자 합니다.
 
 

1. 매일 상위에 올라오는 오픈소스 살펴보기

Trending 에서 날짜 기간을 Today 로 하게 되면 하루 단위로 이슈가 되는 오픈소스들을 살펴볼 수 있어요.
4월 12일 기준 아래와 같은 오픈소스들이 상위에 보여지네요. 상위 2개 정도를 살펴볼께요.
 
 
 

IDEA-Research / Grounded-Segment-Anything

현재 등장하고 있는 여러 AI 기술들을 연결하여 강력한 파이프라인 구축을 목표로 하고 있는 오픈소스입니다. 
 
예를 들어,
- 자동 라벨링 시스템 구축을 위해 BLIP + Grounding DINO + SAM 을 사용합니다.
- 데이터 팩토리를 조합하여 새로운 데이터를 생성하는데 Grounding DINO + SAM + Stable-diffusion을 사용합니다.
- 음성으로 무엇이든 감지하고 분할하기 위해 Whisper + Grounding DINO + SAM 을 사용합니다.
- 음성으로 편집하는데 Whisper + ChatGPT + Grounding-SAM + SD 를 사용합니다.
- 결과물 예제
 
 

reworkd / AgentGPT

브라우저에서 자율 AI 에이전트를 조립, 구성 및 배포까지 가능한 오픈소스입니다.
베타 사이트에서 서비스를 사용해 볼 수 있습니다.
 
현재 장기간 Memory 를 지원하며, 웹 브라우징 및 웹사이트와 사람들과의 상호작용이 가능합니다.
자율 Agent 란 것이 처음 들으시는 분들은 다소 생소할 수도 있을텐데요. 특정 역할을 하는 또 다른 GPT 를 하나 더 만든다고 보시면 됩니다.
 
사이트에 접속해보면 아래 스크린샷에 볼 수 있듯이 Agent 의 이름과 그 역할을 명시하도록 하는 것을 볼 수 있습니다. 이렇게 생성된 Agent 는 또다른 오픈소스들과 다시 또 결합하여 멋진 일들을 해냅니다.
 
 
 

2. 주 단위로 보는 인기있는 오픈소스

이번주에 인기 있는 오픈소스들이 보입니다.
확실히 최근 트위터, 페이스북, 유튜브 에 회자되는 오픈소스들이 많이 올라와 있습니다.
몇 가지 살펴보겠습니다.
 
 
 

Torantulino / Auto-GPT

아마도 현 시점에 가장 핫한 이슈가 아닐까 싶습니다.
이름 그대로 ChatGPT 를 이용해서 사람의 개입없이 모든 것을 자동화 할 수 있는 실험이 이뤄지고 있는 오픈소스입니다. 목표를 설정하면 그 목표에 적합한 Task 목록을 자동으로 작성하고, 각 Task 를 순차적으로 수행합니다. 그리고 최종 목표에 도달할 때까지 이러한 과정을 자동으로 수행합니다.
 
 
ChatGPT의 짧은 기억을 장기적으로 최대한 유지할 수 있도록 하고, 인터넷 엑세스를 통해 정보들을 계속 수집합니다. GPT-4 API 엑세스가 아직 안되서 직접 수행해보진 않았지만, 데모나 유튜브에 올라온 영상들을 보면 정말 대단하단 생각이 듭니다.
 
참고 영상 
 
 

yoheinakajima / babyagi

위에 설명한 Auto-GPT의 축소판이라고 보면 됩니다. (Baby AGI ... 베이비 아기라고 부르고 싶네요.)
저도 로컬에서 돌려보았는데요. 신기합니다. 다만, 생각보다 많은 API 호출이 발생하므로, 과금에 유의해야 할 것으로 보였습니다.
 
특히, 오픈소스 개발자가 원래 직업이 VC 인데, AI 의 도움으로 개발을 시작하게 되었다고 하는군요. 지금은 퇴근 후 아이들을 재우고 오픈소스를 개발하고 있다고 합니다. 그와 함께 하고자 많은 개발자들이 소통하고 있으며, babyagi에 UI 도 붙여주는 개발자들이 여럿 눈에 띄네요.
 
 
그의 트윗들을 보면 아마도 현재 오픈소스의 힘을 가장 절실히 체감하고 있는 한 분이 아닐까 싶네요.
 
 
 

microsoft / JARVIS

허깅 페이스 모델을 연결해서 사용할 수 있도록 한 HuggingGPT를 마이크로소프트에서 논문도 내고, 구현도 한 오픈소스입니다. 어떤 작업을 해야할 때, 허깅 페이스 모델 중에서 적합 모델을 선택하고, 각 모델들에게 역할을 부여한 다음, 그 결과들를 모아서 최종적으로 응답을 주는 것이죠.
 
 
논문에 나와 있는 예제를 보면 이러한 것이 가능합니다.
"책을 읽고 있는 여자의 이미지를 만들어줘. 포즈는 이 이미지에 있는 남자의 포즈와 동일하게 해줘. 그리고 새로운 이미지에 대한 설명을 목소리로 읽어줘."
 
 

3. 월 단위로 보는 인기있는 오픈소스

페이스북의 LlaMA 를 C/C++로 포팅 한 오픈소스 부터, ChatGPT UI를 클론하거나 개량한 오픈소스들 그리고 LangChain 이 상위에 올라와 있습니다. 이 오픈소스들의 설명은 생략하겠습니다. 관심 있으신 분들은 한번 방문해 보시길 권해 드립니다.