AI/AI 동향

Github의 Copilot for Business 출시. But..

RevFactory 2023. 2. 19. 05:05
Github은 기업용 버전인 Copilot for Business 가 지난해 12월 부터 진행된 베타 단계를 거쳤으며 2023년 2월 15일부터 정식으로 사용 가능하다고 발표했습니다.
 
요금제는 유저 당 월 19달러로 책정되었으며, 기존 개인용 기능에 간단한 라이선스 관리 및 조직 차원의 정책관리, 프라이버시 강화등의 기능을 추가했다고 합니다. 또한 최신 업데이트를 통해 생성되는 코드의 보안 취약성도 개선했다고 하네요.

 

 

Copilot 사용 현황

GitHub Copilot은 100만명이 넘는 사용자와 400개 이상의 조직에서 사용중이라고 합니다.
 
그리고 Copilot 사용자 대상으로 연구를 진행하기도 했는데요. Copilot 을 사용한 개발자가 사용하지 않은 개발자보다 55% 정도 더 빠르게 작업을 완료했다고 합니다. 또한 Copilot 사용자의 75%가 만족을 느끼고 있으며, Copilot 사용자는 Copilot이 생성한 코드가 전체 코드 중 46%정도라고 합니다.
 
2022년 6월 개인용 GitHub Copilot을 처음 출시했을 때 개발자 평균 27% 정도가 Copilot에서 생성되었는데 현재는 평균 46%이고, Java에서는 이 수치가 61%까지 나타났다고 하는군요.
 
 

보안 취약점 필터링

Copilot 출시 이후, 논란이 되었던 것 중 하나는 학습된 코드에서 인증키 또는 암호가 포함되어 제안되었던 점인데요. MS가 이러한 보안을 고려하지 않고 AI 모델을 교육하는데 공개된 대량의 데이터를 임의로 사용했다는 점에서 많은 개발자들의 비판을 받기도 했었죠.

 
현재는 이러한 패턴을 사전에 감지하여, 제안되지 않을뿐만 아니라 Copilot 를 통해 작성하는 코드에서도 안전하지 않은 코딩 패턴으로 인지하여 차단한다고 합니다. 이처럼 하드코딩된 자격 증명, SQL 주입 및 경로 주입 등을 포함한 취약한 코딩 패턴을 사전에 막을 수 있다고 강조하고 있습니다.
 
 

Github Copilot은 현재 집단 소송 진행 중

메튜 버버릭이 이끄는 소송인과 그의 팀은 22년 11월 3일 Copilot 집단 소송을 했었죠. 그리고 11월 10일 이어서 두 명의 원고를 대신하여 두번째 집단 소송을 제기하였죠. Copliot 의 오픈소스 라이선스 위반 사례가 곳곳에서 밝혀지면서 Github Copilot 사용에 적색등이 켜지기도 했습니다. (참고 : OpenChain Korea 커뮤니티 발표 자료)
 
MS에서는 오히려 이러한 대응에 반발이라도 하듯, Copilot 사용자를 대상으로 연구를 진행하고 사용자의 75%는 만족한다는 결과를 내기도 했습니다. 또한 올해 1월에는 MS, OpenAI, Github은 법원에 AI 저작권 소송 기각을 요청하기도 했는데요.
 
마이크로소프트와 깃허브는 이 소송이 "두 가지 본질적인 결함, 즉 상해가 없고 달리 실행 가능한 청구가 없기 때문에 실패했다"고 말했고, OpenAI는 유사하게 원고가 "법 위반을 주장하지 못하는 청구가 많다고 주장한다"고 말했습니다. 두 회사는 원고가 주장을 하기 위해 "가상적인 사건"에 의존하고 있으며 도구로 인해 개인적으로 어떻게 피해를 입었는지 설명하지 않는다고 주장했습니다. 이후 소송을 기각하는 법원 청문회는 5월에 열릴 예정이라고 합니다.
 

GPT-3 모델의 한계

현재 인터넷 상의 다양한 의견들을 보면 MS의 연구 결과처럼 Copilot 를 이용하면 개발 속도가 향상되어 더 빠른 코드가 작성되며, 결국에는 AI가 코드를 전부 작성해주는 시대가 올 것이다라며 긍정적으로 받아들이는 개발자들도 많이 있는 것 같습니다.

 

 
반면에 이를 다르게 해석하는 개발자들도 있습니다. 그 이유 중 하나는 바로 Copilot 이 GPT-3 모델에 기반하여 학습되었다는 점인데요. GPT-3는 지속적으로 학습을 수행하지 않습니다. GPT를 그대로 풀면 'Generative Pre-trained Transformer(사전 훈련된 생성 변환기)'가 됩니다. 즉, 사전에 학습(Pre-trained)된 데이터를 기반으로 코드를 생성(Generative) 하는 것이고, 이를 사용하는 개발자들은 지극히 평범한 변형의 반복만 된다는 문제가 있다 보고 있습니다. 즉, Copilot의 사용을 통해 오픈소스가 발전하는 과정에서 볼 수 있었던 알고리즘 기반의 혁신은 기대할 수 없을 것이라고 주장합니다.
 

마무리

그렇다면 우리는 소송 결과에 따라 Copilot를 사용할지 말지 정해야 하는 걸까요?
 
물론 앞서 얘기했던 여러 이슈들이 있을 수 있겠지만 저는 그렇게 생각이 들진 않습니다.
 
아마도 Copilot나 ChatGPT 등의 개발 도구를 한번이라도 사용해본 개발자라면 분명 이것 잘 활용하면 정말 좋겠다는 생각을 해보셨을 겁니다.
 
이러한 AI 도구를 통해 작성중인 코드를 더욱 효과적으로 개선 할 수도 있고, 테스트 코드를 자동으로 작성시킬 수도 있습니다. 또한 보안에 취약한 패턴을 자동으로 탐지하는데 쓰일 수도 있습니다. 현재 필요한 곳에 가장 효과적인 코드를 제안 받을 수도 있습니다. 새로운 오픈소스의 사용법을 잘 모른다면 사용 예제 모범사례를 안내받을 수도 있습니다. 더 좋은 API가 제공되는데 미처 알지 못한 것들을 알게될 수도 있구요. 현재로써는 모든 코드를 작성해주는 만능 도구가 아닌 나의 개발 향상성을 위한 보조 수단으로 사용할 때 아주 멋진 도구라고 생각됩니다.

 

또한 기업도 이러한 AI 도구 기반의 개발 환경을 구축하는데 많은 준비가 해야 합니다. AI 도구 활용에 대한 가이드를 준비하고, 모범 사례를 정의해야 합니다. 뿐만 아니라 AI 도구를 더 폭넓게 도입하기 위해서는 보안 검토를 비롯하여 적절한 재산권 귀속 및 저작권에 대한 여러 가이드라인 및 적극적인 대응을 해야 할 것입니다.
 
 

참고 링크