본문 바로가기
반응형

분류 전체보기271

"오늘날의 LLM은 똑똑합니다." "오늘날의 LLM은 똑똑합니다."Anthropic 의 Skill Creator 의 SKILL.md 에 있는 문구입니다.저는 최근 하네스 구성을 자동으로 해주는 Harness Skill 을 깍아내면서, 스킬이 좀 더 고도화되면 좋을텐데 하고 고민을 하던 차에 2주 전, Anthropic 이 공개한 Skill Creator 를 업데이트 한 내용을 살펴 보았습니다. * Skill Creator : AI에게 새로운 능력(스킬)을 가르치는 도구 그 결과, Skill Creator의 진화는 작은 도구의 업데이트처럼 보이지만, 사실은 AI 산업 전체가 향하는 방향의 축소판이라는 것을 알게 되었습니다. v1에서 v2로의 변화를 관통하는 하나의 문장이 있다면 이것입니다."사람이 AI를 사용하는 도구"에서 "AI가 스스.. 2026. 3. 19.
ChatGPT부터 에이전트 시대까지 (2022~2026) 포함된 내용ChatGPT 출시(2022.11) 이후 AI 산업이 어떤 속도로 변화해왔는지 연도별 타임라인으로 파악합니다.OpenAI, Google, Anthropic, Meta, xAI 등 주요 플레이어의 모델 출시 전략을 비교합니다.모델 개발뿐 아니라 투자, 정책, 오픈소스 영역의 변화를 함께 이해합니다.2026년 현재까지의 최신 동향을 포함하여, 앞으로의 흐름을 예측할 수 있는 기초를 다집니다.1. 연도별 1문장 요약연도키워드요약2022ChatGPT, 대중화OpenAI가 ChatGPT를 출시하며 생성형 AI가 일반 대중의 일상에 진입했습니다.2023GPT-4, 경쟁 격화, 오픈소스GPT-4를 필두로 Google, Anthropic, Meta가 본격 참전하고, 샘 알트먼 해임 사태로 AI 거버넌스 문제.. 2026. 3. 15.
K-문샷(Moonshot) 프로젝트 작성일: 2026년 3월 15일 조사 범위: 정부 공식 자료, 주요 언론 보도(15개+ 매체), 온라인 여론, 해외 유사 프로그램 비교(7개국) 조사 방법: 전문 리서치 에이전트 병렬 투입, WebSearch 56회+, WebFetch 32회+요약 (Executive Summary)K-문샷은 AI와 과학기술을 융합하여 8대 분야 12대 국가 미션을 해결하는 범국가 프로젝트로, 2026년 2월 국가인공지능전략위원회에서 공식 확정되었다. 미국 DARPA의 프로그램 매니저 모델을 참고한 PD(프로그램 디렉터) 제도가 핵심 거버넌스 혁신이다.161개 기업이 참여를 표명하고 88개 AI·인프라 기업과 파트너십을 구축하는 등 민관 협력 규모가 크나, PD 선정 지연, 데이터 사일로, 예산 적정성 등 구조적 과제가 .. 2026. 3. 15.
Claude Code, 100만 토큰의 시대를 열다 2026년 3월 13일, Anthropic이 조용히 바꿔놓은 것들https://claude.com/blog/1m-context-ga어제, Anthropic은 하나의 블로그 포스트를 올렸다. "1M context is now generally available for Opus 4.6 and Sonnet 4.6." 한 줄짜리 제목이었다. 그런데 이 한 줄이 의미하는 바는 꽤 크다 100만 토큰. 약 75만 단어. 코드로 치면 75,000줄 이상. 중간 규모 소프트웨어 프로젝트의 전체 코드베이스를 통째로 읽어들일 수 있는 양이다. 그리고 이제 이것이 추가 비용 없이, 표준 가격으로, 모든 사용자에게 열렸다. 5주 만의 전환돌이켜보면 흐름은 빨랐다. 2월 5일, Anthropic은 Claude Opus 4.6을.. 2026. 3. 14.
Harness Engineering 사례 목차대기업 프로덕션 사례스타트업 및 중견기업 사례오픈소스 도구 및 프레임워크주요 기술 블로그 및 미디어 보도커뮤니티 반응 및 비판적 시각실패 사례 및 교훈2026년 트렌드 전망출처 종합1. 대기업 프로덕션 사례1.1 OpenAI - Codex 에이전트 기반 Harness Engineering (원조 사례)배경: 2025년 8월, OpenAI는 빈 리포지토리에서 시작하여 Codex 에이전트만으로 프로덕션 시스템을 구축하는 실험을 시작했다.핵심 수치:5개월 만에 약 100만 줄의 코드 생성3명의 엔지니어가 약 1,500개의 PR을 오픈 및 머지엔지니어 1인당 하루 평균 3.5개의 PR 처리팀이 7명으로 확대되면서 처리량이 오히려 증가Harness 구조:AGENTS.md를 목차로 활용: 약 100줄의 간결한 .. 2026. 3. 2.
하네스 엔지니어링 1. 하네스 엔지니어링이란 핵심 개념하네스 엔지니어링(Harness Engineering)은 AI 에이전트와 워크플로우에 대한 **행동 제약(behavioral constraints)**과 **개선 순환(improvement cycles)**을 포함하는 시스템 설계를 의미한다. 에이전트의 "바깥쪽 시스템(outside system)"을 설계하는 것으로, 에이전트 내부(컨텍스트, 프롬프트)가 아닌 외부 환경을 다룬다.핵심 비유: "The model is the CPU, the harness is the OS." — Evangelos Pappas용어 등장 배경시점이벤트2026년 2월OpenAI Codex 팀이 "Harness Engineering: Leveraging Codex in an Agent-Firs.. 2026. 3. 2.
반응형