AI/AI 동향
벡터 데이터베이스
RevFactory
2023. 4. 12. 01:05
1. Pinecone
- 관리형 벡터 데이터베이스
- 빠르고 확장 가능하며 프로덕션에 신속하게 배포 가능
- 하이브리드 검색 지원
- 네이티브 SPLADE 스파스 벡터 지원
2. Weaviate
- 오픈 소스 벡터 검색 엔진
- 수십억 개의 데이터 개체로 확장
- 즉시 사용 가능한 하이브리드 검색
- 자체 호스팅 또는 관리형 배포 옵션
3. Zilliz
- 관리형 클라우드 네이티브 벡터 데이터베이스
- 수십억 개 규모의 데이터 지원
- 다중 인덱싱 알고리즘, 거리 메트릭, 스칼라 필터링, 시간 여행 검색, 스냅샷을 통한 롤백
- 완전한 RBAC, 99.9% 가동 시간, 분리된 스토리지 및 컴퓨팅, 다국어 SDK
4. Milvus
- 오픈 소스, 클라우드 네이티브 벡터 데이터베이스
- 수십억 개의 벡터로 확장 가능
- Zilliz와 유사한 기능: 다양한 인덱싱 알고리즘, 거리 메트릭, 스칼라 필터링, 시간 여행 검색, 스냅샷을 통한 롤백
- 다국어 SDK, 스토리지 및 컴퓨팅 분리, 클라우드 확장성
5. Qdrant
- 문서 및 임베딩 저장을 위한 벡터 데이터베이스
- 자체 호스팅 및 관리형 Qdrant Cloud 배포 옵션
6. Redis
- AI/ML 워크로드를 비롯한 다양한 사용 사례를 위한 실시간 데이터 플랫폼
- Redis Stack 도커 컨테이너를 사용하는 저지연 벡터 엔진
- Redis Cloud와 함께 제공되는 호스팅/관리형 솔루션
7. LlamaIndex
- LLM을 외부 데이터와 연결하기 위한 중앙 인터페이스
- 비정형 및 정형 데이터를 위한 인메모리 인덱스
- 다양한 사용 사례에 최적화된 광범위한 인덱싱 전략(예: 트리, 키워드 테이블, 지식 그래프)
- 가볍고 사용하기 쉬우며 추가 배포가 필요 없음
- 참고: 쿼리의 메타데이터 필터는 아직 지원되지 않습니다.
DB | 설명 | 타입 | 하이브리드 검색 | 확장성 | 배포 옵션 | 주목할만한 기능 |
Pinecone | 속도, 확장성, 신속한 프로덕션 배포를 위해 설계된 관리형 벡터 데이터베이스 | 관리 | 예 | 대규모 | 관리 | SPLADE 희소 벡터에 대한 기본 지원 |
Weaviate | 수십억 개의 데이터 개체로 원활하게 확장할 수 있도록 구축된 오픈 소스 벡터 검색 엔진입니다. | 오픈 소스 | 예 | 억 규모 | 자체 호스팅, 관리 | 효율적인 키워드 검색 |
Zilliz | 수십억 규모의 데이터를 위해 설계된 관리형 클라우드 네이티브 벡터 데이터베이스입니다. | 관리 | 아니요 | 억 규모 | 관리 | 다양한 기능, 전체 RBAC |
Milvus | 수십억 개의 벡터로 확장 가능한 오픈 소스 클라우드 네이티브 벡터 데이터베이스입니다. | 오픈 소스 | 아니요 | 억 규모 | 자체 호스팅, 관리 | Zilliz 과 유사한 기능, 클라우드 확장 가능 |
Qdrant | 문서 및 벡터 임베딩을 저장할 수 있는 벡터 데이터베이스 | 둘다 | 아니요 | 지정되지 않음 | 자체 호스팅, 관리형 클라우드 | 유연한 배포 옵션 |
Redis | AI/ML 워크로드를 포함한 다양한 사용 사례에 적합한 실시간 데이터 플랫폼입니다. | 둘다 | 아니요 | 지정되지 않음 | 자체 호스팅, Redis Cloud | 대기 시간이 짧은 벡터 엔진 |
LlamaIndex | LLM을 외부 데이터와 연결하여 인메모리 인덱스를 제공하는 중앙 인터페이스입니다. | 중앙 집중식 | 아니요 | 지정되지 않음 | 해당 없음 | 다양한 인덱싱 전략, 사용하기 쉬운 |