RDB 단점
•
비정형 데이터 저장의 어려움
◦
관계형 데이터베이스는 주로 표(Table) 형태의 구조화된 데이터를 다루는 데 적합
◦
그러나 AI의 발전으로 텍스트, 이미지, 오디오 등 방대한 양의 비정형 데이터가 넘쳐나게 되었다.
◦
이러한 데이터들을 테이블에 저장하는 것은 적합하지 않다.
•
유사성 검색의 한계
◦
관계형 데이터베이스는 쿼리와 완전히 일치하는 행을 찾아 반환하므로, 벡터 간의 유사성을 계산하고 검색하는 기능이 부족
◦
이로 인해 벡터 데이터를 활용한 유사성 검색이 어렵다.
•
대용량 데이터 처리의 제약
◦
대규모의 벡터 데이터를 저장하고 검색하는 경우, 관계형 데이터베이스는 성능 문제를 겪을 수 있다.
◦
벡터 데이터의 대용량 처리에 최적화되지 않았기 때문
Vector DB vs RDB
•
벡터 데이터베이스는 데이터 관리 및 처리에 대한 특화된 접근 방식으로 인해 기존 데이터베이스와 차별화된다.
차이점
•
데이터 구조
◦
기존 데이터베이스는 데이터를 행과 열로 구성하는 반면, 벡터 데이터베이스는 이미지, 텍스트, 임베딩과 같은 복잡한 데이터에 특히 적합한 고차원 벡터를 저장하고 처리하는 데 중점을 둔다.
•
검색 메커니즘
◦
기존 데이터베이스는 주로 일치 검색 또는 설정된 검색 기준을 사용하는 반면, 벡터 데이터베이스는 유사도 기반 검색을 사용하여 보다 맥락에 맞는 결과를 얻을 수 있다.
•
특화된 기능
◦
벡터 데이터베이스는 가장 가까운 이웃 검색, 범위 검색, 다차원 데이터의 효율적인 처리와 같은 고유한 기능을 제공하여 AI 기반 애플리케이션의 요구 사항을 충족
•
성능과 확장성
◦
벡터 데이터베이스는 고차원 데이터를 효율적으로 처리하는 데 최적화되어 있어 기존 데이터베이스에 비해 더 빠른 검색과 대량의 데이터를 처리할 수 있는 확장성을 제공한다.