최근 데이터 분야에서도 온톨로지(Ontology) 개념이 확산되고 있습니다. 온톨로지라는 용어는 고대 그리스 철학에서 유래한 것으로 ‘존재에 대한 학문’이라는 의미를 가지고 있습니다. 원래는 철학적 관점에서 세상을 구성하는 존재가 무엇인지, 그리고 이들 간의 관계가 무엇인지를 탐구하는 존재론의 개념이었습니다. 이런 개념이 최근 컴퓨터 과학 또는 정보학으로 넘어오면서 주어진 영역 내에서 어떤 정보 또는 개념들이 존재하고, 그 정보 또는 개념들이 서로 어떻게 연결되어 있는지를 명확히 구정하고 구조화된 형태로 표현하는 것을 온톨로지라고 합니다.
온톨로지는 시멘틱(Semantic) 개념과 유사합니다. 온톨로지는 특히 미국의 AI 분석 서비스 업체인 팔란티어(Palantir)의 관리 모델로서 많은 관심을 받고 있습니다. 팔란티어는 정부 또는 국방용 고담(Gotham) 솔루션과 기업용 파운드리(Foundry) 솔루션을 제공하고 있는데, 모두 공통적으로 온톨로지라는 개념의 데이터 관계 또는 맥락 분석을 통한 문제 해결이라는 방식을 취하고 있습니다. 팔란티어에서 온톨로지는 데이터 의미를 정의하고 구조화하는 핵심 기술이라고 할 수 있습니다.
데이터의 온톨로지 구성

개념적으로 온톨롤지 구성의 핵심 요소는 크게 객체(Objects), 속성(Properties), 링크(Links) 라고 할 수 있습니다. 객체는 해결하고자 하는 비즈니스 문제의 핵심 구성요소를 의미하고, 속성은 이러한 각 객체를 구성하는 세부 특성 정보를 말합니다. 그리고 링크는 이러한 서로 다른 객체들 사이의 관계를 정의합니다. 동일한 객체에 대해서도 해결하고자 하는 문제에 따라 속성 값이 달라지며, 이에 따라 링크 정보도 달라집니다. 따라서 온톨로지 적용에 있어서 가장 첫 단계는 해결하고자 하는 문제를 정확하게 정의하는 것입니다.
데이터 온톨로지 적용
그러면 데이터로 문제를 해결함에 있어서 언제 온톨로지 개념을 적용하는 것이 좋을까요? 온톨로지 개념을 적용하기 위해서는 해결하고자 하는 문제에 대한 데이터 의미 정의와 관계를 파악하는 것이 필수적으로 선행되어야 합니다. 그리고 이를 위해서는 데이터에 대한 도메인 지식을 보유한 사람이 직접 이런 의미와 관계를 정의해야 하는데, 여기에는 많은 노력이 필요합니다. 따라서 꼭 필요한 문제 또는 과제에만 적용하는 것이 효과적이라고 할 수 있습니다. 특정 영역 내에서 간단한 데이터 분석이나 AI 모델링의 경우 굳이 온톨로지 개념을 적용하지 않더라도 빠르게 문제를 해결할 수 있는 경우가 대부분입니다.
온톨로지는 간단한 유형의 small y 문제 보다는 크고 복잡한 유형의 Big Y 문제를 해결하는데 적용하는 것이 효과적입니다. 앞에서 얘기했듯이 온톨로지 적용을 위해서는 데이터의 의미 파악과 관계 정의가 필요하기 때문에, 비즈니스나 프로세스 측면에서 복잡한 문제를 해결하는데 적용하는 것이 더 효율적입니다. 특히 다양한 Value Chain에 걸쳐 있는 복잡한 데이터를 활용하여 문제를 해결하는 과제에 적용하는 것이 좋습니다.
이렇게 Big Y 문제 해결 위주로 온톨로지 개념을 적용하여 데이터를 구조화하고 관계를 정의하고, 이를 지속적으로 확장함으로써 궁극적으로 관계 중심의 데이터 자산화까지 가능해집니다. 다음 글에서는 온톨로지 개념을 적용하는 방법에 대해 이야기 하도록 하겠습니다.
'데이터 관리' 카테고리의 다른 글
| AI 활용을 위한 Vector DB vs. Graph DB (0) | 2025.09.21 |
|---|---|
| 데이터의 관계를 정의하라 - Ontology (2) (0) | 2025.09.17 |
| AI 활용에도 데이터 전처리가 필요할까? (0) | 2025.09.12 |
| 사내 문서를 AI로 읽고 이해할 수 있도록 하라 (0) | 2025.09.08 |
| 기업 내 문서를 데이터화 하라 (0) | 2025.09.06 |