Wikbase 를 이용한 지식그래프 테스트 환경을 구성했던 내용을 정리한다.
l Wikibase 개념
글로벌 지식그래프 중 하나인 Wikidata 운영의 기반이 되는 시스템
MediaWiki를 프론트엔드 시스템으로 사용하며, MediaWiki의 확장기능 형태로 설치되는 방식
JSON, RDF/XML, N3, YAML 등 포맷으로 data export를 지원
Wikibase의 핵심 구성요소 아래와 같음
요소명 | 필수여부 | 기능 |
MariaDB/MySQL or SQLite | 필수 | Mediawiki data 저장 |
MediaWiki | 필수 | Wikibase 위한 기본 시스템 |
Wikibase Extension | 필수 | Wikibase를 위한 필수 확장 기능 |
Other Extensions | 선택 | 활용 편의를 위한 확장 기능 |
Wikidata query service (WDQS) | 선택 | Blazegraph 기반 SPARQL Query 서비스를 위한 구성 요소 (Proxy와 Frontend로 구성 |
QuickStatments | 선택 | Bulk 데이터 작업을 위한 도구 |
ElasticSearch | 선택 | Wikibase 검색어 자동완성 등 레이블에 대한 풀텍스트 검색을 위해 필요 |
l 연구개발 환경 구성을 위한 요소별 접근 경로
요소명 | 접근 경로 |
Wikibase | localhost:8181 |
Mysql | docker port 3306 |
Elasticsearch | docker port 9200, 9300 |
quickstatements | localhost:9191 |
wdqs | docker port 9999 |
wdqs proxy | localhost:8989 |
wdqs frontend | localhost:8282 |
l 개념 구성도
l 설치 방법
Wikibase docker 이미지 다운로드, docker-compose 설치 및 실행
Wikibase 접속하여 데이터를 하나라도 생성 (item과 property)
Quickstatment 활용을 위한 OAuth 키 설정 (optional)
컨테이너 설정
기본 이미지 설치 시 오류가 발생하였으며, “OAUTHO_CONSUMER_KEY”, “OAUTH_CONSUMER_SECRET” 항목을 추가하여 docker 이미지 수정
배포 후 관련 요소의 정상 실행여부 확인
간단히 도커 베이스로 테스트하기는 좋은데...
확장성 있는 서비스로 고려하기에는 무리가 있는듯
'Big Data > 지식그래프(KG)' 카테고리의 다른 글
[지식그래프] 1. Neo4j 설치 (0) | 2022.03.18 |
---|