25.6.16

Graph Database 소개

네트워크 그래프 계층 트리 구조 또는 경로 : 워크로드를위한 플랫폼을 선택하는 경우 이러한 단어 중 하나에 해당 워크로드를 설명한다면, 당신은 그래프 데이터베이스를 검토 할지도 모릅니다.

그래프 데이터베이스는 데이터 관리에서 가장 빠르게 성장하는 카테고리 중 하나이며, 아직 그들은 많은 사람들에게 수수께끼. 독립 실행 형 그래프 데이터베이스가 SQL을 지원하지 않기 때문에, 그들은 NoSQL 제품군의 일부입니다. 그러나 그들은 키 값을 저장하고 열의 저장소 문서 저장소와 같은 다른 NoSQL 데이터베이스는 다릅니다. 관계 데이터 - - 그들은 데이터의보다 구체적인 종류를 저장하고 작은 그래프의 워크로드는 거의 모든 워크로드의 디커플링 안에있는 "범용"

그래프 데이터베이스의 종류에 있습니다. 모든 그래프 데이터베이스가 정점과 그들 사이의 에지 (관계)를 구현하지만, 속성의 그래프는 정점과 에지의 "속성"또는 속성의 추가를 가능하게합니다. 그래프 데이터베이스는 정점과 에지의 수십 또는 수십억을 가질 수 있습니다. 극단 그래프 데이터베이스 잘 사용 할 수 있습니다.

속성의 그래프는 대부​​분의 시장 점유율을 그래프 데이터베이스의 스타일입니다. 기타 주요 스타일은 RDF (자원 기술 프레임 워크)의 트리플 스토어입니다. 더 많은 참가자를 가지고 있기 때문에, 그것은 W3C (월드 와이드 웹 컨소시엄) 표준을 기반으로합니다. RDF 형식의 데이터베이스의 정점과 에지의 속성에 상당하는 것을 만들려면 속성을 사용하여 정점에 정점이나 에지에서의 새로운 관계를 만듭니다.

그래프 데이터베이스는 관계형 데이터베이스 관계를 판별하려면 모든 데이터를 살펴 필요가 있고, 한편, 그들은 단지 관련 정점을 처리하기 위해 (A는 3 홉 B에 연결되어있는 경우 예를 들어, 결정) 경로 분석에 아주 잘합니다. 당신은 강력한 인덱싱 및 쿼리의 최적화 전략과 RDBMS와 같은 성능에 접근 할 수 있지만, 그래프 데이터베이스에서 당신은 이러한 쿼리를 튜닝하는 데 필요한없이 잘 수행하거나 그냥 그 인덱스를 가질 수 있습니다 알고 있습니다.

물론 그래프 데이터베이스는 단순히 경로 분석을위한 것이 아닙니다. 그들은 정점 "에지 값에 따라 우선하여 점의 상대적인 우선 순위를 결정하기에 안성맞춤입니다. 아마 최선의 PageRank 알고리즘은이를 예시하고 있습니다.

PageRank가 인바운드 관계의 질 (안 양)에 따라 정점을 평가하고 웹 사이트를 평가하기 위해 Google이 사용됩니다. 어떻게 페이지 순위는 인바운드 링크의 품질을 결정합니까? 같이 그 정점에 인바운드 링크의 품질 및에 따릅니다.

지난해 공급 업체에서 그래프 데이터베이스 간의 경쟁의 주요 포인트로 사용되는 스토리지가 그래프에서 사용되는 언어의 장점을 들어 왔습니다. Neo4j의 주요 부동산 그래프는 주로 그것이 지난해 오픈 소스를 만든 사이퍼를 사용하고 있습니다. RDF 저장소는 주로 SPARQL을 사용하고 있습니다.

모두 그래프 알고리즘의 스루를 포함한 그래프 데이터를위한 풍부한 기능을 가지고 있습니다.

데이터베이스는 SQL 실행 세번째 그래프 언어를 만들고 마찬가지로 그래프 알고리즘에 뻗어 있습니다. 등의 Teradata Aster 같은 SQL 엔진은 당신은 단순히 정점과 에지가 테이블에 쿼리를 가르쳐주세요. 결과는 역시 테이블로 돌아옵니다.

우리 로서도 활동으로 끼워 벤더 (코어 등) 비 그래프를보고 있습니다. DataStax는 지난해 타이탄 뒤에 팀을 인수 해 지금 타이탄에 따라 DataStax 그래프를 가지고 있습니다. 우리는 왕년의 만능 데이터베이스에 슬로우 반환을 참조하십시오 시작합니다. 새로운 승자는 결국 오늘날의 모든 범용 데이터베이스가 원시적 보이는 그래프 기능이 포함됩니다있게합니다.

No comments:

Post a Comment