Depozitare pe coloană

Versiunea stabilă a fost verificată pe 7 august 2022 . Există modificări neverificate în șabloane sau .

Stocarea pe coloană  este o modalitate de organizare a stocării în baze de date , atunci când datele nu sunt stocate linie cu linie (linie cu linie), ci coloană cu coloană. Este cel mai eficient pentru operațiunile de selectare a datelor dintr-un subset mic de coloane cu procesarea lor ulterioară coloană cu coloană, precum și pentru compresia datelor (deoarece coloanele stochează adesea date duplicate sau închise). Inserarea unui număr mare de rânduri poate fi implementată eficient, dar operațiunile de inserare, actualizare și ștergere unică sunt mai puțin eficiente în stocarea coloanelor decât în ​​stocarea rândurilor.

Columnar DBMS  este un sistem de gestionare a bazelor de date care acceptă stocarea în coloană. SGBD-urile relaționale tradiționaleutilizează de obicei stocarea în rânduri, care este eficientă pentruscenariile OLTP , în timp ce pentru sarcinile de lucru OLAP , stocarea pe coloană tinde să ofere performanțe mai bune.

SGBD-urile coloane relaționale includ Teradata Database , Netezza , Sybase IQ , kdb , C-Store (și descendentul său Vertica ), Greenplum , Hana , ParAccel (și descendentul său Amazon Redshift ), MonetDB , ClickHouse . Un număr de SGBD-uri relaționale tradiționale implementează stocarea în coloană ( Oracle Database , MS SQL Server , MariaDB ) sau există suplimente (de exemplu, Citus pentru PostgreSQL ). Principalele formate Hadoop - RCFIle , ORC , Parquet , Apache Arrow  - folosesc de asemenea organizarea în coloană. SGBD-urile în coloană sunt o serie de sisteme axate pe lucrul cu serii de timp ( InfluxDB , Apache Druid ).

Link -uri