• DuckDB 1.4 LTS – säkerhet, prestanda och nya funktioner för framtidens databas

    DuckDB, databasen som ofta kallas ”SQLite för analys”, har släppt version 1.4 – en långsiktigt stödd utgåva full med nyheter. Med inbyggd kryptering, stöd för MERGE-kommandot, skrivning till Iceberg och förbättrad prestanda tar DuckDB ännu ett kliv mot att bli en av de mest flexibla och kraftfulla analysdatabaserna på marknaden.

    DuckDB, den lilla men kraftfulla databasen som ofta beskrivs som ”SQLite för analys”, har nått en viktig milstolpe. Med version 1.4, kodnamn Andium, släpps nu en LTS-utgåva (Long-Term Support) med ett års garanterat community-stöd. Den här versionen är fullmatad med nyheter som gör databasen både säkrare och snabbare, samtidigt som den blir mer flexibel att använda.

    Kryptering på riktigt

    En av de största nyheterna är att DuckDB nu kan kryptera hela databasen med AES-256 i det säkra GCM-läget. Det innebär att inte bara själva databasen, utan även loggfiler och temporära filer skyddas. Krypteringsnyckeln anges enkelt via en parameter när databasen kopplas in. För den som använder OpenSSL kan man dessutom dra nytta av hårdvaruacceleration, vilket gör krypteringen riktigt snabb.

    MERGE INTO – smartare uppdateringar

    Fram till nu har DuckDB-användare varit hänvisade till tricket INSERT INTO … ON CONFLICT för att hantera uppdateringar och konflikter. Med version 1.4 får vi istället det betydligt mer flexibla kommandot MERGE INTO, som gör det möjligt att kombinera insättningar, uppdateringar och raderingar i ett och samma kommando – perfekt för avancerade dataströmmar.

    Iceberg-stöd på nästa nivå

    DuckDB har länge kunnat läsa från Apache Iceberg, det populära lagringsformatet för storskaliga dataset. Men nu kan databasen även skriva data till Iceberg. Det öppnar för helt nya arbetsflöden där man kan flytta data mellan DuckDB, DuckLake och Iceberg. Dock krävs att schemat redan är skapat på Iceberg-sidan.

    Små detaljer som gör stor skillnad

    Version 1.4 innehåller också flera förbättringar som gör vardagen enklare:

    • En förloppsindikator i terminalen med uppskattad tid (ETA).
    • En ny FILL-funktion som fyller i saknade värden i dataserier.
    • En Teradata-anslutning för bättre integration med befintliga system.

    Prestanda i fokus

    Prestanda har alltid varit DuckDB:s styrka, och här fortsätter förbättringarna:

    • Sortering använder nu en modern k-way merge-metod.
    • CTE:er (Common Table Expressions) materialiseras automatiskt för att snabba upp beräkningar.
    • Minnestabeller har fått stöd för checkpointing, med möjlighet till komprimering.

    Distribution och ekosystem

    Slutligen har utvecklarna även putsat på distributionen:

    • Binärerna för macOS är nu notariserade.
    • Python-stödet har flyttat till sitt eget repository, duckdb/duckdb-python, för smidigare utveckling.

    DuckDB 1.4 visar att projektet inte bara växer i popularitet, utan också mognar som plattform. Med inbyggd kryptering, modernare SQL-stöd och förbättrad prestanda stärker DuckDB sin position som det självklara valet för analys – oavsett om du jobbar på din laptop eller i stora datacentermiljöer.

    DuckDB – Fakta & användning

    Typ: In-process, kolumnorienterad SQL-databas för analys (OLAP).
    Distribution: Inbäddad i processen – ingen separat server krävs.
    Plattformar: Linux, macOS, Windows; fungerar i Python, R, C/C++, Java (JDBC), ODBC m.fl.
    Filformat: Eget .duckdb on-disk-format + direktläsning av Parquet/CSV/JSON/Arrow.
    Lagring: Kolumnlagring med komprimering (t.ex. dictionary, bitpackning, RLE) och statistik/zonkartor.
    Transaktioner: ACID med WAL; snapshot isolation; flertrådad, vektoriserad exekvering.
    Index: Inga användarhanterade B-träd; förlitar sig på kolumnstatistik/zonkartor och adaptiva tekniker.
    Skalning: Optimerad för enmaskin/enkelt deployment; out-of-core för stora dataset (strömmande/externa filer).
    Kryptering: AES-256-GCM för databas/WAL/temp (från 1.4; nyckel via ENCRYPTION_KEY vid ATTACH).
    SQL-stöd: ANSI-nära dialekt med CTE/rekursiva CTE, fönsterfunktioner, MERGE INTO, ON CONFLICT, typerna STRUCT/LIST/MAP, omfattande JSON-funktioner.
    Extensions (urval): Parquet/JSON, httpfs (fjärrfiler), Arrow-integration, Iceberg-läs/skriv (via duckdb-iceberg), m.fl.
    Prestanda: Vektoriserad motor, parallellisering inom fråga, omskriven k-vägs mergesort, materialiserade CTE:er som standard.
    CLI/verktyg: Interaktiv duckdb-CLI (med progressbar/ETA), inbyggd COPY/IMPORT/EXPORT till Parquet/CSV.
    Integrationer: Pandas/Polars/Arrow i Python, dplyr/dbplyr i R, BI-verktyg via ODBC/JDBC.


    Vad används DuckDB till?
    • Interaktiv analys (OLAP) direkt i laptops/notebooks utan databasserver.
    • Snabb SQL över datafiler (Parquet/CSV/JSON) – lokalt eller över httpfs.
    • ETL/ELT-steg i pipeline: läsa, transformera och skriva Parquet/Iceberg.
    • Prototyping/experiment i Python/R – kör SQL nära dataframes/Arrow-tabeller.
    • Inbäddade applikationer som behöver kolumnlagrad analysdatabas i processen.
    • Datakvalitet, ad-hoc-frågor, testning av SQL-logik innan produktion.
    Typiska styrkor
    • Zero-install/zero-server: enkel att paketera och distribuera.
    • Hög hastighet på kolumnära, analytiska frågor; effektiv komprimering.
    • Direkt arbetsflöde med datafiler (ingen import nödvändig).
    • Stark integration med dataekosystemet (Arrow, Pandas, Parquet, Iceberg).
    Begränsningar att känna till
    • Inte en fleranvändarserver som PostgreSQL; bäst i enprocess-/enmaskinsscenarier.
    • Inga manuella B-trädindex; arbetsset och filstatistik är nyckeln till prestanda.
  • Microsoft lämnar över DocumentDB till Linux Foundation – blir öppen och leverantörsneutral

    Microsoft tar ännu ett steg mot öppen källkod. Bara sju månader efter lanseringen lämnar bolaget över sin NoSQL-databas DocumentDB till Linux Foundation – ett beslut som gör tekniken leverantörsneutral och öppnar för bredare samarbete inom open source-världen.

    Microsoft tar nästa steg i sin satsning på öppen källkod genom att donera sin NoSQL-databas DocumentDB till Linux Foundation. Beskedet kommer bara sju månader efter att projektet lanserades, och innebär att utvecklingen nu flyttas från bolagsstyrning till ett gemenskapsdrivet format.

    DocumentDB är en distribuerad databas byggd på PostgreSQL och designad för att hantera dokumentorienterade arbetslaster i stor skala. Den togs ursprungligen fram internt på Microsoft för att säkra hög tillgänglighet och flexibilitet vid lagring av JSON-data.

    Med Linux Foundation som värd kommer projektet att få en neutral plattform där tekniska kommittéer och öppna arbetsgrupper ansvarar för utvecklingen. Syftet är att beslut om nya funktioner, prestandaförbättringar och långsiktigt stöd ska fattas gemensamt, i stället för enbart av Microsoft.

    För utvecklare och organisationer öppnar förändringen upp för bredare interoperabilitet med andra open source-verktyg. Samtidigt skapas en större trygghet kring projektets framtid, eftersom utvecklingsplanen inte längre är knuten till Microsofts interna prioriteringar.

    – Att Microsoft väljer att lämna över kontrollen av DocumentDB är en tydlig signal om att företaget vill bygga förtroende i open source-världen, säger en branschanalytiker. – Det stärker också chanserna att andra aktörer, som molnleverantörer och databasföretag, går in och bidrar aktivt.

    Fakta: DocumentDB

    Typ
    Distribuerad NoSQL-databas, byggd på PostgreSQL
    Syfte
    Hantera dokumentorienterade arbetslaster i stor skala med hög tillgänglighet och flexibilitet för JSON-lagring.
    Funktioner
    • JSON-baserad datalagring
    • Hög tillgänglighet & horisontell skalning
    • Distribuerad arkitektur för stora datamängder
    • PostgreSQL-kompatibilitet (bred verktygs-/ekosystemstöd)
    • Öppen styrning via Linux Foundation
    Plattformar
    • Linux, Windows, macOS
    • Containers: Docker & Kubernetes
    • Privata och publika moln
  • MariaDB 12.0 släppt – stora InnoDB-fixar och breddat stöd för fler Linuxdistributioner

    Den populära öppna källkodsdatabasen MariaDB är nu ute i version 12.0, en uppdatering som levererar en rad kritiska buggfixar, förbättrad stabilitet och utökat plattformsstöd. Bland nyheterna finns lösningar på flera seglivade problem i InnoDB och Aria, en ny automatisk I/O-hantering för Linux, samt färdiga paket för de senaste utgåvorna av Fedora, RHEL, SLES, Ubuntu och Debian.

    Fokuserar på stabilitet i lagringsmotorerna

    En stor del av utvecklingsarbetet har lagts på att täppa till hål i lagringsmotorerna InnoDB och Aria.
    InnoDB får bland annat fixar för korruption i det så kallade adaptive hash index, hängningar vid minneshantering och fel vid användning av vector index. Dessutom introduceras den nya parametern innodb_linux_aio, som automatiskt väljer mellan moderna io_uring och äldre libaio beroende på miljön.

    Aria-motorn slipper nu krascher vid tillägg av foreign keys till tabeller med vector index – en förbättring som riktar sig till användare med tunga, indexintensiva arbetslaster.

    Problem med partitioner och replikering åtgärdade

    Version 12.0 rättar till ett problem där UNIQUE constraints med USING HASH kunde korrupta tabeller med foreign keys.
    För de som arbetar med partitionerade tabeller är en kritisk fix på plats: replikor som tidigare kunde krascha efter att en partition konverterats till en fristående tabell hanterar nu detta scenario korrekt.

    På klustersidan uppdateras Galera till version 26.4.23, med förbättrad kompatibilitet för OpenZFS 2.3.0 och senare. Även flera replikationsproblem är lösta, bland annat att master kunde bli okontaktbar i semi-synkron läge när en replik stoppades.

    Förbättringar i backup och optimerare

    mariabackup kan nu hantera svåra fall med Aria-tabeller och undviker inkonsistens i replikering, något som tidigare resulterat i felrapporter från användare.

    På optimerarsidan rättas buggar som kunde orsaka krascher vid hantering av derived tables, felaktiga indexplaner och oändliga loopar vid analys av tabeller med vissa UTF-8-tecken.

    Nya distributioner och sista version för Ubuntu 24.10

    Med 12.0 breddas stödet till fler plattformar och arkitekturer:

    • Fedora 42 (x86_64, aarch64)
    • RHEL 10 (x86_64, aarch64, ppc64le, s390x)
    • SLES 15 SP6 och SP7
    • Ubuntu 25.04 (Plucky Puffin)
    • Debian 13 (Trixie)

    Detta är även sista MariaDB-versionen för Ubuntu 24.10, som nådde slutet av sin ordinarie supportperiod i juli 2025. För CentOS Stream 9 ingår nu även det tidigare saknade paketet MariaDB-provider-lzo.

    Rolling release – nästa steg 12.1.2

    MariaDB 12.0 är en rullande utgåva, vilket innebär att det inte kommer någon version 12.0.3. Utvecklarna rekommenderar att de som vill hålla sig på den senaste versionen planerar för uppgradering till MariaDB 12.1.2 när den blir tillgänglig.

    https://linuxiac.com/mariadb-12-0-lands-with-innodb-fixes-and-expanded-platform-support

    Faktaruta: MariaDB och version 12.0

    Vad är MariaDB?
    MariaDB är ett öppet källkodsbaserat relationsdatabashanteringssystem (RDBMS) som skapades 2009 som en fork av MySQL efter att Oracle köpt upp MySQL AB. Projektet leds av MariaDB Foundation och används världen över i allt från webbapplikationer till stora företagslösningar.

    Historik i korthet:
    2009 – Projektet startas av Michael ”Monty” Widenius, en av MySQL:s grundare.
    2012 – Tas i bruk i flera Linuxdistributioner.
    2015 – MariaDB Corporation grundas för kommersiellt stöd.
    2017 – Inför *window functions* och *common table expressions*.
    2020–2024 – Prestanda-, säkerhets- och kompatibilitetsförbättringar.
    2025 – Version 12.0 släpps som rullande release.

    Nyheter i MariaDB 12.0:
    • Förbättrade InnoDB- och Aria-motorer.
    • Ny parameter innodb_linux_aio för smart I/O-hantering.
    • Fixar för partitioneringsproblem och replikatorkrascher.
    • Galera 26.4.23 med OpenZFS-stöd.
    • Förbättrad mariabackup.
    • Stabilare optimerare och UTF-8-fixar.
    • Paket för Fedora 42, RHEL 10, SLES 15 SP6/SP7, Ubuntu 25.04, Debian 13.
    • Sista versionen för Ubuntu 24.10.

    Versionsmodell:
    MariaDB 12.0 är en rolling release – ingen 12.0.3. Nästa steg blir MariaDB 12.1.2.

Etikett: Databas