Databricks är en molnbaserad plattform som gör det smidigt att samla, bearbeta och analysera stora mängder data, samtidigt som den erbjuder inbyggda verktyg för maskininlärning och generativ AI.
Databricks föddes 2013 ur UC Berkeleys AMPLab-grupp, skaparna av Apache Spark. Det blev snabbt kärnan i en ny arkitektur – “lakehouse” – som kombinerar flexibiliteten hos datalakes med strukturen hos databaser, vilket möjliggör både avancerad analys och AI. Plattformen erbjuder allt från ETL-pipelines och realtidsströmning till modellträning, drift, och styrning i ett enhetligt gränssnitt.
Den är starkt integrerad med verktyg som Delta Lake, MLflow och MosaicAI, och används flitigt i stora molnmiljöer som AWS, Azure och Google Cloud. Databricks har även öppnat upp delar av sin teknologi som öppen källkod, vilket gynnar hela ekosystemet av datateknik, samt lanserat egna open-source LLMs som DBRX – allt i ett syfte att förenkla och accelerera hela data‑till‑AI‑resan för företag.