Teknikstack

Apache Spark

Apache Spark

Apache Spark är en öppen och snabb ramverk för distribuerad databearbetning och analys i stor skala.

spark.apache.org github.com github.com

Om Apache Spark

Apache Spark är ett kraftfullt verktyg för att bearbeta stora datamängder både i batch och realtid - med stöd för Scala, Java, Python och R. Genom att flytta mycket av arbetet in i minnet och utnyttja en klustermiljö blir det betydligt snabbare än traditionellt diskbaserat Hadoop-MapReduce.

Det som gör Spark extra intressant är att det inte bara handlar om enkel datatransformation utan erbjuder ett samlat ekosystem: du kan köra SQL-frågor (Spark SQL), ge analys för streaming-data, maskininlärning via MLlib och grafbearbetning med GraphX. Dessutom är communityn aktiv - projektet ingår i Apache Software Foundation, koden finns på GitHub och det finns mängder av tredjepartspaket och resurser för att bygga olika typer av data-arbetsflöden.

Om du jobbar med data-engineering eller storskalig analys är Apache Spark ett starkt val - det klarar att skala upp från några få noder till tusentals, och tack vare dess mångsidighet kan du använda samma ramverk för allt från ETL-jobb till realtidsanalys och ML-pipelines.

Apache Spark används ofta tillsammans med

Apache Spark ingår som del i

Apache Spark används hos

Amazon Web ServicesAWS EMEA SARL, Sverige filial är Amazons lokala gren i Sverige som levererar molntjänster via Amazon Web Services i Norden och EMEA‑regionen.

Arla FoodsArla Foods är inte bara mjölk och ost - det är en värld av smak, innovation och hållbarhet, direkt från gården till ditt kök.

CintCint kopplar samman företag med människor över hela världen genom smarta lösningar för insamling av data och insikter.

Combine Control SystemsCombine Control Systems är en teknikkonsult som blandar styrsystem, AI/data science och inbyggda system för att ta teknik och affärslösningar till nästa nivå.

Databricks SwedenDatabricks Sweden AB förser företag med en kraftfull plattform för datahantering och AI, med rötter i open‑source och akademi.

Flox RoboticsFlox Robotics hjälper människor och vilda djur att samexistera med hjälp av smart AI-robotik och ljudsystem som håller djur borta från vägar, flygplatser och odlingar.

Goldman SachsGoldman Sachs är en global finansjätte som kombinerar tradition med toppmodern teknik för att driva marknader, företag och idéer framåt.

Google SwedenGoogle Sweden är svenskkontoret för techjätten Google, med huvudkontor i Stockholm som ansvarar för lokala samarbeten, försäljning och teknisk närvaro i Sverige.

HopsworksHopsworks bygger plattformen där data och AI möts - en realtidsmotor för maskininlärning, stora språkmodeller och smarta system.

Neo4j SwedenNeo4j Sweden AB driver relationer och mönster i data med marknadsledande grafdatabas‑teknik - ett nav för innovation och insikt.

NordeaNordea är en av Nordens största banker och hjälper både privatpersoner och företag att få ordning på sina finanser - och nå sina drömmar.

Playground DataPlayground Data är ett Stockholm-baserat konsultbolag som hjälper företag att förvandla data till värdefulla insikter genom Data- och ML-Engineering i molnet.

SEBSEB är en ledande nordisk bank med rötter i 1800‑talet, som erbjuder allt från privat- till storföretagsbanktjänster och satsar hårt på teknik och hållbarhet.

Soundtrack Technologies SwedenSoundtrack är Sveriges musiktjänst som skapar produktledd tillväxt genom bakgrundsmusik för företag - från caféer till globala varumärken.

Storstockholms LokaltrafikStorstockholms Lokaltrafik, eller kort och gott SL, ser till att Stockholm rullar - från tidig morgon till sen kväll, i ur och skur.

TruecallerTruecaller är den svenska appen som räddar dig från oönskade samtal och bygger förtroende i din kommunikation - med AI och global skalbarhet som vapen.