Apache Kafka è spesso più adatto per progetti ad alto carico rispetto ai broker di messaggi come RabbitMQ e ActiveMQ. L'installazione di Apache Kafka su un server Ubuntu Server 20.04 dedicato o virtuale è necessaria per eseguire applicazioni ad alto carico e fornire larghezza di banda. Kafka richiede risorse: la RAM deve essere di almeno 4 GB.
Prima di avviare Apache Kafka su Ubuntu 20.04, è necessario eseguire la configurazione iniziale:
creare un utente con privilegi sudo;
avviare e configurare il firewall
chiudere l'accesso SSH al server per gli utenti root.
Per installare Kafka, è necessario verificare la presenza di versioni aggiornate dei pacchetti. Questo viene fatto con il comando:
$ sudo apt update.
Java e Scala devono essere presenti sul server virtuale / dedicato per funzionare correttamente. Anche jre è necessario per eseguire Kafka. L'installazione viene eseguita con il comando
$ sudo apt install default-jre
Al termine, verificare la versione corrente di Java:
$ java -version
Kafka viene eseguito in rete, quindi è necessario un account speciale per lavorare (sicurezza, riduzione del rischio di compromissione). Crearlo con il comando
$ sudo adduser kafka
Dopo il login($ su -l kafka
) cambiare la directory e andare in tmp. Il comando è standard:
$ cd /tmp
Per scaricare Kafka si usa il classico comando curl da terminale. Per scaricare Apache Kafka inserire:
$ curl -LO https://dlcdn.apache.org/kafka/3.2.1/kafka_2.13-3.2.1.tgz
Si noti che lo sviluppatore aggiorna periodicamente il software (a febbraio 2023 la versione attuale è la 3.4.0.).
Creare una directory in cui scompattare la distribuzione. Comando nel terminale:
$ mkdir ~/kafka
Cambiare la directory per andare nella cartella desiderata e lì decomprimere l'archivio.
$ tar -xvzf /tmp/kafka_2.13-3.2.1.tgz --strip 1.
Avete installato Apache Kafka su Ubuntu 20.04. Ora resta da configurare il corretto funzionamento.