Installer Hive sur Ubuntu

Je veux installer Hive sur mon Ubuntu. J’ai lu cet article, qui m’aide beaucoup. J’ai fait toutes les étapes sauf l’étape 4. Je n’ai pas compris exactement ce que devrait faire cette étape.

pourriez-vous s’il vous plaît m’expliquer cette étape en détail?

L’étape 3 s’est-elle déroulée sans accroc? Jusqu’à l’étape 3, vous téléchargez les fichiers binarys de SVN sur votre machine et l’étape 4 configure les fichiers binarys avec votre environnement Hadoop.

L’étape 4 vous suggère ce qui suit:

export PATH = $ PATH: / usr / src / hive / build / dist / bin /

-> signifie que vous ajoutez le répertoire / usr / src / hive / build / dist / bin / dans votre environnement PATH. Vous devez avoir installé hive dans ce dossier -> / usr / src / hive / build / dist / bin / pour que l’ajout de ce dossier (en fait des binarys Hive) dans votre chemin vous permette d’exécuter Hive sur votre machine.

export PATH = $ PATH: / usr / src / hive / build / dist / lib /

-> signifie que vous ajoutez le répertoire / usr / src / hive / build / dist / lib / dans votre environnement PATH. Lorsque vous avez installé Hive sur votre ordinateur, les bibliothèques associées à Hive se trouvent dans ce dossier> / usr / src / hive / build / dist / lib /. L’ajout de ce répertoire à votre PATH aidera Hive à s’exécuter correctement.

export PATH = $ PATH: / usr / local / hadoop / bin

-> Si Hadoop est déjà installé sur votre machine, cela devrait déjà être défini, sinon cette commande ne fait que définir le dossier binary Hadoop sur le chemin de votre machine.

Si vous ne savez pas ce qu’est PATH, recherchez simplement “PATH in Linux” sur Internet.

Étape 1: Télécharger et extraire Hadoop

Etape 2: Définissez le chemin JAVA_HOME sur conf / hadoop-env.sh // Cette étape consiste à définir le chemin Java pour hadoop.

Étape 3: conf / core-site.xml:

  fs.default.name //Place your home folder here for using hadoop hdfs://localhost:9000   

Étape 4: conf / hdfs-site.xml:

  //This setting for the number of replications of the file or you can add data node for the save the file  dfs.replication 1   

Étape 5: conf / mapred-site.xml:

   mapred.job.tracker localhost:9001 // add your master host in the place of localhost here   

Étape 6: Connectez-vous à SSH localhost et formatez un nouveau système de fichiers dissortingbué

 bin/hadoop namenode -format 

Étape 7: Démarrez les démons hadoop:

 bin/start-all.sh 

Étape 8: Vérifiez le NameNode & JobTracker sous le port

 http://localhost:50070/ //master http://localhost:50030/ //slave 

// Il vaut mieux aussi essayer le ssh pour vérifier vos nœuds de travail

Étape 9: Télécharger et extraire la hive

Étape 10: définissez ci-dessous les variables Env.

 export HADOOP_HOME= export HIVE_HOME= export PATH=$HIVE_HOME/bin:$PATH $HIVE_HOME/bin/hive 

Cette PPA facilite l’installation de Hive sur Ubuntu.