Préparation de l'installation de Data Repository

Pour garantir l'installation correcte du Data Repository, remplissez les conditions requises suivantes avant d'installer le Data Repository :
capm370
HID_Prepare_to_Install_the_Data_Repository
Pour garantir l'installation correcte du Data Repository, remplissez les conditions requises suivantes avant d'installer le Data Repository :
2
Pour plus d'informations sur les options de configuration et l'administration du Data Repository, reportez-vous à la section Administration du Data Repository.
Vérification des conditions préalables
Avant d'installer le Data Repository, vérifiez que les conditions préalables suivantes sont remplies :
  • Révision de la documentation de Vertica
  • Vérifiez que les package dialog et chrony sont installés sur chaque hôte Data Repository :
    Le package chrony est requis uniquement pour RHEL 7.x et OL 7.x.
    rpm -qa | grep ^dialog
    rpm -qa | grep ^chrony
    Si la commande ne renvoie aucun résultat, installez le package :
    Si vous n'êtes pas l'utilisateur root, utilisez le préfixe sudo.
    yum install dialog
    yum install chrony
    Si ce package n’est pas installé, les scripts de validation et d’installation échoueront.
  • Le programme d’installation requiert les packages .zip et .unzip. Si ces packages ne sont pas installés, utilisez la commande suivante pour les installer :
    yum -y install zip unzip
  • Vérifiez que vous disposez d’au moins 2 Go d’espace d’échange sur l’hôte Data Repository.
  • Vérifiez que les hôtes Data Repository utilisent le système de fichiers ext4. Vertica ne prend pas en charge XFS ou btrfs. Tous les disques dotés de Vertica utilisent le système de fichiers ext4.
    Le système de fichiers par défaut pour RHEL 7.x et OL 7.x est le système de fichiers XFS. Le système de fichiers par défaut pour SLES est btrfs. Vertica ne prend pas en charge XFS ou btrfs. Le fonctionnement de la base de données est optimal avec le système de fichiers ext4.
  • Vérifiez que les ports suivants sont ouverts sur les systèmes Data Repository :
    • Port 22 (protocole TCP)
    • Port 4803 (protocoles TCP et UDP)
    • Port 4804 (protocole UDP)
    • Port 5433 (protocole TCP)
      Un accès distant à ce port est requis.
    • Port 5434 (protocole TCP)
    • Port 6543 (protocole UDP)
  • Pour éviter tout endommagement de la base de données, excluez le répertoire d'installation et tous ses sous-répertoires des analyses antivirus. Empêchez l'analyse par une instance locale d'un client antivirus et l'analyse par une instance d'antivirus distante. Excluez les répertoires suivants :
    • /opt/vertica/*
    • /opt/vconsole/*
    • Répertoire de données spécifié
      Par défaut :
      /drdata/data
    • Répertoire de catalogues spécifié
      Par défaut :
      /drdata/catalog
    • Fichiers temporaires de Vertica dans le répertoire /tmp
      • /tmp/4803
      • /tmp/vbr/*
    • Le répertoire dans lequel vous sauvegardez Data Repository
  • Si un fichier appelé release apparaît dans le répertoire /etc, supprimez-le. Dans le cas contraire, l'installation de Data Repository échoue.
  • Vérifiez l'accès en fonction de votre type d'installation :
    • Nœud unique :
      un accès root est requis pour l'installation de Data Repository. Vérifiez si vous pouvez installer le Data Repository en tant qu'utilisateur root.
    • Cluster :
      vérifiez que l'utilisateur root ou l'utilisateur sudo peuvent créer des comptes d'administrateurs de base de données ou demandez à un administrateur de créer ces comptes.
  • Vérifiez que la mise à l'échelle de la fréquence d'UC est désactivée. Désactivez la mise à l'échelle de la fréquence d'UC à l'aide des paramètres du BIOS et du système d'exploitation du système hôte.
    Si la mise à l'échelle de la fréquence de l'UC est activée, des performances incohérentes risquent de survenir pour les requêtes similaires dans Vertica. En effet, la mise à l'échelle de la fréquence de l'UC ralentit et altère parfois le chargement du tableau de bord.
  • Vérifiez que vous n'utilisez pas le gestionnaire de volumes logiques pour les répertoires /data et /catalog.
  • Cluster uniquement) Vérifiez que tous les hôtes du cluster sont dans le même sous-réseau.
  • (Installations en cluster uniquement) Vérifiez que l'utilisateur root peut utiliser le protocole Secure Shell (SSH) pour se connecter (ssh) à tous les hôtes du cluster.
    Configurez une connexion SSH pour l’utilisateur root pour installer ou mettre à niveau le Data Repository.
  • Cluster uniquement) Sélectionnez les hôtes sur lesquels vous installez les noeuds Data Repository.
    Avertissement :
    Le logiciel de base de données est déployé sur chaque hôte participant à un cluster. Ce logiciel représente un "noeud" dans le cluster. Un cluster à trois noeuds représente la configuration la plus simple qui peut tolérer la perte d'un noeud unique. Vous pouvez, toutefois, inclure plus de trois hôtes dans le cluster. Si plusieurs noeuds échouent ou se ferment, le Data Repository n'est plus disponible pour utilisation et le Data Aggregator s'arrête automatiquement.
Installation du Data Repository sur des machines virtuelles
Pour obtenir des performances optimales, installez le Data Repository dans un environnement nu. Toutefois, si vous installez le Data Repository sur des machines virtuelles VMware, vérifiez que les conditions suivantes sont remplies :
  • Utilisez VMware version 5.5 ou supérieure.
  • Le nombre de machines virtuelles par hôte ne dépasse pas le nombre de processeurs physiques.
  • Affectez et réservez 4 Go de mémoire pour chaque machine virtuelle.
  • Chaque machine virtuelle dispose d'une carte NIC de 10 Go dédiée.
  • Désactivez la mise à l'échelle de la fréquence d'UC au niveau de l'hôte et pour chaque machine virtuelle.
  • Désactivez VMotion. VMotion peut interrompre la communication et provoquer l'arrêt du Data Repository.
  • Définissez les paramètres VMware pour Hugepages sur les valeurs par défaut de la version 5.5.
  • Vérifiez les performances du matériel et du réseau. Utilisez les outils de diagnostic Vertica décrits ci-dessous pour vérifier les performances.
Pour plus d'informations sur l'exécution de Vertica sur les machines virtuelles, reportez-vous à la documentation de Vertica.
Installation du Data Repository sur le stockage partagé (SAN)
Pour installer le Data Repository sur SAN, vérifiez que les conditions suivantes sont remplies :
  • Les hôtes n’ont aucune contention d’espace disque ou de bande passante.
  • Chaque hôte dispose d’un emplacement unique de catalogue et de données. Les hôtes ne peuvent pas partager l’emplacement de ces répertoires.
  • L’espace de stockage dispose d'une bande passante d'E/S suffisante pour que chaque noeud accède au stockage indépendamment. Pour vérifier la bande passante d'E/S, exécutez vioperf simultanément à partir de tous les hôtes du cluster Data Repository. Pour plus d'informations, reportez-vous aux procédures suivantes.
Définition d'un nom d'hôte unique pour chaque hôte Data Repository
Définissez un nom d'hôte unique pour chaque hôte du Data Repository dans le cluster.
Procédez comme suit :
  1. En tant qu'utilisateur root, connectez-vous à chaque hôte du Data Repository et vérifiez le nom d'hôte unique.
    Le nom d'hôte doit être associé à l'adresse IP et
    non
    à l'adresse de bouclage 127.0.0.1.
  2. Vérifiez que les lignes suivantes figurent dans le fichier /etc/hosts sur chaque ordinateur :
    Do not remove the following line, or various programs
    # that require network functionality will fail.
    127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4
    ::1 localhost localhost.localdomain localhost6 localhost6.localdomain6
    IP address of your host
    YourHostName YourHostName.domain
  3. Si vous modifiez le fichier, exécutez la commande suivante :
    service network restart
    Le fichier /etc/hosts est configuré correctement.
    Le nom d'hôte unique est défini.
  4. (Installations en cluster uniquement) Le nom de tous les hôtes présents dans le cluster doit être résolu correctement. Si la résolution de nom d'hôte est incorrecte, le cluster Data Repository ne s'installe pas ou ne fonctionne pas correctement. Tous les hôtes participant au cluster doivent utiliser des adresses IP ou des adresses DHCP louées de façon permanente. Configurez le fichier /etc/hosts sur chaque hôte que vous avez choisi d'intégrer au cluster. Le fichier d'hôtes doit contenir des entrées pour tous les hôtes du cluster.
    Exemple
    : Cet exemple illustre le fichier /etc/hosts pour un cluster dans lequel les hôtes sont nommés host01, host02 et host03 :
    127.0.0.1 localhost.localdomain localhost
    192.168.13.128 host01.domain host01
    192.168.13.129 host02.domain host02
    192.168.13.130 host03.domain host03
    Ne supprimez pas la ligne d'adresse de bouclage (127.0.0.1). Le nom d'hôte local du Data Repository ne peut pas se trouver sur la ligne 127.0.0.1. N'utilisez pas non plus l'adresse de bouclage ou le nom de l'hôte local lorsque vous définissez des hôtes dans le cluster.
  5. Vérifiez que la résolution de nom d'hôte fonctionne pour chaque hôte du cluster.
    Par exemple, sur host01, la syntaxe suivante est correcte :
    $ /bin/hostname -f
    host01
    La résolution de nom d'hôte est configurée.
(Facultatif) Définition d'une connexion SSH sans mot de passe pour l'utilisateur root ou sudo
Les hôtes dans un cluster Data Repository requièrent une connexion SSH sans mot de passe pour les utilisateurs root ou sudo pendant l'installation ou la mise à niveau du Data Repository. Le script
dr_validate.sh
configure une connexion SSH sans mot de passe, mais demande le mot de passe plusieurs fois. Pour éviter d'avoir à spécifier le mot de passe root ou user plusieurs fois, configurez une connexion SSH sans mot de passe avant d'exécuter le script de validation.
Répétez cette procédure pour chaque paire d'hôtes. Si vous n'avez pas défini de connexion SSH sans mot de passe pour l'utilisateur root, mais que vous disposez d'un accès racine pour installer et exécuter le Data Repository, configurez un compte d'utilisateur sudo. Vous pouvez également recourir à une méthode alternative pour installer le produit sans avoir à saisir le mot de passe root à l'aide du compte d'utilisateur sudo. Pour plus d'informations sur la configuration du compte d'utilisateur sudo sans mot de passe pour Data Repository, consultez la section .
Une connexion SSH sans mot de passe est automatiquement configurée pour l'administrateur du Data Repository lors de l'installation du Data Repository.
Procédez comme suit :
  1. Ouvrez une console et connectez-vous à l'hôte de Data Repository en tant qu'utilisateur root ou sudo.
  2. Exécutez les commandes suivantes :
    ssh-keygen -N "" -t rsa -f ~/.ssh/id_rsa cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys2 chmod 644 ~/.ssh/authorized_keys2
  3. Copiez la clé publique de l'utilisateur root ou sudo dans la liste des clés autorisées sur les hôtes distants :
    ssh-copy-id -i
    user
    @
    remotehost
    remotehost
    indique l'hôte du cluster sur lequel vous copiez l'ID SSH.
  4. Pour vérifier la configuration de la connexion SSH sans mot de passe, connectez-vous à l'hôte distant à partir de l'hôte local :
    ssh
    user
    @
    remotehost
    ls
    Si la connexion SSH sans mot de passe est configurée, vous n'êtes pas invité à saisir de mot de passe. Vous pouvez également afficher une liste de répertoires via la commande ls.
(Facultatif) Configuration du compte d'utilisateur sudo pour le Data Repository
Si vous n'avez pas défini de connexion SSH sans mot de passe pour l'utilisateur root, mais que vous disposez d'un accès racine pour installer et exécuter le Data Repository, configurez un compte d'utilisateur sudo.
Pour un environnement de cluster, effectuez cette procédure sur chaque hôte du cluster.
Procédez comme suit :
  1. Localisez le fichier suivant :
    /etc/sudoers
  2. Ajoutez un alias de commande avec les autorisations suivantes au fichier :
Cmnd_Alias CA_DATAREP = /tmp/installDR.bin,/opt/CA/IMDataRepository_vertica9/dr_validate.sh,/opt/CA/IMDataRepository_vertica9/dr_install.sh,/usr/bin/vim,/usr/bin/reboot,/usr/bin/yum,/opt/CA/IMDataRespository_vertica9/RemoteEngineer/re.sh
## Allows the Data Repository user to manage the Data Repository
sudouser
ALL = CA_DATAREP
  • sudouser
    Spécifiez le nom de l'utilisateur autorisé à exécuter les commandes sudo.
Cet alias de commande détaille les commandes sur lesquelles l'utilisateur sudo doit pouvoir s'exécuter.
Configurez l'utilisateur sudo et ajoutez le préfixe sudo à toutes les commandes pour installer le Data Repository.
Exemple :
sudo ./installDR.bin
(Facultatif) Configuration du compte d'utilisateur sudo sans mot de passe pour le Data Repository
En raison de certaines stratégies de sécurité, il est parfois impossible d'activer une clé SSH sans mot de passe pour les utilisateurs root sur les serveurs hôtes dans certains environnements. La procédure suivante offre une méthode alternative pour l'installation du produit sans recourir à ce niveau d'accès grâce au compte d'utilisateur sudo.
Cette fonctionnalité n'est pas prise en charge sur les serveurs RHEL 6.x.
  1. Localisez le fichier suivant :
    /etc/sudoers
  2. Ajoutez des alias de commande avec les autorisations suivantes au fichier :
  • Sur un serveur RHEL 7
    Cmnd_Alias CA_DATAREP=/opt/vertica/sbin/install_vertica,/tmp/installDR.bin,/opt/CA/IMDataRepository_vertica9/dr_validate.sh,/opt/CA/IMDataRepository_vertica9/dr_install.sh,/usr/bin/vim,/usr/bin/reboot,/opt/CA/IMDataRespository_vertica9/RemoteEngineer/re.sh,/bin/mkdir*,/usr/bin/whoami,/bin/echo,/sbin/service,/bin/grep,/usr/bin/test,/sbin/iptables,/opt/vertica/oss/python/bin/python,/usr/bin/tee,/usr/sbin/ntpd,/etc/init.d/ntpd,/sbin/blockdev,/etc/init.d/sshd,/etc/sysconfig/sshd,/etc/ssh/sshd_config,/bin/su,/usr/sbin/sshd restart,/usr/bin/ssh,/bin/df,/bin/mv,/bin/rm,/usr/bin/install
    Cmnd_Alias VERTICA = /opt/vertica/bin/,/opt/vertica/sbin/,/opt/vertica/oss/python/bin/
    Cmnd_Alias VERTICA_INSTALL = /bin/echo,/bin/ps -A,/bin/cp /opt/vertica/config/admintools.conf /opt/vertica/config/admintools.conf.bak.*,/bin/rm -rf /tmp/dbRPM.rpm,/bin/df --portability /tmp,/usr/bin/install --owner * --mode 700 -d *,/bin/mv -f /tmp/vstage-*/file /tmp/*,/bin/rm -rf /tmp/vstage-*,/usr/bin/id *,/bin/cp -T /opt/vertica/* /tmp/vstage-*,/bin/su --login dbadmin *,/bin/mkdir -p /opt/vertica/*,/bin/touch /opt/vertica/*,/bin/rm -rf /opt/vertica/*,/bin/mv -f /tmp/vstage-* /opt/vertica/*,/bin/mkdir -p /opt/vertica/*,/bin/touch /opt/vertica/config/users/dbadmin/agent.conf,/bin/su dbadmin *,/bin/sh -c *,/usr/bin,/opt/vertica/share/binlib/test/*,/usr/bin/su dbadmin,/bin/test [ -e /* ],/usr/bin/[ -e /* ]
    Cmnd_Alias USEFUL = /usr/bin/lshw,/usr/bin/yum,/bin/rpm,/sbin/reboot,/sbin/shutdown,/usr/bin/cpan,/bin/chgrp,/bin/chmod,/bin/chown,/bin/mnt,/usr/bin/test,/bin/[,/sbin/service
    ## Allows the Data Repository user to manage the Data Repository
    sudouser ALL = CA_DATAREP, VERTICA , VERTICA_INSTALL , USEFUL
    Defaults env_keep +="VERT_DBA_USR VERT_DBA_HOME VERT_DBA_GRP VERT_DBA_DATA_DIR _ENV_VPWD_VAR"
  • Sur un serveur SLES 12
    Cmnd_Alias CA_DATAREP =/opt/vertica/sbin/install_vertica,/tmp/installDR.bin,/opt/CA/IMDataRepository_vertica9/dr_validate.sh,/opt/CA/IMDataRepository_vertica9/dr_install.sh,/usr/bin/vim,/usr/bin/reboot,/opt/CA/IMDataRespository_vertica9/RemoteEngineer/re.sh,/usr/bin/mkdir, /sbin/SuSEfirewall2 off *,/usr/bin/whoami,/usr/bin/echo,/usr/bin/id,/usr/bin/env,/usr/sbin/service,/usr/bin/grep,/usr/bin/test,/sbin/iptables,/opt/vertica/oss/python/bin/python,/usr/bin/tee,/usr/sbin/ntpd,/etc/init.d/ntpd,/sbin/blockdev,/etc/init.d/sshd,/etc/sysconfig/sshd,/etc/ssh/sshd_config,/usr/bin/su,/usr/sbin/sshd restart,/usr/bin/ssh,/usr/bin/sh,/usr/bin/install
    Cmnd_Alias VERTICA = /opt/vertica/bin/,/opt/vertica/sbin/,/opt/vertica/oss/python/bin/
    Cmnd_Alias VERTICA_INSTALL = /usr/bin/echo,/usr/bin/ps -A,/usr/bin/cp /opt/vertica/config/admintools.conf /opt/vertica/config/admintools.conf.bak.*,/usr/bin/rm -rf /tmp/dbRPM.rpm,/usr/bin/df --portability /tmp,/usr/bin/install --owner * --mode 700 -d *,/usr/bin/mv -f /tmp/vstage-*/file /tmp/*,/usr/bin/rm -rf /tmp/vstage-*,/usr/bin/id *,/usr/bin/cp -T /opt/vertica/* /tmp/vstage-*,/usr/bin/su --login dbadmin *,/usr/bin/mkdir -p /opt/vertica/*,/usr/bin/touch /opt/vertica/*,/usr/bin/rm -rf /opt/vertica/*,/usr/bin/mv -f /tmp/vstage-* /opt/vertica/*,/usr/bin/mkdir -p /opt/vertica/*,/usr/bin/touch /opt/vertica/config/users/dbadmin/agent.conf,/usr/bin/su dbadmin *,/usr/bin/sh -c *,/opt/vertica/share/binlib/test/*,/usr/bin/su dbadmin,/usr/bin/test [ -e /* ],/usr/bin/[ -e /* ]
    Cmnd_Alias USEFUL = /usr/bin/lshw,/usr/bin/yum,/bin/rpm,/sbin/reboot,/sbin/shutdown,/usr/bin/cpan,/bin/chgrp,/bin/chmod,/bin/chown,/bin/mnt,/usr/bin/test,/bin/[,/sbin/service
    ## Allows the Data Repository user to manage the Data Repository
    sudouser ALL = CA_DATAREP, VERTICA , VERTICA_INSTALL , USEFUL
    Defaults env_keep +="VERT_DBA_USR VERT_DBA_HOME VERT_DBA_GRP VERT_DBA_DATA_DIR _ENV_VPWD_VAR"