ProxMenux/scripts/igpu_tpu.sh

367 lines
14 KiB
Bash
Raw Normal View History

2025-01-09 20:20:18 +01:00
#!/bin/bash
# Variables globales
CHANGES_MADE=0 # Inicializar cambios para verificar si es necesario reiniciar el contenedor
NEED_REBOOT=0 # Controla si se requiere reinicio completo del servidor
# Colores para salida
YW="\033[33m"
GN="\033[1;92m"
RD="\033[01;31m"
CL="\033[m"
# Funciones auxiliares
log() {
echo -e "$(date '+%Y-%m-%d %H:%M:%S') - $1"
}
msg_info() {
echo -ne " ${YW}[INFO] $1...${CL}"
}
msg_ok() {
echo -e " ${GN}[OK] $1${CL}"
}
msg_error() {
echo -e " ${RD}[ERROR] $1${CL}"
}
# Validar que el contenedor seleccionado es válido
validate_container_id() {
if [ -z "$CONTAINER_ID" ]; then
msg_error "ID del contenedor no definido. Asegúrate de seleccionar un contenedor primero."
exit 1
fi
}
# Verificar la versión de Proxmox
validate_pve_version() {
if ! pveversion | grep -Eq "pve-manager/(8\\.[0-9]+)"; then
msg_error "Esta versión de Proxmox no es compatible. Se requiere Proxmox VE 8.0 o superior."
exit 1
fi
msg_ok "Versión de Proxmox compatible."
}
# Función para reinicio
restart_prompt() {
if (whiptail --title "Reinicio requerido" --yesno "La instalación requiere un reinicio del servidor para que los cambios sean efectivos. ¿Deseas reiniciar ahora?" 8 58); then
msg_info "Reiniciando el servidor..."
reboot
else
msg_info "No se realizó el reinicio. Por favor, reinicia manualmente más tarde para aplicar los cambios."
fi
}
# Reinicio del servidor al final
final_restart_prompt() {
if [ "$NEED_REBOOT" -eq 1 ]; then
msg_info "Se recomienda reiniciar el servidor para aplicar los cambios correctamente."
restart_prompt
fi
}
# Selección del contenedor LXC
select_container() {
CONTAINERS=$(pct list | awk 'NR>1 {print $1, $3}' | xargs -n2)
if [ -z "$CONTAINERS" ]; then
msg_error "No hay contenedores disponibles en Proxmox."
exit 1
fi
CONTAINER_ID=$(whiptail --title "Seleccionar Contenedor" \
--menu "Selecciona el contenedor LXC:" 15 60 5 $CONTAINERS 3>&1 1>&2 2>&3)
if [ -z "$CONTAINER_ID" ]; then
msg_error "No se seleccionó ningún contenedor. Saliendo."
exit 1
fi
if ! pct list | awk 'NR>1 {print $1}' | grep -qw "$CONTAINER_ID"; then
msg_error "El contenedor con ID $CONTAINER_ID no existe. Saliendo."
exit 1
fi
msg_ok "Contenedor seleccionado: $CONTAINER_ID"
}
# Validar y cambiar a privilegiado si es necesario
ensure_privileged_container() {
validate_container_id
CONFIG_FILE="/etc/pve/lxc/${CONTAINER_ID}.conf"
if [ ! -f "$CONFIG_FILE" ]; then
msg_error "Archivo de configuración del contenedor $CONTAINER_ID no encontrado."
exit 1
fi
if grep -q "^unprivileged: 1" "$CONFIG_FILE"; then
msg_info "El contenedor es no privilegiado. Cambiando a privilegiado..."
sed -i "s/^unprivileged: 1/unprivileged: 0/" "$CONFIG_FILE"
STORAGE_TYPE=$(pct config "$CONTAINER_ID" | grep "^rootfs:" | awk -F, '{print $2}' | cut -d'=' -f2)
if [[ "$STORAGE_TYPE" == "dir" ]]; then
STORAGE_PATH=$(pct config "$CONTAINER_ID" | grep "^rootfs:" | awk '{print $2}' | cut -d',' -f1)
chown -R root:root "$STORAGE_PATH"
fi
msg_ok "Contenedor cambiado a privilegiado."
else
msg_ok "El contenedor ya es privilegiado."
fi
}
# Verificar y configurar repositorios en el host
verify_and_add_repos() {
msg_info "Verificando y configurando repositorios necesarios en el host..."
if ! grep -q "pve-no-subscription" /etc/apt/sources.list /etc/apt/sources.list.d/* 2>/dev/null; then
echo "deb http://download.proxmox.com/debian/pve $(lsb_release -sc) pve-no-subscription" | tee /etc/apt/sources.list.d/pve-no-subscription.list
msg_ok "Repositorio pve-no-subscription añadido."
else
msg_ok "Repositorio pve-no-subscription ya configurado."
fi
if ! grep -q "non-free-firmware" /etc/apt/sources.list; then
echo "deb http://deb.debian.org/debian $(lsb_release -sc) main contrib non-free-firmware
deb http://deb.debian.org/debian $(lsb_release -sc)-updates main contrib non-free-firmware
deb http://security.debian.org/debian-security $(lsb_release -sc)-security main contrib non-free-firmware" | tee -a /etc/apt/sources.list
msg_ok "Repositorios non-free-firmware añadidos."
else
msg_ok "Repositorios non-free-firmware ya configurados."
fi
apt-get update
# apt-get update &>/dev/null
msg_ok "Repositorios verificados y actualizados."
}
# Configurar Coral TPU en el contenedor
configure_lxc_for_coral() {
ensure_privileged_container
CONFIG_FILE="/etc/pve/lxc/${CONTAINER_ID}.conf"
# Verificar y agregar configuraciones solo si no existen
if ! grep -Pq "^lxc.cgroup2.devices.allow: c 189:\* rwm # Coral USB$" "$CONFIG_FILE"; then
echo "lxc.cgroup2.devices.allow: c 189:* rwm # Coral USB" >> "$CONFIG_FILE"
fi
if ! grep -Pq "^lxc.mount.entry: /dev/bus/usb dev/bus/usb none bind,optional,create=dir$" "$CONFIG_FILE"; then
echo "lxc.mount.entry: /dev/bus/usb dev/bus/usb none bind,optional,create=dir" >> "$CONFIG_FILE"
fi
if ! grep -Pq "^lxc.mount.entry: /dev/apex_0 dev/apex_0 none bind,optional,create=file$" "$CONFIG_FILE"; then
echo "lxc.mount.entry: /dev/apex_0 dev/apex_0 none bind,optional,create=file" >> "$CONFIG_FILE"
fi
msg_ok "Configuración de Coral TPU (USB y M.2) añadida al contenedor $CONTAINER_ID."
}
# Configurar iGPU en el contenedor
configure_lxc_for_igpu() {
ensure_privileged_container
CONFIG_FILE="/etc/pve/lxc/${CONTAINER_ID}.conf"
# Verificar y agregar configuraciones solo si no existen
if ! grep -q "features: nesting=1" "$CONFIG_FILE"; then
echo "features: nesting=1" >> "$CONFIG_FILE"
fi
if ! grep -q "c 226:0 rwm" "$CONFIG_FILE"; then
echo "lxc.cgroup2.devices.allow: c 226:0 rwm # iGPU" >> "$CONFIG_FILE"
echo "lxc.cgroup2.devices.allow: c 226:128 rwm # iGPU" >> "$CONFIG_FILE"
echo "lxc.mount.entry: /dev/dri dev/dri none bind,optional,create=dir" >> "$CONFIG_FILE"
echo "lxc.mount.entry: /dev/dri/renderD128 dev/dri/renderD128 none bind,optional,create=file" >> "$CONFIG_FILE"
fi
if ! grep -q "c 29:0 rwm # Framebuffer" "$CONFIG_FILE"; then
echo "lxc.cgroup2.devices.allow: c 29:0 rwm # Framebuffer" >> "$CONFIG_FILE"
fi
if ! grep -q "lxc.mount.entry: /dev/fb0" "$CONFIG_FILE"; then
echo "lxc.mount.entry: /dev/fb0 dev/fb0 none bind,optional,create=file" >> "$CONFIG_FILE"
fi
msg_ok "Configuración de iGPU añadida al contenedor $CONTAINER_ID."
}
# Instalar controladores iGPU en el contenedor
install_igpu_in_container() {
msg_info "Instalando controladores de iGPU dentro del contenedor..."
pct start "$CONTAINER_ID"
pct exec "$CONTAINER_ID" -- bash -c "
apt-get update && \
apt-get install -y va-driver-all ocl-icd-libopencl1 intel-opencl-icd vainfo intel-gpu-tools && \
chgrp video /dev/dri && chmod 755 /dev/dri && \
adduser root video && adduser root render
"
msg_ok "Controladores de iGPU instalados dentro del contenedor."
}
##########################################################
# Instalar TPU en host y verificación.
NEED_REBOOT=0
install_coral_host() {
FORCE_REINSTALL=$1
# Verificar si el controlador ya está instalado
if [ "$FORCE_REINSTALL" != "--force" ]; then
msg_info "Verificando si los controladores de Coral TPU ya están instalados..."
if dpkg -l | grep -qw gasket-dkms; then
msg_ok "Los controladores de Coral TPU ya están instalados."
return 0
fi
fi
msg_info "Instalando controladores de Coral TPU en el host..."
verify_and_add_repos
apt-get install -y git devscripts dh-dkms dkms pve-headers-$(uname -r)
# Clonar la rama predeterminada del repositorio
cd /tmp
rm -rf gasket-driver
msg_info "Clonando la rama predeterminada del repositorio de Google Coral..."
git clone https://github.com/google/gasket-driver.git
if [ $? -ne 0 ]; then
msg_error "No se pudo clonar el repositorio."
exit 1
fi
cd gasket-driver/
# Construir e instalar el paquete .deb
debuild -us -uc -tc -b
if [ $? -ne 0 ]; then
msg_error "Error al construir los paquetes del controlador."
exit 1
fi
dpkg -i ../gasket-dkms_*.deb
if [ $? -ne 0 ]; then
msg_error "Error al instalar los paquetes del controlador."
exit 1
fi
msg_ok "Controladores de Coral TPU instalados en el host desde la rama predeterminada."
NEED_REBOOT=1 # Marcar que se requiere reinicio completo del servidor
}
################################################
# Instalar controladores Coral TPU en el contenedor
install_coral_in_container() {
msg_info "Detectando dispositivos Coral TPU dentro del contenedor..."
CORAL_M2=$(lspci | grep -i "Global Unichip")
if [[ -n "$CORAL_M2" ]]; then
DRIVER_OPTION=$(whiptail --title "Seleccionar versión de controladores" \
--menu "Elige la versión de controladores para Coral M.2:\n\nPrecaución: El modo máximo genera más calor." 15 60 2 \
1 "libedgetpu1-std (rendimiento estándar)" \
2 "libedgetpu1-max (máximo rendimiento)" 3>&1 1>&2 2>&3)
case "$DRIVER_OPTION" in
1) DRIVER_PACKAGE="libedgetpu1-std" ;;
2) DRIVER_PACKAGE="libedgetpu1-max" ;;
*) DRIVER_PACKAGE="libedgetpu1-std" ;;
esac
else
DRIVER_PACKAGE="libedgetpu1-std"
fi
pct start "$CONTAINER_ID"
pct exec "$CONTAINER_ID" -- bash -c "
apt-get update && \
apt-get install -y gnupg python3 python3-pip python3-venv && \
curl -fsSL https://packages.cloud.google.com/apt/doc/apt-key.gpg | gpg --dearmor -o /usr/share/keyrings/coral-edgetpu.gpg && \
echo 'deb [signed-by=/usr/share/keyrings/coral-edgetpu.gpg] https://packages.cloud.google.com/apt coral-edgetpu-stable main' | tee /etc/apt/sources.list.d/coral-edgetpu.list && \
apt-get update && \
apt-get install -y $DRIVER_PACKAGE
"
msg_ok "Controladores de Coral TPU instalados dentro del contenedor."
}
# Menú principal
main_menu() {
OPTIONS=(
1 "Añadir aceleración gráfica HW iGPU"
2 "Añadir Coral TPU + HW iGPU"
)
OPTION=$(whiptail --title "Menú Principal" --menu "Selecciona los recursos a añadir a un LXC:" 15 60 2 "${OPTIONS[@]}" 3>&1 1>&2 2>&3)
case "$OPTION" in
1)
# Configuración solo para iGPU
configure_lxc_for_igpu
install_igpu_in_container
if pct status "$CONTAINER_ID" | grep -q "running"; then
pct restart "$CONTAINER_ID"
else
pct start "$CONTAINER_ID"
fi
msg_ok "El contenedor $CONTAINER_ID ha sido reiniciado para aplicar los cambios de iGPU."
;;
2)
if dpkg -l | grep -qw gasket-dkms; then
msg_info "Controladores de Coral ya están instalados en el host."
if (whiptail --title "Reinstalar controladores" --yesno "¿Quieres reinstalar los controladores de Coral en el servidor?\n(Esto solo es necesario en caso de error)" 10 60); then
msg_info "Reinstalando los controladores de Coral en el host..."
install_coral_host --force
configure_lxc_for_coral && CHANGES_MADE=1
install_coral_in_container && CHANGES_MADE=1
configure_lxc_for_igpu && CHANGES_MADE=1
install_igpu_in_container && CHANGES_MADE=1
msg_info "Reiniciando el servicio udev para aplicar cambios..."
systemctl restart udev
msg_ok "El servicio udev ha sido reiniciado con éxito. No se requiere reinicio completo del servidor."
else
configure_lxc_for_coral && CHANGES_MADE=1
install_coral_in_container && CHANGES_MADE=1
configure_lxc_for_igpu && CHANGES_MADE=1
install_igpu_in_container && CHANGES_MADE=1
if [ "$CHANGES_MADE" -eq 1 ]; then
if pct status "$CONTAINER_ID" | grep -q "running"; then
pct restart "$CONTAINER_ID"
else
pct start "$CONTAINER_ID"
fi
msg_ok "El contenedor $CONTAINER_ID ha sido reiniciado para aplicar los cambios de Coral TPU."
fi
fi
else
msg_info "Instalando controladores de Coral por primera vez en el host..."
install_coral_host
configure_lxc_for_coral && CHANGES_MADE=1
install_coral_in_container && CHANGES_MADE=1
configure_lxc_for_igpu && CHANGES_MADE=1
install_igpu_in_container && CHANGES_MADE=1
if pct status "$CONTAINER_ID" | grep -q "running"; then
pct restart "$CONTAINER_ID"
else
pct start "$CONTAINER_ID"
fi
fi
;;
*)
msg_error "Opción no válida. Saliendo."
exit 1
;;
esac
msg_ok "Configuración completada."
}
# Solicitar reinicio al final si es necesario
final_restart_prompt() {
if [ "$NEED_REBOOT" -eq 1 ]; then
msg_info "Se recomienda reiniciar el servidor para aplicar los cambios correctamente."
restart_prompt
fi
}
# Iniciar
validate_pve_version
select_container
main_menu
final_restart_prompt