Un LLM (Large Language Model) est un modèle d'intelligence artificielle entraîné sur de vastes quantités de texte pour comprendre et générer du langage humain. Ils peuvent être propriétaires ou open-source et sont sélectionnés selon vos besoins.

Comment installer Ollama pour gérer votre LLM ?

Exécutez la commande : curl -fsSL https://ollama.com/install.sh | sh. Ce script installe tous les prérequis nécessaires, y compris les pilotes GPU.

Comment vérifier l'installation d'Ollama ?

Utilisez la commande : ollama -v. Cela permet de valider que tout est bien installé.

Comment déployer un LLM avec Ollama ?

Lancez simplement la commande : ollama run mistral. Vous pouvez interagir avec le modèle via un prompt.

Comment surveiller l'utilisation des ressources de votre LLM ?

Utilisez htop et nvtop pour surveiller la consommation CPU et GPU en temps réel.

Comment contacter l'équipe pour plus d'informations ?

Vous pouvez nous contacter via contact@greenhoster.fr ou notre page de contact.

Votre LLM privé: Tutoriel de déploiement de Mistral AI sur vos serveurs

Q: Comment déployer votre LLM privé sur votre propre serveur ?

Vous pouvez créer, fine-tuner et déployer des modèles localement sur votre hébergement, sans dépendre des API cloud. La data est maîtrisée et reste chez vous, rendant votre IA véritablement personnelle. Open WebUI permet de créer une interface dédiée.

Q: C'est quoi une IA ou AI en anglais ?

L'Intelligence Artificielle (IA) est la capacité d'une machine à répondre de manière autonome et logique. Actuellement, les modèles restent mécaniques, mais leur évolution mène vers une intelligence plus avancée.

Q: C'est quoi un Chatbot ?

Un Chatbot est un programme qui simule une conversation et s'interface avec un LLM pour améliorer la pertinence des réponses. Open WebUI est recommandé pour ses nombreuses fonctionnalités.

Q: A quoi correspond une IA privée ou un LLM privé ?

Déployer un LLM en local vous permet de contrôler vos données sans qu'elles soient exploitées par des tiers. C'est une solution idéale pour les entreprises et les administrations.

Q: Comment requêter le modèle LLM ?

Utilisez : ollama run mistral 'raconte moi une blague'. Pour un appel API, envoyez une requête POST sur le port 11434.

24 Mars 2025

5 minutes de lecture

Tips et Astuces

Image de l'article Votre LLM privé: Tutoriel de déploiement de Mistral AI sur vos serveurs

Sommaire

Comment déployer votre LLM privé sur votre propre serveur ?
Comment requêter le modèle LLM ?
Ollama est un outil puissant qui permet de facilement déployer de nouveaux modèles LLMs.

Comment déployer votre LLM privé sur votre propre serveur ?

Pourquoi c'est important:

Tu peux créer, fine-tuner et déployer des modèles LOCALEMENT sur ton hébergement
Tu n'es plus dépendant des API cloud pour les gros modèles
La data est maitrisée et reste chez toi, pas dans les serveurs d'une Big Tech
L'IA devient vraiment personnelle et non standardisée
Crée votre propre interface avec Open WebUI

D'abord quelques notions:

C'est quoi un LLM ?

Un LLM, ou Large Language Model (modèle de langage de grande taille), est une forme avancée d'intelligence artificielle conçue pour comprendre et générer du texte de manière autonome.
Ces modèles sont entraînés sur de vastes quantités de données textuelles pour apprendre les structures et les significations du langage humain.

Ils peuvent répondre à des questions, traduire des langues, résumer des textes, et même générer des histoires, des articles ou du code pour les développeurs.

Les LLM peuvent être propriétaire et opensource et se multiplient de facon exponentiels.
Vous pourrez les selectionner en fonction de votre besoin, de vos affinités, de leur pertinance ou du pays qui le produit.

C'est quoi une IA ou AI en anglais ?

L'Intelligence Artificielle ou IA est dans toutes les bouches actuellement et ce n'est que le début.
Disons que c'est la capacité d'une machine à répondre de manière autonome et logique à une demande particulière.

Vaste débat mais nous sommes encore dans une phase assez mécanique où les réponses nous semblent peut imaginative, mais ça se développe au fur et à mesure des versions de LLM qui apparaissent et bientot nous parlerons de conscience artificielle pour caractèriser une intelligence aboutie.

C'est quoi un Chatbot ?

Un Chatbot est un programme informatique qui simule une conversation.
Il vient s'interfacer avec le LLM de votre choix pour plus de pertinance et mieux agencer les réponses attentues
Nous utilisons Open Webui car il est à ce jour celui qui offre le plus de fonctionnalité.

A quoi correspond une IA privée ou un LLM privé ?

Avec le développement des IA comme OpenAI, Deepseek, ou Gemini pour n'en citer que quelques uns, il devient primordial de maitriser la données gérer par les moteurs LLM.

Les principes mêmes des Chatbot publiques, est d'exploiter vos données pour renforcer les modèles et surtout pour vous utiliser comme produit.

Lorsque vous déployez une IA en local ou sur une machine privée, vous avez la possibilité de cloisonner votre moteur IA et vous gardez la maitrise des données utilisés.

Votre LLM sera toujours capable de créativité ou de vous informez mais il pourra être utilisé de manière fiable et sécurisé avec vos propres données personnelles.

C'est sans doute une des meilleurs options dans le cadre d'une utilisation en entreprise ou dans une administration public.

Pour la mise en place de notre IA, nous utilisons Ollama qui est un gestionnaire d'IA qui permet à la fois d'installer les prérequis au déploiement d'un LLM mais aussi d'administrer vos LLM

Si je demande à Mistral AI, ça donne:

Ollama est une plateforme permettant de déployer et d'utiliser des modèles de langage de grande taille (LLM) localement. Elle facilite l'intégration de l'IA dans des applications via une API REST et offre divers plugins pour des logiciels comme Obsidian et VSCode.
Ollama permet d'exploiter la puissance de calcul locale, améliorant ainsi les performances et réduisant les coûts liés aux services cloud.

Partant du principe que vos environnements sont préconfigurés et dispose d'un GPU associé, nous ne revenons pas sur l'installation de votre serveur, le notre à les configurations suivantes:

Debian 12
90 Go de Ram, 16 Coeurs CPU
400 Go de disque
2 cartes graphiques Tesla V100

Quoi il y a une commande magique ?
Oui

curl -fsSL https://ollama.com/install.sh | sh

Le script fournit par Ollama est plutôt bien fait et installe aussi bien les pilotes Nvidia/AMD pour votre carte graphique, que tout l'environnement pour faire tourner vos LLM.

Et il ne plante pas, ce qui est assez rare pour le signaler.

On valide l'installation

ollama -v

Il ne reste plus qu'a déployer votre LLM favori, dans notre cas Mistral AI

ollama run mistral

Une fois terminé, vous arrivez sur un prompt qui permet de communiquer avec le LLM

>>> Send a message (/? for help)

ollama run mistral

Soit vous interragissez avec lui, soit vous pouvez le quitter sans souci, il n'y a pas d'impact

/bye

Il existe un grand nombre de modèles, dont voici ceux directement accessible via ollama run
https://ollama.com/library

Ce n'est pas restrictif, vous pouvez déployer d'autres LLM non listé en les téléchargeant vous même, par exemple pour déployer le LLM Lucie voici un tuto:
https://huggingface.co/OpenLLM-France/Lucie-7B-Instruct-v1.1

wget https://huggingface.co/OpenLLM-France/Lucie-7B-Instruct-v1.1-gguf/resolve/main/Lucie-7B-Instruct-v1.1-q4_k_m.gguf
ollama create -f Modelfile lucie
ollama run lucie

Comment requêter le modèle LLM ?

Maintenant que vous savez installer vos LLM, il faut pouvoir les interroger.

Pour le requêter, vous pouvez tout simplement utiliser la commande suivante :

ollama run mistral 'raconte moi une blague'

Il est possible d'intéroger le modèle à travers son Webservice exposé sur le port 11434 de la machine :

curl -X POST https://localhost:11434/api/generate -d '{
  "model": "mistral",
  "prompt":"Comment poussent les carottes  ? "
}'

Cette API REST est un bon moyen d'intégrer le service dans votre écosystème.

Le port par défaut d'Ollama est le 11434 sur le localhost, il est possible de spécifier l'interface réseau d'écoute en définissant la variable système : OLLAMA_HOST

OLLAMA_HOST=0.0.0.0 ollama serve

Sous Linux, on modifie directement dans systemd pour que le paramètre soit pris en compte au démarrage

echo 'Environment="OLLAMA_HOST=0.0.0.0:12600"' >>/etc/systemd/system/ollama.service.d/environment.conf

Cet outil d'analyse de votre carte graphique et donc de l'utilisation de votre GPU va permettre de mieux comprendre l'utilisation des ressources.

Et pour plus d'informations, contactez-nous sur contact@greenhoster.fr ou sur notre page de contact.

Dans le même univers

Image de l'article ChatGPT 5 est enfin disponible gratuitement : l’IA d’OpenAI passe un cap décisif

captainadmin

07/08/25

ChatGPT 5 est enfin disponible gratuitement : l’IA...

Image de l'article DDA8 2025 : Cannes is UP propulse la French Tech Côte d’Azur sur l’île Sainte Marguerite

captainadmin

31/07/25

DDA8 2025 : Cannes is UP propulse la French Tech C...

Image de l'article Proxmox VE 9.0 Beta est disponible : toutes les nouveautés à connaître

captainadmin

24/07/25

Proxmox VE 9.0 Beta est disponible : toutes les no...

Image de l'article Pétition contre la loi Duplomb : que vaut encore la voix du peuple ?

captainadmin

22/07/25

Pétition contre la loi Duplomb : que vaut encore l...

Image de l'article Google Search Console se refait une beauté avec un nouveau rapport Insights

Altitude Dev

17/07/25

Google Search Console se refait une beauté avec un...

Image de l'article Debian 13 se prépare pour l’été 2025 : ce que la mise à jour Trixie nous réserve

Altitude Dev

30/06/25

Debian 13 se prépare pour l’été 2025 : ce que la m...

Image de l'article Découvrez les avantages de l'IPv6 sur vos noms de domaines

captainadmin

24/06/25

Découvrez les avantages de l'IPv6 sur vos noms de ...

Image de l'article Devops : Comment déployer une infrastructure SAAS Proxmox Kubernetes avec Talos

captainadmin

19/06/25

Devops : Comment déployer une infrastructure SAAS ...

Image de l'article Sauvegarder sur le cloud : la solution fiable pour stocker ses données en cas de panne

Altitude Dev

04/06/25

Sauvegarder sur le cloud : la solution fiable pour...

Image de l'article PHP 8.5 et 9.0 : vers un langage plus strict, plus clair et plus robuste

Altitude Dev

02/06/25

PHP 8.5 et 9.0 : vers un langage plus strict, plus...

Image de l'article Guide complet pour déployer une IA privée vLLM sur Ubuntu en 2025

captainadmin

28/05/25

Guide complet pour déployer une IA privée vLLM sur...

Image de l'article Pourquoi choisir un hébergeur web écologique et indépendant en 2025 ?

Altitude Dev

06/05/25

Pourquoi choisir un hébergeur web écologique et in...

Image de l'article vLLM ou Ollama : quel est le meilleur choix pour vos IA ?

captainadmin

09/04/25

vLLM ou Ollama : quel est le meilleur choix pour v...

Image de l'article Open WebUI : Installation, configuration et exécution de LLMs sécurisée pour exploiter Mistral AI

captainadmin

24/03/25

Open WebUI : Installation, configuration et exécut...

Image de l'article Hébergement Web : Optez pour une solution écologique et performante avec Greenhoster

captainadmin

13/03/25

Hébergement Web : Optez pour une solution écologiq...

Image de l'article Infrastructure haute densité par greenhoster

captainadmin

17/02/25

Infrastructure haute densité par greenhoster

Image de l'article Mise en place de l'IPv6 dans un vRack OVH Cloud

captainadmin

29/01/25

Mise en place de l'IPv6 dans un vRack OVH Cloud

Image de l'article Greenhoster, votre hébergeur web écologique propose désormais PHP 8.4

Altitude Dev

24/01/25

Greenhoster, votre hébergeur web écologique propos...

Image de l'article L'hébergement web écologique : une solution performante et durable

captainadmin

20/01/25

L'hébergement web écologique : une solution perfor...

Image de l'article Joyeux Noël 2024 avec Greenhoster

captainadmin

21/12/24

Joyeux Noël 2024 avec Greenhoster

Votre LLM privé: Tutoriel de déploiement de Mistral AI sur vos serveurs

Comment déployer votre LLM privé sur votre propre serveur ?

C'est quoi un LLM ?

C'est quoi une IA ou AI en anglais ?

C'est quoi un Chatbot ?

A quoi correspond une IA privée ou un LLM privé ?

Comment requêter le modèle LLM ?

Ollama est un outil puissant qui permet de facilement déployer de nouveaux modèles LLMs.