Top 50 ML Q&A - Follow Dr. Angshuman Ghosh For More - En.fr - 2

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 8

https://career.guru99.

com/

Top 50 des questions et réponses d'entretien


d'apprentissage automatique

1) Qu'est-ce que l'apprentissage automatique ?

L'apprentissage automatique est une branche de l'informatique qui traite de la programmation système afin d'apprendre et de
s'améliorer automatiquement avec l'expérience. Par exemple : les robots sont programmés pour qu'ils puissent effectuer la tâche en
fonction des données qu'ils recueillent auprès des capteurs. Il apprend automatiquement les programmes à partir des données.

2) Mentionnez la différence entre l'exploration de données et l'apprentissage automatique ?

L'apprentissage automatique concerne l'étude, la conception et le développement d'algorithmes qui donnent aux ordinateurs la
capacité d'apprendre sans être explicitement programmés. Alors que l'exploration de données peut être définie comme le
processus dans lequel les données non structurées tentent d'extraire des connaissances ou des modèles intéressants inconnus.
Au cours de ce processus machine, des algorithmes d'apprentissage sont utilisés.

3) Qu'est-ce que le « surajustement » en apprentissage automatique ?

Dans l'apprentissage automatique, lorsqu'un modèle statistique décrit une erreur aléatoire ou un bruit au lieu d'une relation sous-
jacente, un « surajustement » se produit. Lorsqu'un modèle est excessivement complexe, un surajustement est normalement observé,
en raison d'un trop grand nombre de paramètres par rapport au nombre de types de données d'apprentissage. Le modèle présente
des performances médiocres qui ont été surajustées.

4) Pourquoi le surajustement se produit-il ?

La possibilité de surajustement existe car les critères utilisés pour former le modèle ne sont pas les mêmes que les
critères utilisés pour juger de l'ecacité d'un modèle.

5) Comment éviter le surajustement ?

En utilisant beaucoup de données, le surajustement peut être évité, le surajustement se produit relativement lorsque vous disposez d'un petit ensemble

de données et que vous essayez d'en tirer des leçons. Mais si vous avez une petite base de données et que vous êtes obligé de venir avec un modèle basé

sur cela. Dans une telle situation, vous pouvez utiliser une technique connue sous le nom devalidation croisée. Dans cette méthode, l'ensemble de

données se divise en deux sections, les ensembles de données de test et d'entraînement, l'ensemble de données de test ne testera que le modèle tandis

que, dans l'ensemble de données d'entraînement, les points de données généreront le modèle.

Dans cette technique, un modèle reçoit généralement un ensemble de données de données connues sur lesquelles l'entraînement (ensemble de

données d'entraînement) est exécuté et un ensemble de données de données inconnues contre lesquelles le modèle est testé. L'idée de la validation

croisée est de définir un jeu de données pour « tester » le modèle dans la phase d'apprentissage.

6) Qu'est-ce que l'apprentissage automatique inductif ?

L'apprentissage automatique inductif implique le processus d'apprentissage par des exemples, où un système, à partir d'un ensemble
d'instances observées, essaie d'induire une règle générale.
7) Quels sont les cinq algorithmes populaires du Machine Learning ?

une) Arbres de décision

b) Réseaux de neurones (rétro propagation)

c) Réseaux probabilistes

ré) Voisin le plus proche

e) Soutenir les machines vectorielles

8) Quelles sont les différentes techniques d'algorithmes en Machine Learning ?

Les différents types de techniques en Machine Learning sont

a) Apprentissage supervisé

b) Apprentissage non supervisé

c) Apprentissage semi-supervisé

d) Apprentissage par renforcement

e) Transduction

f) Apprendre à apprendre

9) Quelles sont les trois étapes pour construire les hypothèses ou le modèle en apprentissage automatique ?

a) Construction de maquettes

b) Test du modèle

c) Application du modèle

10) Quelle est l'approche standard de l'apprentissage supervisé ?

L'approche standard de l'apprentissage supervisé consiste à diviser l'ensemble d'exemples en ensemble d'apprentissage et
en test.

11) Qu'est-ce qu'un « ensemble d'entraînement » et un « ensemble de test » ?

Dans divers domaines de la science de l'information comme l'apprentissage automatique, un ensemble de données est utilisé pour découvrir la
relation potentiellement prédictive connue sous le nom de « ensemble de formation ». L'ensemble d'apprentissage est un exemple donné à
l'apprenant, tandis que l'ensemble de test est utilisé pour tester l'exactitude des hypothèses générées par l'apprenant, et c'est l'ensemble
d'exemples retenu par l'apprenant. L'ensemble d'apprentissage est distinct de l'ensemble de test.

12) Dressez la liste des différentes approches pour l'apprentissage automatique ?

Les différentes approches du Machine Learning sont

a) Apprentissage des concepts et des classifications

b) Apprentissage symbolique contre apprentissage statistique


c) Apprentissage inductif contre apprentissage analytique

13) Qu'est-ce que l'apprentissage automatique ?

a) Intelligence Artificielle

b) Inférence basée sur des règles

14) Expliquez quelle est la fonction de « l'apprentissage non supervisé » ?

a) Trouver des clusters de données

b) Trouver des représentations de faible dimension des données

c) Trouver des directions intéressantes dans les données

d) Coordonnées et corrélations intéressantes

e) Trouver de nouvelles observations/nettoyage de la base de données

15) Expliquez quelle est la fonction de « l'apprentissage supervisé » ?

a) Classements

b) Reconnaissance vocale

c) Régression

d) Prédire les séries chronologiques

e) Annoter les chaînes

16) Qu'est-ce que l'apprentissage automatique indépendant des algorithmes ?

L'apprentissage automatique dans lequel les fondements mathématiques sont indépendants de tout classificateur ou algorithme
d'apprentissage particulier est appelé apprentissage automatique indépendant de l'algorithme ?

17) Quelle est la différence entre l'apprentissage artificiel et l'apprentissage automatique ?

Concevoir et développer des algorithmes en fonction des comportements basés sur des données empiriques est connu sous le nom
de Machine Learning. Bien que l'intelligence artificielle en plus de l'apprentissage automatique, elle couvre également d'autres
aspects tels que la représentation des connaissances, le traitement du langage naturel, la planification, la robotique, etc.

18) Qu'est-ce qu'un classificateur en machine learning ?

Un classificateur dans un Machine Learning est un système qui entre un vecteur de valeurs de caractéristiques discrètes ou
continues et sort une seule valeur discrète, la classe.

19) Quels sont les avantages de Naive Bayes ?

Dans Naïve Bayes, le classificateur convergera plus rapidement que les modèles discriminants comme la régression logistique, vous aurez donc besoin

de moins de données d'apprentissage. Le principal avantage est qu'il ne peut pas apprendre les interactions entre les fonctionnalités.

20) Dans quels domaines la reconnaissance de formes est-elle utilisée ?

La reconnaissance de formes peut être utilisée dans


une) Vision par ordinateur

b) Reconnaissance de la parole

c) Exploration de données

ré) Statistiques

e) Récupération informelle

F) Bio-informatique

21) Qu'est-ce que la programmation génétique ?

La programmation génétique est l'une des deux techniques utilisées en apprentissage automatique. Le modèle est basé sur
le test et la sélection du meilleur choix parmi un ensemble de résultats.

22) Qu'est-ce que la programmation logique inductive en apprentissage automatique ?

La programmation logique inductive (ILP) est un sous-domaine de l'apprentissage automatique qui utilise la programmation logique
représentant des connaissances de base et des exemples.

23) Qu'est-ce que la sélection de modèles dans l'apprentissage automatique ?

Le processus de sélection de modèles parmi différents modèles mathématiques, qui sont utilisés pour décrire le même ensemble de
données, est connu sous le nom de sélection de modèle. La sélection de modèles est appliquée aux domaines des statistiques, de
l'apprentissage automatique et de l'exploration de données.

24) Quelles sont les deux méthodes utilisées pour le calibrage en Apprentissage Supervisé ?

Les deux méthodes utilisées pour prédire les bonnes probabilités en apprentissage supervisé sont

a) Étalonnage Platt

b) Régression isotonique

Ces méthodes sont conçues pour la classification binaire, et ce n'est pas trivial.

25) Quelle méthode est fréquemment utilisée pour éviter le surajustement ?

Lorsqu'il y a suffisamment de données, la « régression isotonique » est utilisée pour éviter un problème de surajustement.

26) Quelle est la différence entre l'heuristique pour l'apprentissage des règles et l'heuristique pour les arbres de
décision ?

La différence est que les heuristiques pour les arbres de décision évaluent la qualité moyenne d'un certain nombre
d'ensembles disjoints tandis que les apprenants de règles n'évaluent que la qualité de l'ensemble d'instances couvert par la
règle candidate.

27) Qu'est-ce que Perceptron dans l'apprentissage automatique ?

En apprentissage automatique, Perceptron est un algorithme de classification supervisée de l'entrée dans l'une des
nombreuses sorties non binaires possibles.

28) Expliquer les deux composantes du programme de logique bayésienne ?


Le programme de logique bayésienne se compose de deux composants. Le premier élément est logique ; il se
compose d'un ensemble de clauses bayésiennes, qui capture la structure qualitative du domaine. Le deuxième
composant est quantitatif, il code les informations quantitatives sur le domaine.

29) Que sont les réseaux bayésiens (BN) ?

Le réseau bayésien est utilisé pour représenter le modèle graphique de la relation de probabilité entre un ensemble de
variables.

30) Pourquoi un algorithme d'apprentissage basé sur des instances parfois appelé algorithme d'apprentissage
paresseux ?

L'algorithme d'apprentissage basé sur les instances est également appelé algorithme d'apprentissage paresseux car il retarde le
processus d'induction ou de généralisation jusqu'à ce que la classification soit effectuée.

31) Quelles sont les deux méthodes de classification que SVM (Support Vector Machine) peut
gérer ?

a) Combiner des classificateurs binaires

b) Modification du binaire pour incorporer l'apprentissage multiclasse

32) Qu'est-ce que l'apprentissage d'ensemble ?

Pour résoudre un programme de calcul particulier, plusieurs modèles tels que des classificateurs ou des experts sont générés
et combinés de manière stratégique. Ce processus est connu sous le nom d'apprentissage d'ensemble.

33) Pourquoi l'apprentissage par ensemble est-il utilisé ?

L'apprentissage d'ensemble est utilisé pour améliorer la classification, la prédiction, l'approximation des fonctions, etc. d'un
modèle.

34) Quand utiliser l'apprentissage par ensemble ?

L'apprentissage d'ensemble est utilisé lorsque vous créez des classificateurs de composants plus précis et
indépendants les uns des autres.

35) Quels sont les deux paradigmes des méthodes d'ensemble ?

Les deux paradigmes des méthodes d'ensemble sont

a) Méthodes d'ensemble séquentiel

b) Méthodes d'ensembles parallèles

36) Quel est le principe général d'une méthode d'ensemble et qu'est-ce que le bagging et le
boosting dans la méthode d'ensemble ?

Le principe général d'une méthode d'ensemble est de combiner les prédictions de plusieurs modèles construits avec un
algorithme d'apprentissage donné afin d'améliorer la robustesse sur un seul modèle. L'ensachage est une méthode
d'ensemble pour améliorer les schémas d'estimation ou de classification instables. Les méthodes de boosting sont utilisées
de manière séquentielle pour réduire le biais du modèle combiné. Boosting et Bagging peuvent tous deux réduire les erreurs
en réduisant le terme de variance.

37) Qu'est-ce que la décomposition biais-variance de l'erreur de classification dans la méthode d'ensemble ?
L'erreur attendue d'un algorithme d'apprentissage peut être décomposée en biais et en variance. Un terme de biais mesure
à quel point le classificateur moyen produit par l'algorithme d'apprentissage correspond à la fonction cible. Le terme de
variance mesure à quel point la prédiction de l'algorithme d'apprentissage fluctue pour différents ensembles
d'apprentissage.

38) Qu'est-ce qu'un algorithme d'apprentissage incrémentiel en ensemble ?

La méthode d'apprentissage incrémentiel est la capacité d'un algorithme à apprendre à partir de nouvelles données qui peuvent
être disponibles après que le classificateur a déjà été généré à partir d'un ensemble de données déjà disponible.

39) A quoi servent les PCA, KPCA et ICA ?

L'ACP (Analyse en Composantes Principales), la KPCA (Analyse en Composantes Principales basée sur le noyau) et l'ICA (Analyse en
Composantes Indépendantes) sont des techniques d'extraction de caractéristiques importantes utilisées pour la réduction de
dimensionnalité.

40) Qu'est-ce que la réduction de dimension en Machine Learning ?

Dans l'apprentissage automatique et les statistiques, la réduction des dimensions est le processus de réduction du nombre de
variables aléatoires prises en compte et peut être divisée en sélection de caractéristiques et extraction de caractéristiques

41) Que sont les machines à vecteurs de support ?

Les machines à vecteurs de support sont des algorithmes d'apprentissage supervisé utilisés pour la classification et l'analyse de régression.

42) Quelles sont les composantes des techniques d'évaluation relationnelle ?

Les éléments importants des techniques d'évaluation relationnelle sont

a) Acquisition de données

b) Acquisition de la vérité terrain

c) Technique de validation croisée

d) Type de requête

e) Métrique de notation

f) Test de signification

43) Quelles sont les différentes méthodes d'apprentissage supervisé séquentiel ?

Les différentes méthodes pour résoudre les problèmes d'apprentissage supervisé séquentiel sont

a) Méthodes des fenêtres coulissantes

b) Fenêtres coulissantes récurrentes

c) Modèles de Markow cachés

d) Modèles de Markow à entropie maximale

e) Champs aléatoires conditionnels


F) Réseaux de transformateurs de graphes

44) Quels sont les domaines de la robotique et du traitement de l'information où se pose le problème
de la prédiction séquentielle ?

Les domaines de la robotique et du traitement de l'information où se pose le problème de la prédiction séquentielle sont

a) Apprentissage par imitation

b) Prédiction structurée

c) Apprentissage par renforcement basé sur un modèle

45) Qu'est-ce que l'apprentissage statistique par lots ?

Les techniques d'apprentissage statistique permettent d'apprendre une fonction ou un prédicteur à partir d'un ensemble de données
observées qui peuvent faire des prédictions sur des données invisibles ou futures. Ces techniques fournissent des garanties sur les
performances du prédicteur appris sur les futures données invisibles sur la base d'une hypothèse statistique sur le processus de
génération de données.

46) Qu'est-ce que l'apprentissage PAC ?

L'apprentissage PAC (probablement approximativement correct) est un cadre d'apprentissage qui a été introduit pour
analyser les algorithmes d'apprentissage et leur efficacité statistique.

47) Quelles sont les diérentes catégories que vous pouvez classer dans le processus d'apprentissage des
séquences ?

a) Prédiction de séquence

b) Génération de séquences

c) Reconnaissance de séquence

d) Décision séquentielle

48) Qu'est-ce que l'apprentissage séquentiel ?

L'apprentissage séquentiel est une méthode d'enseignement et d'apprentissage de manière logique.

49) Quelles sont les deux techniques de Machine Learning ?

Les deux techniques de Machine Learning sont

a) Programmation génétique

b) Apprentissage inductif

50) Donnez une application populaire d'apprentissage automatique que vous voyez au jour le jour ?

Le moteur de recommandation mis en place par les principaux sites de e-commerce utilise le Machine Learning

Guru99 Fournit TUTORIEL EN LIGNE GRATUIT sur divers cours comme


Java MIS MongoDB Big Data Cassandre

Services Web SQLite JSP Informatique Comptabilité

Formation SAP Python Exceller Réseau ASP HBase

Projet
Tes t Gestion Analyste d'affaires E Piratage éthique PMP
La gestion

Projet en direct SoapUI Photoshop Test manuel Tests mobiles

Entrepôt de données Tutoriel R Tableau DevOps AWS

Logiciel
Jenkins Tests agiles RPA JUnité
Ingénierie

Sélénium CCNA AngularJS NodeJS PLSQL

Vous aimerez peut-être aussi