Top 50 ML Q&A - Follow Dr. Angshuman Ghosh For More - En.fr - 2
Top 50 ML Q&A - Follow Dr. Angshuman Ghosh For More - En.fr - 2
Top 50 ML Q&A - Follow Dr. Angshuman Ghosh For More - En.fr - 2
com/
L'apprentissage automatique est une branche de l'informatique qui traite de la programmation système afin d'apprendre et de
s'améliorer automatiquement avec l'expérience. Par exemple : les robots sont programmés pour qu'ils puissent effectuer la tâche en
fonction des données qu'ils recueillent auprès des capteurs. Il apprend automatiquement les programmes à partir des données.
L'apprentissage automatique concerne l'étude, la conception et le développement d'algorithmes qui donnent aux ordinateurs la
capacité d'apprendre sans être explicitement programmés. Alors que l'exploration de données peut être définie comme le
processus dans lequel les données non structurées tentent d'extraire des connaissances ou des modèles intéressants inconnus.
Au cours de ce processus machine, des algorithmes d'apprentissage sont utilisés.
Dans l'apprentissage automatique, lorsqu'un modèle statistique décrit une erreur aléatoire ou un bruit au lieu d'une relation sous-
jacente, un « surajustement » se produit. Lorsqu'un modèle est excessivement complexe, un surajustement est normalement observé,
en raison d'un trop grand nombre de paramètres par rapport au nombre de types de données d'apprentissage. Le modèle présente
des performances médiocres qui ont été surajustées.
La possibilité de surajustement existe car les critères utilisés pour former le modèle ne sont pas les mêmes que les
critères utilisés pour juger de l'ecacité d'un modèle.
En utilisant beaucoup de données, le surajustement peut être évité, le surajustement se produit relativement lorsque vous disposez d'un petit ensemble
de données et que vous essayez d'en tirer des leçons. Mais si vous avez une petite base de données et que vous êtes obligé de venir avec un modèle basé
sur cela. Dans une telle situation, vous pouvez utiliser une technique connue sous le nom devalidation croisée. Dans cette méthode, l'ensemble de
données se divise en deux sections, les ensembles de données de test et d'entraînement, l'ensemble de données de test ne testera que le modèle tandis
que, dans l'ensemble de données d'entraînement, les points de données généreront le modèle.
Dans cette technique, un modèle reçoit généralement un ensemble de données de données connues sur lesquelles l'entraînement (ensemble de
données d'entraînement) est exécuté et un ensemble de données de données inconnues contre lesquelles le modèle est testé. L'idée de la validation
croisée est de définir un jeu de données pour « tester » le modèle dans la phase d'apprentissage.
L'apprentissage automatique inductif implique le processus d'apprentissage par des exemples, où un système, à partir d'un ensemble
d'instances observées, essaie d'induire une règle générale.
7) Quels sont les cinq algorithmes populaires du Machine Learning ?
c) Réseaux probabilistes
a) Apprentissage supervisé
c) Apprentissage semi-supervisé
e) Transduction
f) Apprendre à apprendre
9) Quelles sont les trois étapes pour construire les hypothèses ou le modèle en apprentissage automatique ?
a) Construction de maquettes
b) Test du modèle
c) Application du modèle
L'approche standard de l'apprentissage supervisé consiste à diviser l'ensemble d'exemples en ensemble d'apprentissage et
en test.
Dans divers domaines de la science de l'information comme l'apprentissage automatique, un ensemble de données est utilisé pour découvrir la
relation potentiellement prédictive connue sous le nom de « ensemble de formation ». L'ensemble d'apprentissage est un exemple donné à
l'apprenant, tandis que l'ensemble de test est utilisé pour tester l'exactitude des hypothèses générées par l'apprenant, et c'est l'ensemble
d'exemples retenu par l'apprenant. L'ensemble d'apprentissage est distinct de l'ensemble de test.
a) Intelligence Artificielle
a) Classements
b) Reconnaissance vocale
c) Régression
L'apprentissage automatique dans lequel les fondements mathématiques sont indépendants de tout classificateur ou algorithme
d'apprentissage particulier est appelé apprentissage automatique indépendant de l'algorithme ?
Concevoir et développer des algorithmes en fonction des comportements basés sur des données empiriques est connu sous le nom
de Machine Learning. Bien que l'intelligence artificielle en plus de l'apprentissage automatique, elle couvre également d'autres
aspects tels que la représentation des connaissances, le traitement du langage naturel, la planification, la robotique, etc.
Un classificateur dans un Machine Learning est un système qui entre un vecteur de valeurs de caractéristiques discrètes ou
continues et sort une seule valeur discrète, la classe.
Dans Naïve Bayes, le classificateur convergera plus rapidement que les modèles discriminants comme la régression logistique, vous aurez donc besoin
de moins de données d'apprentissage. Le principal avantage est qu'il ne peut pas apprendre les interactions entre les fonctionnalités.
b) Reconnaissance de la parole
c) Exploration de données
ré) Statistiques
e) Récupération informelle
F) Bio-informatique
La programmation génétique est l'une des deux techniques utilisées en apprentissage automatique. Le modèle est basé sur
le test et la sélection du meilleur choix parmi un ensemble de résultats.
La programmation logique inductive (ILP) est un sous-domaine de l'apprentissage automatique qui utilise la programmation logique
représentant des connaissances de base et des exemples.
Le processus de sélection de modèles parmi différents modèles mathématiques, qui sont utilisés pour décrire le même ensemble de
données, est connu sous le nom de sélection de modèle. La sélection de modèles est appliquée aux domaines des statistiques, de
l'apprentissage automatique et de l'exploration de données.
24) Quelles sont les deux méthodes utilisées pour le calibrage en Apprentissage Supervisé ?
Les deux méthodes utilisées pour prédire les bonnes probabilités en apprentissage supervisé sont
a) Étalonnage Platt
b) Régression isotonique
Ces méthodes sont conçues pour la classification binaire, et ce n'est pas trivial.
Lorsqu'il y a suffisamment de données, la « régression isotonique » est utilisée pour éviter un problème de surajustement.
26) Quelle est la différence entre l'heuristique pour l'apprentissage des règles et l'heuristique pour les arbres de
décision ?
La différence est que les heuristiques pour les arbres de décision évaluent la qualité moyenne d'un certain nombre
d'ensembles disjoints tandis que les apprenants de règles n'évaluent que la qualité de l'ensemble d'instances couvert par la
règle candidate.
En apprentissage automatique, Perceptron est un algorithme de classification supervisée de l'entrée dans l'une des
nombreuses sorties non binaires possibles.
Le réseau bayésien est utilisé pour représenter le modèle graphique de la relation de probabilité entre un ensemble de
variables.
30) Pourquoi un algorithme d'apprentissage basé sur des instances parfois appelé algorithme d'apprentissage
paresseux ?
L'algorithme d'apprentissage basé sur les instances est également appelé algorithme d'apprentissage paresseux car il retarde le
processus d'induction ou de généralisation jusqu'à ce que la classification soit effectuée.
31) Quelles sont les deux méthodes de classification que SVM (Support Vector Machine) peut
gérer ?
Pour résoudre un programme de calcul particulier, plusieurs modèles tels que des classificateurs ou des experts sont générés
et combinés de manière stratégique. Ce processus est connu sous le nom d'apprentissage d'ensemble.
L'apprentissage d'ensemble est utilisé pour améliorer la classification, la prédiction, l'approximation des fonctions, etc. d'un
modèle.
L'apprentissage d'ensemble est utilisé lorsque vous créez des classificateurs de composants plus précis et
indépendants les uns des autres.
36) Quel est le principe général d'une méthode d'ensemble et qu'est-ce que le bagging et le
boosting dans la méthode d'ensemble ?
Le principe général d'une méthode d'ensemble est de combiner les prédictions de plusieurs modèles construits avec un
algorithme d'apprentissage donné afin d'améliorer la robustesse sur un seul modèle. L'ensachage est une méthode
d'ensemble pour améliorer les schémas d'estimation ou de classification instables. Les méthodes de boosting sont utilisées
de manière séquentielle pour réduire le biais du modèle combiné. Boosting et Bagging peuvent tous deux réduire les erreurs
en réduisant le terme de variance.
37) Qu'est-ce que la décomposition biais-variance de l'erreur de classification dans la méthode d'ensemble ?
L'erreur attendue d'un algorithme d'apprentissage peut être décomposée en biais et en variance. Un terme de biais mesure
à quel point le classificateur moyen produit par l'algorithme d'apprentissage correspond à la fonction cible. Le terme de
variance mesure à quel point la prédiction de l'algorithme d'apprentissage fluctue pour différents ensembles
d'apprentissage.
La méthode d'apprentissage incrémentiel est la capacité d'un algorithme à apprendre à partir de nouvelles données qui peuvent
être disponibles après que le classificateur a déjà été généré à partir d'un ensemble de données déjà disponible.
L'ACP (Analyse en Composantes Principales), la KPCA (Analyse en Composantes Principales basée sur le noyau) et l'ICA (Analyse en
Composantes Indépendantes) sont des techniques d'extraction de caractéristiques importantes utilisées pour la réduction de
dimensionnalité.
Dans l'apprentissage automatique et les statistiques, la réduction des dimensions est le processus de réduction du nombre de
variables aléatoires prises en compte et peut être divisée en sélection de caractéristiques et extraction de caractéristiques
Les machines à vecteurs de support sont des algorithmes d'apprentissage supervisé utilisés pour la classification et l'analyse de régression.
a) Acquisition de données
d) Type de requête
e) Métrique de notation
f) Test de signification
Les différentes méthodes pour résoudre les problèmes d'apprentissage supervisé séquentiel sont
44) Quels sont les domaines de la robotique et du traitement de l'information où se pose le problème
de la prédiction séquentielle ?
Les domaines de la robotique et du traitement de l'information où se pose le problème de la prédiction séquentielle sont
b) Prédiction structurée
Les techniques d'apprentissage statistique permettent d'apprendre une fonction ou un prédicteur à partir d'un ensemble de données
observées qui peuvent faire des prédictions sur des données invisibles ou futures. Ces techniques fournissent des garanties sur les
performances du prédicteur appris sur les futures données invisibles sur la base d'une hypothèse statistique sur le processus de
génération de données.
L'apprentissage PAC (probablement approximativement correct) est un cadre d'apprentissage qui a été introduit pour
analyser les algorithmes d'apprentissage et leur efficacité statistique.
47) Quelles sont les diérentes catégories que vous pouvez classer dans le processus d'apprentissage des
séquences ?
a) Prédiction de séquence
b) Génération de séquences
c) Reconnaissance de séquence
d) Décision séquentielle
a) Programmation génétique
b) Apprentissage inductif
50) Donnez une application populaire d'apprentissage automatique que vous voyez au jour le jour ?
Le moteur de recommandation mis en place par les principaux sites de e-commerce utilise le Machine Learning
Projet
Tes t Gestion Analyste d'affaires E Piratage éthique PMP
La gestion
Logiciel
Jenkins Tests agiles RPA JUnité
Ingénierie