Browse Wiki & Semantic Web

Http://fr.dbpedia.org/resource/Apprentissage par renforcement profond

	This page has no properties.

hide properties that link here

	No properties link to this page.

http://fr.dbpedia.org/resource/Apprentissage_par_renforcement_profond

http://dbpedia.org/ontology/abstract	En informatique, l'apprentissage par renfo … En informatique, l'apprentissage par renforcement profond (en anglais : deep reinforcement learning ou deep RL) est un sous-domaine de l'apprentissage automatique (en anglais : machine learning) qui combine l'apprentissage par renforcement et l'apprentissage profond (en anglais : deep learning). L'apprentissage par renforcement considère une classe de problème informatique d'agents devant faire évoluer leurs actions à partir d'expérimentations et d'erreurs. L'apprentissage par renforcement intègre l'apprentissage profond dans la résolution, permettant aux agents de prendre des décisions à partir de données d'entrée réorganisées sans intervention manuelle sur l'espace des états. Les algorithmes d'apprentissage par renforcement profond sont capables de prendre en compte de très grandes quantités de données (par exemple, chaque pixel affiché à l'écran dans un jeu vidéo) et de décider des actions à effectuer pour optimiser un objectif (par exemple, maximiser le score du jeu). L'apprentissage par renforcement profond a été utilisé pour diverses d'applications, y compris, de manière non exhaustive, la robotique , les jeux vidéo, le traitement du langage naturel, la vision par ordinateur, l'éducation, les transports, la finance et la santé.n, les transports, la finance et la santé.
http://dbpedia.org/ontology/thumbnail	http://commons.wikimedia.org/wiki/Special:FilePath/Neural_network_example.svg?width=300 +
http://dbpedia.org/ontology/wikiPageID	14442889
http://dbpedia.org/ontology/wikiPageLength	27355
http://dbpedia.org/ontology/wikiPageRevisionID	190465806
http://dbpedia.org/ontology/wikiPageWikiLink	http://fr.dbpedia.org/resource/MuZero + , http://fr.dbpedia.org/resource/Soins_de_sant%C3%A9 + , http://fr.dbpedia.org/resource/%C3%89checs + , http://fr.dbpedia.org/resource/Espace_des_phases + , http://fr.dbpedia.org/resource/Poker + , http://fr.dbpedia.org/resource/AlphaGo + , http://fr.dbpedia.org/resource/Richard_Sutton + , http://fr.dbpedia.org/resource/AlphaZero + , http://fr.dbpedia.org/resource/Apprentissage_automatique + , http://fr.dbpedia.org/resource/Cat%C3%A9gorie:Pages_avec_des_traductions_non_relues + , http://fr.dbpedia.org/resource/Fichier:Neural_network_example.svg + , http://fr.dbpedia.org/resource/Q-learning + , http://fr.dbpedia.org/resource/Go_%28jeu%29 + , http://fr.dbpedia.org/resource/R%C3%A9seau_neuronal_convolutif + , http://fr.dbpedia.org/resource/Backgammon + , http://fr.dbpedia.org/resource/V%C3%A9hicule_autonome + , http://fr.dbpedia.org/resource/Vision_par_ordinateur + , http://fr.dbpedia.org/resource/Apprentissage + , http://fr.dbpedia.org/resource/M%C3%A9thode_de_Monte-Carlo + , http://fr.dbpedia.org/resource/TD-Gammon + , http://fr.dbpedia.org/resource/R%C3%A9seau_de_neurones_artificiels + , http://fr.dbpedia.org/resource/John_Tsitsiklis + , http://fr.dbpedia.org/resource/Fichier:Markov_diagram_v2.svg + , http://fr.dbpedia.org/resource/Cat%C3%A9gorie:Intelligence_artificielle + , http://fr.dbpedia.org/resource/Projet_Loon + , http://fr.dbpedia.org/resource/Programmation_dynamique + , http://fr.dbpedia.org/resource/Distribution_de_Boltzmann + , http://fr.dbpedia.org/resource/Pluribus_%28robot_de_poker%29 + , http://fr.dbpedia.org/resource/Robotique + , http://fr.dbpedia.org/resource/Universit%C3%A9_Carnegie-Mellon + , http://fr.dbpedia.org/resource/Traitement_automatique_des_langues + , http://fr.dbpedia.org/resource/DeepMind + , http://fr.dbpedia.org/resource/Apprentissage_supervis%C3%A9 + , http://fr.dbpedia.org/resource/Dota_2 + , http://fr.dbpedia.org/resource/Loi_normale + , http://fr.dbpedia.org/resource/Andrew_Barto + , http://fr.dbpedia.org/resource/M%C3%A9thode_de_l%27entropie_crois%C3%A9e + , http://fr.dbpedia.org/resource/OpenAI_Cinq + , http://fr.dbpedia.org/resource/Dimitri_Bertsekas + , http://fr.dbpedia.org/resource/Sh%C5%8Dgi + , http://fr.dbpedia.org/resource/Apprentissage_par_renforcement + , http://fr.dbpedia.org/resource/Temporal_difference_learning + , http://fr.dbpedia.org/resource/Commande_pr%C3%A9dictive + , http://fr.dbpedia.org/resource/Texas_hold%27em + , http://fr.dbpedia.org/resource/Processus_de_d%C3%A9cision_markovien + , http://fr.dbpedia.org/resource/Syst%C3%A8me_multi-agents + , http://fr.dbpedia.org/resource/Apprentissage_profond + , http://fr.dbpedia.org/resource/Jeu_vid%C3%A9o + , http://fr.dbpedia.org/resource/Atari + , http://fr.dbpedia.org/resource/Commande_optimale +
http://fr.dbpedia.org/property/wikiPageUsesTemplate	http://fr.dbpedia.org/resource/Mod%C3%A8le:Palette + , http://fr.dbpedia.org/resource/Mod%C3%A8le:R%C3%A9f%C3%A9rences + , http://fr.dbpedia.org/resource/Mod%C3%A8le:Portail + , http://fr.dbpedia.org/resource/Mod%C3%A8le:%2C +
http://purl.org/dc/terms/subject	http://fr.dbpedia.org/resource/Cat%C3%A9gorie:Pages_avec_des_traductions_non_relues + , http://fr.dbpedia.org/resource/Cat%C3%A9gorie:Intelligence_artificielle +
http://www.w3.org/ns/prov#wasDerivedFrom	http://fr.wikipedia.org/wiki/Apprentissage_par_renforcement_profond?oldid=190465806&ns=0 +
http://xmlns.com/foaf/0.1/depiction	http://commons.wikimedia.org/wiki/Special:FilePath/Markov_diagram_v2.svg + , http://commons.wikimedia.org/wiki/Special:FilePath/Neural_network_example.svg +
http://xmlns.com/foaf/0.1/isPrimaryTopicOf	http://fr.wikipedia.org/wiki/Apprentissage_par_renforcement_profond +
owl:sameAs	http://www.wikidata.org/entity/Q65079156 + , http://dbpedia.org/resource/Deep_reinforcement_learning + , http://g.co/kg/g/11h0mpm7vy + , http://zh.dbpedia.org/resource/%E6%B7%B1%E5%BA%A6%E5%BC%BA%E5%8C%96%E5%AD%A6%E4%B9%A0 + , http://ar.dbpedia.org/resource/%D8%AA%D8%B9%D9%84%D9%8A%D9%85_%D9%85%D8%B9%D8%B2%D8%B2_%D8%B9%D9%85%D9%8A%D9%82 + , http://g.co/kg/g/11f6y3p_tx + , http://fr.dbpedia.org/resource/Apprentissage_par_renforcement_profond + , http://fa.dbpedia.org/resource/%DB%8C%D8%A7%D8%AF%DA%AF%DB%8C%D8%B1%DB%8C_%D8%AA%D9%82%D9%88%DB%8C%D8%AA%DB%8C_%D8%B9%D9%85%DB%8C%D9%82 +
rdfs:comment	En informatique, l'apprentissage par renfo … En informatique, l'apprentissage par renforcement profond (en anglais : deep reinforcement learning ou deep RL) est un sous-domaine de l'apprentissage automatique (en anglais : machine learning) qui combine l'apprentissage par renforcement et l'apprentissage profond (en anglais : deep learning). L'apprentissage par renforcement considère une classe de problème informatique d'agents devant faire évoluer leurs actions à partir d'expérimentations et d'erreurs. L'apprentissage par renforcement intègre l'apprentissage profond dans la résolution, permettant aux agents de prendre des décisions à partir de données d'entrée réorganisées sans intervention manuelle sur l'espace des états. Les algorithmes d'apprentissage par renforcement profond sont capables de prendre en compte de très grandes quantde prendre en compte de très grandes quant
rdfs:label	Apprentissage par renforcement profond , Deep reinforcement learning

hide properties that link here

http://fr.dbpedia.org/resource/Apprentissage_automatique + , http://fr.dbpedia.org/resource/Apprentissage_par_renforcement + , http://fr.dbpedia.org/resource/Apprentissage_profond +	http://dbpedia.org/ontology/wikiPageWikiLink
http://fr.dbpedia.org/tag/EnFrResource +	http://www.w3.org/ns/oa#hasTarget
http://fr.wikipedia.org/wiki/Apprentissage_par_renforcement_profond +	http://xmlns.com/foaf/0.1/primaryTopic
http://fr.dbpedia.org/resource/Apprentissage_par_renforcement_profond +	owl:sameAs

Browse Wiki & Semantic Web

Navigation menu

Personal tools

Namespaces

Variants

Views

Actions

Search

Navigation

Tools