Browse Wiki & Semantic Web

Jump to: navigation, search
Http://fr.dbpedia.org/resource/Apprentissage par renforcement profond
  This page has no properties.
hide properties that link here 
  No properties link to this page.
 
http://fr.dbpedia.org/resource/Apprentissage_par_renforcement_profond
http://dbpedia.org/ontology/abstract En informatique, l'apprentissage par renfoEn informatique, l'apprentissage par renforcement profond (en anglais : deep reinforcement learning ou deep RL) est un sous-domaine de l'apprentissage automatique (en anglais : machine learning) qui combine l'apprentissage par renforcement et l'apprentissage profond (en anglais : deep learning). L'apprentissage par renforcement considère une classe de problème informatique d'agents devant faire évoluer leurs actions à partir d'expérimentations et d'erreurs. L'apprentissage par renforcement intègre l'apprentissage profond dans la résolution, permettant aux agents de prendre des décisions à partir de données d'entrée réorganisées sans intervention manuelle sur l'espace des états. Les algorithmes d'apprentissage par renforcement profond sont capables de prendre en compte de très grandes quantités de données (par exemple, chaque pixel affiché à l'écran dans un jeu vidéo) et de décider des actions à effectuer pour optimiser un objectif (par exemple, maximiser le score du jeu). L'apprentissage par renforcement profond a été utilisé pour diverses d'applications, y compris, de manière non exhaustive, la robotique , les jeux vidéo, le traitement du langage naturel, la vision par ordinateur, l'éducation, les transports, la finance et la santé.n, les transports, la finance et la santé.
http://dbpedia.org/ontology/thumbnail http://commons.wikimedia.org/wiki/Special:FilePath/Neural_network_example.svg?width=300 +
http://dbpedia.org/ontology/wikiPageID 14442889
http://dbpedia.org/ontology/wikiPageLength 27355
http://dbpedia.org/ontology/wikiPageRevisionID 190465806
http://dbpedia.org/ontology/wikiPageWikiLink http://fr.dbpedia.org/resource/MuZero + , http://fr.dbpedia.org/resource/Soins_de_sant%C3%A9 + , http://fr.dbpedia.org/resource/%C3%89checs + , http://fr.dbpedia.org/resource/Espace_des_phases + , http://fr.dbpedia.org/resource/Poker + , http://fr.dbpedia.org/resource/AlphaGo + , http://fr.dbpedia.org/resource/Richard_Sutton + , http://fr.dbpedia.org/resource/AlphaZero + , http://fr.dbpedia.org/resource/Apprentissage_automatique + , http://fr.dbpedia.org/resource/Cat%C3%A9gorie:Pages_avec_des_traductions_non_relues + , http://fr.dbpedia.org/resource/Fichier:Neural_network_example.svg + , http://fr.dbpedia.org/resource/Q-learning + , http://fr.dbpedia.org/resource/Go_%28jeu%29 + , http://fr.dbpedia.org/resource/R%C3%A9seau_neuronal_convolutif + , http://fr.dbpedia.org/resource/Backgammon + , http://fr.dbpedia.org/resource/V%C3%A9hicule_autonome + , http://fr.dbpedia.org/resource/Vision_par_ordinateur + , http://fr.dbpedia.org/resource/Apprentissage + , http://fr.dbpedia.org/resource/M%C3%A9thode_de_Monte-Carlo + , http://fr.dbpedia.org/resource/TD-Gammon + , http://fr.dbpedia.org/resource/R%C3%A9seau_de_neurones_artificiels + , http://fr.dbpedia.org/resource/John_Tsitsiklis + , http://fr.dbpedia.org/resource/Fichier:Markov_diagram_v2.svg + , http://fr.dbpedia.org/resource/Cat%C3%A9gorie:Intelligence_artificielle + , http://fr.dbpedia.org/resource/Projet_Loon + , http://fr.dbpedia.org/resource/Programmation_dynamique + , http://fr.dbpedia.org/resource/Distribution_de_Boltzmann + , http://fr.dbpedia.org/resource/Pluribus_%28robot_de_poker%29 + , http://fr.dbpedia.org/resource/Robotique + , http://fr.dbpedia.org/resource/Universit%C3%A9_Carnegie-Mellon + , http://fr.dbpedia.org/resource/Traitement_automatique_des_langues + , http://fr.dbpedia.org/resource/DeepMind + , http://fr.dbpedia.org/resource/Apprentissage_supervis%C3%A9 + , http://fr.dbpedia.org/resource/Dota_2 + , http://fr.dbpedia.org/resource/Loi_normale + , http://fr.dbpedia.org/resource/Andrew_Barto + , http://fr.dbpedia.org/resource/M%C3%A9thode_de_l%27entropie_crois%C3%A9e + , http://fr.dbpedia.org/resource/OpenAI_Cinq + , http://fr.dbpedia.org/resource/Dimitri_Bertsekas + , http://fr.dbpedia.org/resource/Sh%C5%8Dgi + , http://fr.dbpedia.org/resource/Apprentissage_par_renforcement + , http://fr.dbpedia.org/resource/Temporal_difference_learning + , http://fr.dbpedia.org/resource/Commande_pr%C3%A9dictive + , http://fr.dbpedia.org/resource/Texas_hold%27em + , http://fr.dbpedia.org/resource/Processus_de_d%C3%A9cision_markovien + , http://fr.dbpedia.org/resource/Syst%C3%A8me_multi-agents + , http://fr.dbpedia.org/resource/Apprentissage_profond + , http://fr.dbpedia.org/resource/Jeu_vid%C3%A9o + , http://fr.dbpedia.org/resource/Atari + , http://fr.dbpedia.org/resource/Commande_optimale +
http://fr.dbpedia.org/property/wikiPageUsesTemplate http://fr.dbpedia.org/resource/Mod%C3%A8le:Palette + , http://fr.dbpedia.org/resource/Mod%C3%A8le:R%C3%A9f%C3%A9rences + , http://fr.dbpedia.org/resource/Mod%C3%A8le:Portail + , http://fr.dbpedia.org/resource/Mod%C3%A8le:%2C +
http://purl.org/dc/terms/subject http://fr.dbpedia.org/resource/Cat%C3%A9gorie:Pages_avec_des_traductions_non_relues + , http://fr.dbpedia.org/resource/Cat%C3%A9gorie:Intelligence_artificielle +
http://www.w3.org/ns/prov#wasDerivedFrom http://fr.wikipedia.org/wiki/Apprentissage_par_renforcement_profond?oldid=190465806&ns=0 +
http://xmlns.com/foaf/0.1/depiction http://commons.wikimedia.org/wiki/Special:FilePath/Markov_diagram_v2.svg + , http://commons.wikimedia.org/wiki/Special:FilePath/Neural_network_example.svg +
http://xmlns.com/foaf/0.1/isPrimaryTopicOf http://fr.wikipedia.org/wiki/Apprentissage_par_renforcement_profond +
owl:sameAs http://www.wikidata.org/entity/Q65079156 + , http://dbpedia.org/resource/Deep_reinforcement_learning + , http://g.co/kg/g/11h0mpm7vy + , http://zh.dbpedia.org/resource/%E6%B7%B1%E5%BA%A6%E5%BC%BA%E5%8C%96%E5%AD%A6%E4%B9%A0 + , http://ar.dbpedia.org/resource/%D8%AA%D8%B9%D9%84%D9%8A%D9%85_%D9%85%D8%B9%D8%B2%D8%B2_%D8%B9%D9%85%D9%8A%D9%82 + , http://g.co/kg/g/11f6y3p_tx + , http://fr.dbpedia.org/resource/Apprentissage_par_renforcement_profond + , http://fa.dbpedia.org/resource/%DB%8C%D8%A7%D8%AF%DA%AF%DB%8C%D8%B1%DB%8C_%D8%AA%D9%82%D9%88%DB%8C%D8%AA%DB%8C_%D8%B9%D9%85%DB%8C%D9%82 +
rdfs:comment En informatique, l'apprentissage par renfoEn informatique, l'apprentissage par renforcement profond (en anglais : deep reinforcement learning ou deep RL) est un sous-domaine de l'apprentissage automatique (en anglais : machine learning) qui combine l'apprentissage par renforcement et l'apprentissage profond (en anglais : deep learning). L'apprentissage par renforcement considère une classe de problème informatique d'agents devant faire évoluer leurs actions à partir d'expérimentations et d'erreurs. L'apprentissage par renforcement intègre l'apprentissage profond dans la résolution, permettant aux agents de prendre des décisions à partir de données d'entrée réorganisées sans intervention manuelle sur l'espace des états. Les algorithmes d'apprentissage par renforcement profond sont capables de prendre en compte de très grandes quantde prendre en compte de très grandes quant
rdfs:label Apprentissage par renforcement profond , Deep reinforcement learning
hide properties that link here 
http://fr.dbpedia.org/resource/Apprentissage_automatique + , http://fr.dbpedia.org/resource/Apprentissage_par_renforcement + , http://fr.dbpedia.org/resource/Apprentissage_profond + http://dbpedia.org/ontology/wikiPageWikiLink
http://fr.dbpedia.org/tag/EnFrResource + http://www.w3.org/ns/oa#hasTarget
http://fr.wikipedia.org/wiki/Apprentissage_par_renforcement_profond + http://xmlns.com/foaf/0.1/primaryTopic
http://fr.dbpedia.org/resource/Apprentissage_par_renforcement_profond + owl:sameAs
 

 

Enter the name of the page to start semantic browsing from.