Browse Wiki & Semantic Web

Jump to: navigation, search
Http://dbpedia.org/resource/Deep reinforcement learning
  This page has no properties.
hide properties that link here 
  No properties link to this page.
 
http://dbpedia.org/resource/Deep_reinforcement_learning
http://dbpedia.org/ontology/abstract L'apprentissage par renforcement profond (L'apprentissage par renforcement profond (en anglais : deep reinforcement learning ou deep RL) est un sous-domaine de l'apprentissage automatique (en anglais : machine learning) qui combine l'apprentissage par renforcement et l'apprentissage profond (en anglais : deep learning). L'apprentissage par renforcement considère le problème d'un agent informatique qui apprend à prendre des décisions par essais et erreurs. L'apprentissage par renforcement profond intègre l'apprentissage profond dans la résolution, permettant aux agents de prendre des décisions à partir de données d'entrée non structurées sans intervention manuelle sur l'espace des états. Les algorithmes d'apprentissage par renforcement profond sont capables de prendre en compte de très grandes quantités de données (par exemple, chaque pixel affiché à l'écran dans un jeu vidéo) et de décider des actions à effectuer pour optimiser un objectif (par exemple, maximiser le score du jeu). L'apprentissage par renforcement profond a été utilisé pour diverses d'applications, y compris, de manière non exhaustive, la robotique , les jeux vidéo, le traitement du langage naturel, la vision par ordinateur, l'éducation, les transports, la finance et la santé.n, les transports, la finance et la santé. , Deep reinforcement learning (deep RL) is aDeep reinforcement learning (deep RL) is a subfield of machine learning that combines reinforcement learning (RL) and deep learning. RL considers the problem of a computational agent learning to make decisions by trial and error. Deep RL incorporates deep learning into the solution, allowing agents to make decisions from unstructured input data without manual engineering of the state space. Deep RL algorithms are able to take in very large inputs (e.g. every pixel rendered to the screen in a video game) and decide what actions to perform to optimize an objective (e.g. maximizing the game score). Deep reinforcement learning has been used for a diverse set of applications including but not limited to robotics, video games, natural language processing, computer vision, education, transportation, finance and healthcare.n, transportation, finance and healthcare. , 深度強化學習(英語:Deep reinforcement learning,簡稱 D深度強化學習(英語:Deep reinforcement learning,簡稱 Deep RL 或 DRL)是機器學習的一個子領域,結合了強化學習和深度學習。強化學習探討如何在嘗試錯誤的過程中讓智慧型代理人學習做更好的決策。深度強化學習採用了深度學習的方法,讓智慧型代理人可以直接基於非結構化資料來做決策,而不需要人為設計的狀態空間。深度強化學習演算法可以讀取非常大的輸入資料(像是電玩畫面上的每個像素),來判斷哪個動作可以達到最好的目標(像是最高的遊戲分數)。深度強化學習已經有了廣泛的應用,包括機器人學、電動遊戲、自然語言處理、電腦視覺、教育、交通運輸、金融、醫療衛生等等。包括機器人學、電動遊戲、自然語言處理、電腦視覺、教育、交通運輸、金融、醫療衛生等等。 , التعلم المعزز العميق (بالإنكليزية: Deep RLالتعلم المعزز العميق (بالإنكليزية: Deep RL) هو مجال فرعي من التعلم الآلي يجمع بين التعلم المعزز (آر إل) والتعلم العميق. يدرس التعليم المعزز مسألة تعلم الوكيل الحسابي لاتخاذ القرارات عن طريق التجربة والخطأ. يدمج التعليم المعزز العميق التعلم العميق في الحل، ما يسمح للوكلاء باتخاذ قرارات من بيانات مدخلة غير المهيكلة دون هندسة يدوية لفضاء الحالة. تعد خوارزميات التعليم المعزز العميقة قادرة على استيعاب مدخلات كبيرة جدًا (يعرض كل بكسل مثلًا على الشاشة في لعبة فيديو) وتحديد الإجراءات التي يجب تنفيذها لتحسين الهدف (تعظيم نتيجة اللعبة). استخدم التعلم المعزز العميق لمجموعة متنوعة من التطبيقات تشمل على سبيل المثال لا الحصر الروبوتات، وألعاب الفيديو، ومعالجة اللغة الطبيعية، والرؤية الحاسوبية، والتعليم، والنقل، والتمويل والرعاية الصحية.التعليم، والنقل، والتمويل والرعاية الصحية.
http://dbpedia.org/ontology/thumbnail http://commons.wikimedia.org/wiki/Special:FilePath/Neural_network_example.svg?width=300 +
http://dbpedia.org/ontology/wikiPageID 60105148
http://dbpedia.org/ontology/wikiPageLength 26786
http://dbpedia.org/ontology/wikiPageRevisionID 1123269873
http://dbpedia.org/ontology/wikiPageWikiLink http://dbpedia.org/resource/Health_care + , http://dbpedia.org/resource/MuZero + , http://dbpedia.org/resource/Deep_learning + , http://dbpedia.org/resource/State_space + , http://dbpedia.org/resource/Poker + , http://dbpedia.org/resource/Monte_Carlo_methods + , http://dbpedia.org/resource/Cross-entropy_method + , http://dbpedia.org/resource/AlphaZero + , http://dbpedia.org/resource/File:Neural_network_example.svg + , http://dbpedia.org/resource/TD-Gammon + , http://dbpedia.org/resource/AlphaGo + , http://dbpedia.org/resource/Loon_LLC + , http://dbpedia.org/resource/Boltzmann_distribution + , http://dbpedia.org/resource/Model_predictive_control + , http://dbpedia.org/resource/Dynamic_programming + , http://dbpedia.org/resource/Q-learning + , http://dbpedia.org/resource/Richard_S._Sutton + , http://dbpedia.org/resource/Pluribus_%28poker_bot%29 + , http://dbpedia.org/resource/Dota_2 + , http://dbpedia.org/resource/Autonomous_driving + , http://dbpedia.org/resource/Category:Artificial_intelligence + , http://dbpedia.org/resource/Atari + , http://dbpedia.org/resource/Category:Deep_learning + , http://dbpedia.org/resource/Category:Machine_learning_algorithms + , http://dbpedia.org/resource/Category:Reinforcement_learning + , http://dbpedia.org/resource/Shogi + , http://dbpedia.org/resource/Artificial_neural_network + , http://dbpedia.org/resource/Machine_learning + , http://dbpedia.org/resource/Representation_learning + , http://dbpedia.org/resource/Supervised_learning + , http://dbpedia.org/resource/Apprenticeship_learning + , http://dbpedia.org/resource/OpenAI_Five + , http://dbpedia.org/resource/Reinforcement_learning + , http://dbpedia.org/resource/File:Markov_diagram_v2.svg + , http://dbpedia.org/resource/Computer_vision + , http://dbpedia.org/resource/Robotics + , http://dbpedia.org/resource/Normal_distribution + , http://dbpedia.org/resource/Andrew_Barto + , http://dbpedia.org/resource/Markov_decision_process + , http://dbpedia.org/resource/Temporal_difference_learning + , http://dbpedia.org/resource/Chess + , http://dbpedia.org/resource/Feature_engineering + , http://dbpedia.org/resource/Carnegie_Mellon_University + , http://dbpedia.org/resource/Natural_language_processing + , http://dbpedia.org/resource/Dimitri_Bertsekas + , http://dbpedia.org/resource/John_Tsitsiklis + , http://dbpedia.org/resource/Go_%28game%29 + , http://dbpedia.org/resource/Texas_hold_%27em + , http://dbpedia.org/resource/Neural_network + , http://dbpedia.org/resource/Optimal_control + , http://dbpedia.org/resource/Backgammon + , http://dbpedia.org/resource/Convolutional_neural_network + , http://dbpedia.org/resource/Multi-agent_reinforcement_learning + , http://dbpedia.org/resource/DeepMind + , http://dbpedia.org/resource/Video_game +
http://dbpedia.org/property/wikiPageUsesTemplate http://dbpedia.org/resource/Template:Machine_learning + , http://dbpedia.org/resource/Template:Short_description +
http://purl.org/dc/terms/subject http://dbpedia.org/resource/Category:Machine_learning_algorithms + , http://dbpedia.org/resource/Category:Artificial_intelligence + , http://dbpedia.org/resource/Category:Reinforcement_learning + , http://dbpedia.org/resource/Category:Deep_learning +
http://www.w3.org/ns/prov#wasDerivedFrom http://en.wikipedia.org/wiki/Deep_reinforcement_learning?oldid=1123269873&ns=0 +
http://xmlns.com/foaf/0.1/depiction http://commons.wikimedia.org/wiki/Special:FilePath/Neural_network_example.svg + , http://commons.wikimedia.org/wiki/Special:FilePath/Markov_diagram_v2.svg +
http://xmlns.com/foaf/0.1/isPrimaryTopicOf http://en.wikipedia.org/wiki/Deep_reinforcement_learning +
owl:sameAs http://fa.dbpedia.org/resource/%DB%8C%D8%A7%D8%AF%DA%AF%DB%8C%D8%B1%DB%8C_%D8%AA%D9%82%D9%88%DB%8C%D8%AA%DB%8C_%D8%B9%D9%85%DB%8C%D9%82 + , http://fr.dbpedia.org/resource/Apprentissage_par_renforcement_profond + , http://ar.dbpedia.org/resource/%D8%AA%D8%B9%D9%84%D9%8A%D9%85_%D9%85%D8%B9%D8%B2%D8%B2_%D8%B9%D9%85%D9%8A%D9%82 + , https://global.dbpedia.org/id/5k1hg + , http://dbpedia.org/resource/Deep_reinforcement_learning + , http://zh.dbpedia.org/resource/%E6%B7%B1%E5%BA%A6%E5%BC%BA%E5%8C%96%E5%AD%A6%E4%B9%A0 + , http://www.wikidata.org/entity/Q65079156 +
rdfs:comment Deep reinforcement learning (deep RL) is aDeep reinforcement learning (deep RL) is a subfield of machine learning that combines reinforcement learning (RL) and deep learning. RL considers the problem of a computational agent learning to make decisions by trial and error. Deep RL incorporates deep learning into the solution, allowing agents to make decisions from unstructured input data without manual engineering of the state space. Deep RL algorithms are able to take in very large inputs (e.g. every pixel rendered to the screen in a video game) and decide what actions to perform to optimize an objective (e.g. maximizing the game score). Deep reinforcement learning has been used for a diverse set of applications including but not limited to robotics, video games, natural language processing, computer vision, education, transportati, computer vision, education, transportati , L'apprentissage par renforcement profond (L'apprentissage par renforcement profond (en anglais : deep reinforcement learning ou deep RL) est un sous-domaine de l'apprentissage automatique (en anglais : machine learning) qui combine l'apprentissage par renforcement et l'apprentissage profond (en anglais : deep learning). L'apprentissage par renforcement considère le problème d'un agent informatique qui apprend à prendre des décisions par essais et erreurs. L'apprentissage par renforcement profond intègre l'apprentissage profond dans la résolution, permettant aux agents de prendre des décisions à partir de données d'entrée non structurées sans intervention manuelle sur l'espace des états. Les algorithmes d'apprentissage par renforcement profond sont capables de prendre en compte de très grandes quantités de données (par exemple, chades quantités de données (par exemple, cha , 深度強化學習(英語:Deep reinforcement learning,簡稱 D深度強化學習(英語:Deep reinforcement learning,簡稱 Deep RL 或 DRL)是機器學習的一個子領域,結合了強化學習和深度學習。強化學習探討如何在嘗試錯誤的過程中讓智慧型代理人學習做更好的決策。深度強化學習採用了深度學習的方法,讓智慧型代理人可以直接基於非結構化資料來做決策,而不需要人為設計的狀態空間。深度強化學習演算法可以讀取非常大的輸入資料(像是電玩畫面上的每個像素),來判斷哪個動作可以達到最好的目標(像是最高的遊戲分數)。深度強化學習已經有了廣泛的應用,包括機器人學、電動遊戲、自然語言處理、電腦視覺、教育、交通運輸、金融、醫療衛生等等。包括機器人學、電動遊戲、自然語言處理、電腦視覺、教育、交通運輸、金融、醫療衛生等等。 , التعلم المعزز العميق (بالإنكليزية: Deep RLالتعلم المعزز العميق (بالإنكليزية: Deep RL) هو مجال فرعي من التعلم الآلي يجمع بين التعلم المعزز (آر إل) والتعلم العميق. يدرس التعليم المعزز مسألة تعلم الوكيل الحسابي لاتخاذ القرارات عن طريق التجربة والخطأ. يدمج التعليم المعزز العميق التعلم العميق في الحل، ما يسمح للوكلاء باتخاذ قرارات من بيانات مدخلة غير المهيكلة دون هندسة يدوية لفضاء الحالة. تعد خوارزميات التعليم المعزز العميقة قادرة على استيعاب مدخلات كبيرة جدًا (يعرض كل بكسل مثلًا على الشاشة في لعبة فيديو) وتحديد الإجراءات التي يجب تنفيذها لتحسين الهدف (تعظيم نتيجة اللعبة). استخدم التعلم المعزز العميق لمجموعة متنوعة من التطبيقات تشمل على سبيل المثال لا الحصر الروبوتات، وألعاب الفيديو، ومعالجة اللغة الطبيعية، والرؤية الحاسوبية، والتعليم، والنقل، والتمويل والرعاية الصحية.التعليم، والنقل، والتمويل والرعاية الصحية.
rdfs:label Apprentissage par renforcement profond , Deep reinforcement learning , تعليم معزز عميق , 深度强化学习
hide properties that link here 
http://dbpedia.org/resource/Pieter_Abbeel + http://dbpedia.org/ontology/academicDiscipline
http://dbpedia.org/resource/Chelsea_Finn + http://dbpedia.org/ontology/knownFor
http://dbpedia.org/resource/Goal-conditioned_reinforcement_learning + http://dbpedia.org/ontology/wikiPageRedirects
http://dbpedia.org/resource/DARPA_AlphaDogfight + , http://dbpedia.org/resource/Deep_learning + , http://dbpedia.org/resource/Computer_chess + , http://dbpedia.org/resource/Keith_W._Ross + , http://dbpedia.org/resource/History_of_chess_engines + , http://dbpedia.org/resource/General_game_playing + , http://dbpedia.org/resource/Reinforcement_learning + , http://dbpedia.org/resource/Chelsea_Finn + , http://dbpedia.org/resource/Pieter_Abbeel + , http://dbpedia.org/resource/Synthetic_media + , http://dbpedia.org/resource/Microgrid + , http://dbpedia.org/resource/Multi-agent_reinforcement_learning + , http://dbpedia.org/resource/Goal-conditioned_reinforcement_learning + , http://dbpedia.org/resource/End-to-end_reinforcement_learning + http://dbpedia.org/ontology/wikiPageWikiLink
http://dbpedia.org/resource/Pieter_Abbeel + http://dbpedia.org/property/fields
http://dbpedia.org/resource/Chelsea_Finn + http://dbpedia.org/property/knownFor
http://en.wikipedia.org/wiki/Deep_reinforcement_learning + http://xmlns.com/foaf/0.1/primaryTopic
http://dbpedia.org/resource/Deep_reinforcement_learning + owl:sameAs
 

 

Enter the name of the page to start semantic browsing from.