Aprendizaje por refuerzo: Dominando la toma de decisiones inteligente para máquinas autónomas

En el campo de la robótica, que evoluciona rápidamente, el aprendizaje por refuerzo se erige como uno de los métodos más prometedores para construir sistemas autónomos. Este libro, Reinforcement Learning, ofrece una exploración en profundidad de esta poderosa técnica, guiando a los lectores a través de sus principios fundamentales hasta sus últimos avances. Perfecto para profesionales, estudiantes de posgrado y entusiastas por igual, este libro ofrece un enfoque detallado pero accesible para comprender el aprendizaje por refuerzo en el contexto de la robótica


Aprendizaje por refuerzo-presenta el concepto central del aprendizaje por refuerzo, enfatizando su papel en los sistemas autónomos


Proceso de decisión de Markov-explica el marco matemático para la toma de decisiones en condiciones de incertidumbre, una base clave para el aprendizaje por refuerzo


Aprendizaje por diferencia temporal-explora métodos para aprender de la experiencia sin necesidad de un modelo del entorno


Ecuación de Bellman-analiza la relación recursiva crítica que subyace a muchos algoritmos de aprendizaje por refuerzo


Qlearning-se centra en un algoritmo de aprendizaje por refuerzo fuera de política que aprende acciones óptimas sin un modelo del entorno


Multiarmed bandit-cubre un problema de aprendizaje de refuerzo más simple que modela la toma de decisiones en entornos inciertos


Proceso de decisión de Markov parcialmente observable-amplía los procesos de decisión de Markov tradicionales al incorporar estados ocultos


Índice de Gittins-presenta una estrategia para equilibrar la exploración y la explotación en problemas de multiarmed bandit


Estado-acción-recompensa-estado-acción-profundiza en los patrones temporales en el aprendizaje de refuerzo que informan las estrategias de toma de decisiones


Función protovalor-explora métodos para aproximar funciones de valor, lo que ayuda a la eficiencia del aprendizaje


Construcción automática de funciones base-se centra en métodos automáticos para construir características para mejorar la eficiencia del aprendizaje


Teoría de juegos de campo medio-analiza un marco para modelar interacciones en sistemas multiagente a gran escala


Búsqueda de rutas multiagente-presenta algoritmos para coordinar múltiples agentes para llegar a sus destinos de manera eficiente


Modelfree (reinforcement learning)-analiza métodos que no dependen de un modelo del entorno para aprender


Deep reinforced learning-combina el aprendizaje profundo y el aprendizaje de refuerzo para manejar entornos complejos y de alta dimensión


Multiagent reinforced learning-se centra en estrategias para aprender en entornos con múltiples agentes que interactúan


Selfplay-explora el concepto de los agentes que aprenden a través de la competencia consigo mismos, un componente crítico de las estrategias de aprendizaje avanzadas


Optimización de políticas proximales-presenta un algoritmo para optimizar políticas en el aprendizaje de refuerzo con estabilidad y rendimiento mejorados


Dilema de exploración-explotación-analiza el desafío fundamental de equilibrar la exploración de nuevas estrategias con la explotación de las conocidas


Aprendizaje de refuerzo a partir de la retroalimentación humana-examina métodos para mejorar el aprendizaje de refuerzo utilizando la participación humana


Aprendizaje por imitación-se centra en técnicas en las que los agentes aprenden imitando las acciones de expertos humanos


El aprendizaje por refuerzo no es solo una guía técnica, sino un recurso esencial para comprender cómo los sistemas autónomos pueden adaptarse y tomar decisiones en una amplia variedad de entornos.

1146753065
Aprendizaje por refuerzo: Dominando la toma de decisiones inteligente para máquinas autónomas

En el campo de la robótica, que evoluciona rápidamente, el aprendizaje por refuerzo se erige como uno de los métodos más prometedores para construir sistemas autónomos. Este libro, Reinforcement Learning, ofrece una exploración en profundidad de esta poderosa técnica, guiando a los lectores a través de sus principios fundamentales hasta sus últimos avances. Perfecto para profesionales, estudiantes de posgrado y entusiastas por igual, este libro ofrece un enfoque detallado pero accesible para comprender el aprendizaje por refuerzo en el contexto de la robótica


Aprendizaje por refuerzo-presenta el concepto central del aprendizaje por refuerzo, enfatizando su papel en los sistemas autónomos


Proceso de decisión de Markov-explica el marco matemático para la toma de decisiones en condiciones de incertidumbre, una base clave para el aprendizaje por refuerzo


Aprendizaje por diferencia temporal-explora métodos para aprender de la experiencia sin necesidad de un modelo del entorno


Ecuación de Bellman-analiza la relación recursiva crítica que subyace a muchos algoritmos de aprendizaje por refuerzo


Qlearning-se centra en un algoritmo de aprendizaje por refuerzo fuera de política que aprende acciones óptimas sin un modelo del entorno


Multiarmed bandit-cubre un problema de aprendizaje de refuerzo más simple que modela la toma de decisiones en entornos inciertos


Proceso de decisión de Markov parcialmente observable-amplía los procesos de decisión de Markov tradicionales al incorporar estados ocultos


Índice de Gittins-presenta una estrategia para equilibrar la exploración y la explotación en problemas de multiarmed bandit


Estado-acción-recompensa-estado-acción-profundiza en los patrones temporales en el aprendizaje de refuerzo que informan las estrategias de toma de decisiones


Función protovalor-explora métodos para aproximar funciones de valor, lo que ayuda a la eficiencia del aprendizaje


Construcción automática de funciones base-se centra en métodos automáticos para construir características para mejorar la eficiencia del aprendizaje


Teoría de juegos de campo medio-analiza un marco para modelar interacciones en sistemas multiagente a gran escala


Búsqueda de rutas multiagente-presenta algoritmos para coordinar múltiples agentes para llegar a sus destinos de manera eficiente


Modelfree (reinforcement learning)-analiza métodos que no dependen de un modelo del entorno para aprender


Deep reinforced learning-combina el aprendizaje profundo y el aprendizaje de refuerzo para manejar entornos complejos y de alta dimensión


Multiagent reinforced learning-se centra en estrategias para aprender en entornos con múltiples agentes que interactúan


Selfplay-explora el concepto de los agentes que aprenden a través de la competencia consigo mismos, un componente crítico de las estrategias de aprendizaje avanzadas


Optimización de políticas proximales-presenta un algoritmo para optimizar políticas en el aprendizaje de refuerzo con estabilidad y rendimiento mejorados


Dilema de exploración-explotación-analiza el desafío fundamental de equilibrar la exploración de nuevas estrategias con la explotación de las conocidas


Aprendizaje de refuerzo a partir de la retroalimentación humana-examina métodos para mejorar el aprendizaje de refuerzo utilizando la participación humana


Aprendizaje por imitación-se centra en técnicas en las que los agentes aprenden imitando las acciones de expertos humanos


El aprendizaje por refuerzo no es solo una guía técnica, sino un recurso esencial para comprender cómo los sistemas autónomos pueden adaptarse y tomar decisiones en una amplia variedad de entornos.

3.99 In Stock
Aprendizaje por refuerzo: Dominando la toma de decisiones inteligente para máquinas autónomas

Aprendizaje por refuerzo: Dominando la toma de decisiones inteligente para máquinas autónomas

Aprendizaje por refuerzo: Dominando la toma de decisiones inteligente para máquinas autónomas

Aprendizaje por refuerzo: Dominando la toma de decisiones inteligente para máquinas autónomas

eBook

$3.99 

Available on Compatible NOOK devices, the free NOOK App and in My Digital Library.
WANT A NOOK?  Explore Now

Related collections and offers

LEND ME® See Details

Overview

En el campo de la robótica, que evoluciona rápidamente, el aprendizaje por refuerzo se erige como uno de los métodos más prometedores para construir sistemas autónomos. Este libro, Reinforcement Learning, ofrece una exploración en profundidad de esta poderosa técnica, guiando a los lectores a través de sus principios fundamentales hasta sus últimos avances. Perfecto para profesionales, estudiantes de posgrado y entusiastas por igual, este libro ofrece un enfoque detallado pero accesible para comprender el aprendizaje por refuerzo en el contexto de la robótica


Aprendizaje por refuerzo-presenta el concepto central del aprendizaje por refuerzo, enfatizando su papel en los sistemas autónomos


Proceso de decisión de Markov-explica el marco matemático para la toma de decisiones en condiciones de incertidumbre, una base clave para el aprendizaje por refuerzo


Aprendizaje por diferencia temporal-explora métodos para aprender de la experiencia sin necesidad de un modelo del entorno


Ecuación de Bellman-analiza la relación recursiva crítica que subyace a muchos algoritmos de aprendizaje por refuerzo


Qlearning-se centra en un algoritmo de aprendizaje por refuerzo fuera de política que aprende acciones óptimas sin un modelo del entorno


Multiarmed bandit-cubre un problema de aprendizaje de refuerzo más simple que modela la toma de decisiones en entornos inciertos


Proceso de decisión de Markov parcialmente observable-amplía los procesos de decisión de Markov tradicionales al incorporar estados ocultos


Índice de Gittins-presenta una estrategia para equilibrar la exploración y la explotación en problemas de multiarmed bandit


Estado-acción-recompensa-estado-acción-profundiza en los patrones temporales en el aprendizaje de refuerzo que informan las estrategias de toma de decisiones


Función protovalor-explora métodos para aproximar funciones de valor, lo que ayuda a la eficiencia del aprendizaje


Construcción automática de funciones base-se centra en métodos automáticos para construir características para mejorar la eficiencia del aprendizaje


Teoría de juegos de campo medio-analiza un marco para modelar interacciones en sistemas multiagente a gran escala


Búsqueda de rutas multiagente-presenta algoritmos para coordinar múltiples agentes para llegar a sus destinos de manera eficiente


Modelfree (reinforcement learning)-analiza métodos que no dependen de un modelo del entorno para aprender


Deep reinforced learning-combina el aprendizaje profundo y el aprendizaje de refuerzo para manejar entornos complejos y de alta dimensión


Multiagent reinforced learning-se centra en estrategias para aprender en entornos con múltiples agentes que interactúan


Selfplay-explora el concepto de los agentes que aprenden a través de la competencia consigo mismos, un componente crítico de las estrategias de aprendizaje avanzadas


Optimización de políticas proximales-presenta un algoritmo para optimizar políticas en el aprendizaje de refuerzo con estabilidad y rendimiento mejorados


Dilema de exploración-explotación-analiza el desafío fundamental de equilibrar la exploración de nuevas estrategias con la explotación de las conocidas


Aprendizaje de refuerzo a partir de la retroalimentación humana-examina métodos para mejorar el aprendizaje de refuerzo utilizando la participación humana


Aprendizaje por imitación-se centra en técnicas en las que los agentes aprenden imitando las acciones de expertos humanos


El aprendizaje por refuerzo no es solo una guía técnica, sino un recurso esencial para comprender cómo los sistemas autónomos pueden adaptarse y tomar decisiones en una amplia variedad de entornos.


Product Details

BN ID: 2940180974242
Publisher: Mil Millones De Conocimientos [Spanish]
Publication date: 12/24/2024
Series: Ciencia Robótica [Spanish] , #50
Sold by: PUBLISHDRIVE KFT
Format: eBook
Pages: 234
File size: 2 MB
Language: Spanish
From the B&N Reads Blog

Customer Reviews