Načítání...
Systém momentálně nemůže danou operaci provést. Zkuste to znovu později.
Citace za rok
Duplicitní citace
Následující články byly sloučeny ve službě Scholar. Do
celkového počtu citací
se započítává pouze první článek.
Sloučené citace
Počet citovaných článků zahrnuje citace následujících článků ve službě Scholar. Články označené hvězdičkou (
*
) a články v profilu se mohou lišit.
Přidat spoluautory
Spoluautoři
Sledovat
Nové články od tohoto autora
Nové citace tohoto autora
Nové články související s výzkumem tohoto autora
E-mailová adresa k příjmu aktualit
Dokončit
Můj profil
Moje knihovna
Metriky
Upozornění
Nastavení
Přihlásit se
Přihlásit se
Založit si vlastní profil
Citace
Všechny
Od 2019
Citace
18
18
h-index
1
1
i10-index
1
1
0
16
8
2023
2024
2
16
Veřejný přístup
Zobrazit všechny
Zobrazit všechny
2 články
0 článků
dostupné
nedostupné
Vychází ze zplnomocnění pro financování
Spoluautoři
Eyke Hüllermeier
Professor of Computer Science, Paderborn University
E-mailová adresa ověřena na: upb.de
Viktor Bengs
LMU Munich
E-mailová adresa ověřena na: lmu.de
Sledovat
Timo Kaufmann
PhD candidate at
LMU Munich
E-mailová adresa ověřena na: lmu.de -
Domovská stránka
Reinforcement Learning
Preference Learning
Human Feedback
RLHF
Články
Citace
Veřejný přístup
Spoluautoři
Název
Seřadit
Seřadit podle citací
Seřadit podle roku
Seřadit podle názvu
Citace
Citace
Rok
A Survey of Reinforcement Learning from Human Feedback
T Kaufmann, P Weng, V Bengs, E Hüllermeier
arXiv preprint arXiv:2312.14925
, 2023
17
2023
On the Challenges and Practices of Reinforcement Learning from Real Human Feedback
T Kaufmann, S Ball, J Beck, E Hüllermeier, F Kreuter
ECML PKDD 2023 Workshop Towards Hybrid Human-Machine Learning and Decision …
, 2023
1
2023
Reinforcement Learning from Human Feedback for Cyber-Physical Systems: On the Potential of Self-Supervised Pretraining
T Kaufmann, V Bengs, E Hüllermeier
2023
Systém momentálně nemůže danou operaci provést. Zkuste to znovu později.
Články 1–3
Zobrazit další
Ochrana soukromí
Smluvní podmínky
Nápověda
O službě Scholar
Vyhledat v nápovědě