Usman Anwar - Google Scholar

Založit si vlastní profil

Citace

	Všechny	Od 2019
Citace	268	268
h-index	5	5
i10-index	4	4

0

140

70

35

105

202020212022202320242 6 20 105 134

Usman Anwar

Usman Anwar

University of Cambridge

E-mailová adresa ověřena na: cam.ac.uk - Domovská stránka

Reinforcement Learning


Název Seřadit podle citací Seřadit podle roku Seřadit podle názvu	Citace Citace	Rok
Open problems and fundamental limitations of reinforcement learning from human feedback S Casper, X Davies, C Shi, TK Gilbert, J Scheurer, J Rando, R Freedman, ... arXiv preprint arXiv:2307.15217, 2023	171	2023
Inverse Constrained Reinforcement Learning S Malik, U Anwar, A Aghasi, A Ahmed International Conference on Machine Learning, 7390-7399, 2021	47*	2021
Reward model ensembles help mitigate overoptimization T Coste, U Anwar, R Kirk, D Krueger arXiv preprint arXiv:2310.02743, 2023	21	2023
Bayesian methods for constraint inference in reinforcement learning D Papadimitriou, U Anwar, DS Brown Transactions on Machine Learning Research, 2022	15*	2022
Learning to solve differential equations across initial conditions S Malik, U Anwar, A Ahmed, A Aghasi arXiv preprint arXiv:2003.12159, 2020	9	2020
Foundational challenges in assuring alignment and safety of large language models U Anwar, A Saparov, J Rando, D Paleka, M Turpin, P Hase, ES Lubana, ... arXiv preprint arXiv:2404.09932, 2024	4	2024
Domain Generalization for Robust Model-Based Offline Reinforcement Learning A Clark, SA Siddiqui, R Kirk, U Anwar, S Chung, D Krueger arXiv preprint arXiv:2211.14827, 2022	1	2022

Systém momentálně nemůže danou operaci provést. Zkuste to znovu později.

Články 1–7