Szymon Sidor

Cited by

	All	Since 2019
Citations	9571	8930
h-index	17	16
i10-index	17	16

1800

900

450

1350

2017201820192020202120222023202488 506 1015 1487 1672 1696 1784 1262

Szymon Sidor

OpenAI

Verified email at openai.com - Homepage

Artificial Intelligence Machine Learning


Title Sort by citations Sort by year Sort by title	Cited by Cited by	Year
Dota 2 with large scale deep reinforcement learning C Berner, G Brockman, B Chan, V Cheung, P Dębiak, C Dennison, ... arXiv preprint arXiv:1912.06680, 2019	1684	2019
Evolution strategies as a scalable alternative to reinforcement learning T Salimans, J Ho, X Chen, S Sidor, I Sutskever arXiv preprint arXiv:1703.03864, 2017	1660	2017
Learning dexterous in-hand manipulation OAIM Andrychowicz, B Baker, M Chociej, R Jozefowicz, B McGrew, ... The International Journal of Robotics Research 39 (1), 3-20, 2020	1601	2020
Openai baselines P Dhariwal, C Hesse, O Klimov, A Nichol, M Plappert, A Radford, ...	996	2017
Stable baselines A Hill, A Raffin, M Ernestus, A Gleave, A Kanervisto, R Traore, P Dhariwal, ...	863	2018
Gpt-4 technical report J Achiam, S Adler, S Agarwal, L Ahmad, I Akkaya, FL Aleman, D Almeida, ... arXiv preprint arXiv:2303.08774, 2023	804	2023
Parameter space noise for exploration M Plappert, R Houthooft, P Dhariwal, S Sidor, RY Chen, X Chen, T Asfour, ... arXiv preprint arXiv:1706.01905, 2017	704	2017
Emergent complexity via multi-agent competition T Bansal, J Pachocki, S Sidor, I Sutskever, I Mordatch arXiv preprint arXiv:1710.03748, 2017	453	2017
Schema networks: Zero-shot transfer with a generative causal model of intuitive physics K Kansky, T Silver, DA Mély, M Eldawy, M Lázaro-Gredilla, X Lou, ... International conference on machine learning, 1809-1818, 2017	271	2017
Ucb exploration via q-ensembles RY Chen, S Sidor, P Abbeel, J Schulman arXiv preprint arXiv:1706.01502, 2017	126	2017
Dota 2 with large scale deep reinforcement learning CB OpenAI, G Brockman, B Chan, V Cheung, P Debiak, C Dennison, ... arXiv preprint arXiv:1912.06680 2, 2019	104	2019
Tensor programs v: Tuning large neural networks via zero-shot hyperparameter transfer G Yang, EJ Hu, I Babuschkin, S Sidor, X Liu, D Farhi, N Ryder, J Pachocki, ... arXiv preprint arXiv:2203.03466, 2022	69	2022
Tuning large neural networks via zero-shot hyperparameter transfer G Yang, E Hu, I Babuschkin, S Sidor, X Liu, D Farhi, N Ryder, J Pachocki, ... Advances in Neural Information Processing Systems 34, 17084-17097, 2021	60	2021
Evolution strategies as a scalable alternative to reinforcement learning. arXiv 2017 T Salimans, J Ho, X Chen, S Sidor, I Sutskever arXiv preprint arXiv:1703.03864, 2017	60	2017
Openai baselines (2017) P Dhariwal, C Hesse, O Klimov, A Nichol, M Plappert, A Radford, ... URL https://github. com/openai/baselines, 2016	59	2016
UCB and infogain exploration via q-ensembles RY Chen, J Schulman, P Abbeel, S Sidor arXiv preprint arXiv:1706.01502 9, 2017	29	2017
OpenAI baselines C Hesse, M Plappert, A Radford, J Schulman, S Sidor, Y Wu	19	2017
Reinforcement learning with natural language signals S Sidor Massachusetts Institute of Technology, 2016	6	2016
Time resource networks S Sidor, P Yu, C Fang, B Williams arXiv preprint arXiv:1602.03203, 2016	2	2016
Occam's gates J Raiman, S Sidor arXiv preprint arXiv:1506.08251, 2015	1	2015

The system can't perform the operation now. Try again later.

Articles 1–20

Citations per year

Duplicate citations

Merged citations

Add co-authorsCo-authors

Follow

Cited by