Christopher Olah

Citace

	Všechny	Od 2019
Citace	77758	65506
h-index	40	39
i10-index	57	54

13000

6500

3250

9750

201620172018201920202021202220232024834 3320 7499 10179 11486 12358 11611 12358 7494

Spoluautoři

Dario AmodeiCEO and Co-Founder at AnthropicE-mailová adresa ověřena na: anthropic.com
Jacob SteinhardtStanford UniversityE-mailová adresa ověřena na: cs.stanford.edu
John SchulmanResearch Scientist, OpenAIE-mailová adresa ověřena na: openai.com
Vincent DumoulinResearch ScientistE-mailová adresa ověřena na: google.com
Quoc V. LeResearch Scientist, GoogleE-mailová adresa ověřena na: stanford.edu
Andrew DaiGoogle DeepMindE-mailová adresa ověřena na: google.com
Greg CorradoGoogle ResearchE-mailová adresa ověřena na: google.com

Sledovat

Christopher Olah

Anthropic

E-mailová adresa ověřena na: google.com - Domovská stránka

Machine Learning Deep Learning


Název Seřadit podle citací Seřadit podle roku Seřadit podle názvu	Citace Citace	Rok
TensorFlow: Large-scale machine learning on heterogeneous systems M Abadi, A Agarwal, P Barham, E Brevdo, Z Chen, C Citro, GS Corrado, ...	55730*	2015
Conditional image synthesis with auxiliary classifier gans A Odena, C Olah, J Shlens International conference on machine learning, 2642-2651, 2017	4060	2017
Understanding LSTM Networks C Olah colah.github.io, 2015	2993*	2015
Concrete problems in AI safety D Amodei, C Olah, J Steinhardt, P Christiano, J Schulman, D Mané arXiv preprint arXiv:1606.06565, 2016	2778	2016
Deconvolution and Checkerboard Artifacts A Odena, V Dumoulin, C Olah Distill, 2016	1842	2016
Feature visualization C Olah, A Mordvintsev, L Schubert Distill 2 (11), e7, 2017	1384*	2017
Inceptionism: Going deeper into neural networks A Mordvintsev, C Olah, M Tyka Google research blog 20 (14), 5, 2015	1019*	2015
Training a helpful and harmless assistant with reinforcement learning from human feedback Y Bai, A Jones, K Ndousse, A Askell, A Chen, N DasSarma, D Drain, ... arXiv preprint arXiv:2204.05862, 2022	973	2022
The building blocks of interpretability C Olah, A Satyanarayan, I Johnson, S Carter, L Schubert, K Ye, ... Distill 3 (3), e10, 2018	842*	2018
Constitutional ai: Harmlessness from ai feedback Y Bai, S Kadavath, S Kundu, A Askell, J Kernion, A Jones, A Chen, ... arXiv preprint arXiv:2212.08073, 2022	778	2022
Document embedding with paragraph vectors AM Dai, C Olah, QV Le arXiv preprint arXiv:1507.07998, 2015	572	2015
A mathematical framework for transformer circuits N Elhage, N Nanda, C Olsson, T Henighan, N Joseph, B Mann, A Askell, ... Transformer Circuits Thread 1 (1), 12, 2021	372*	2021
In-context learning and induction heads C Olsson, N Elhage, N Nanda, N Joseph, N DasSarma, T Henighan, ... arXiv preprint arXiv:2209.11895, 2022	352*	2022
Multimodal neurons in artificial neural networks G Goh, N Cammarata, C Voss, S Carter, M Petrov, L Schubert, A Radford, ... Distill 6 (3), e30, 2021	311	2021
Zoom in: An introduction to circuits C Olah, N Cammarata, L Schubert, G Goh, M Petrov, S Carter Distill 5 (3), e00024. 001, 2020	303	2020
Red teaming language models to reduce harms: Methods, scaling behaviors, and lessons learned D Ganguli, L Lovitt, J Kernion, A Askell, Y Bai, S Kadavath, B Mann, ... arXiv preprint arXiv:2209.07858, 2022	300	2022
A general language assistant as a laboratory for alignment A Askell, Y Bai, A Chen, D Drain, D Ganguli, T Henighan, A Jones, ... arXiv preprint arXiv:2112.00861, 2021	283	2021
Activation atlas S Carter, Z Armstrong, L Schubert, I Johnson, C Olah Distill 4 (3), e15, 2019	256*	2019
Predictability and surprise in large generative models D Ganguli, D Hernandez, L Lovitt, A Askell, Y Bai, A Chen, T Conerly, ... Proceedings of the 2022 ACM Conference on Fairness, Accountability, and …, 2022	221	2022
Toy models of superposition N Elhage, T Hume, C Olsson, N Schiefer, T Henighan, S Kravec, ... arXiv preprint arXiv:2209.10652, 2022	182	2022

Systém momentálně nemůže danou operaci provést. Zkuste to znovu později.

Články 1–20

Citace za rok

Duplicitní citace

Sloučené citace

Přidat spoluautorySpoluautoři

Sledovat

Citace

Spoluautoři