OpenAI创始研究员Andrej Karpathy,离职了——又一次。
Andrej Karpathy本人在X上发布了这一消息:
我昨天离开了OpenAI。
首先,什么都没有“发生”,这不是任何特定事件、问题或戏剧的结果(但请继续讲阴谋论,因为它们非常有趣)。
实际上,在OpenAI度过的这一年真的很棒——团队非常强大,员工很棒,路线图也非常令人兴奋,我认为我们都有很多值得期待的东西。
我目前的计划是着手我的个人项目,看看会发生什么。
Andrej Karpathy虽然没有具体透露接下来的计划,不过在这条消息之下,他评论道:
我前两天就开始下一篇章了。
不过作为前特斯拉的AI主管,有网友开启了召唤模式:
回特斯拉!
至于具体的“下一篇章”,LeCun和众人的猜测纷纷指向大语言模型的系统:
如此猜测也并非毫无根据,因为Andrej Karpathy此前就提出过LLM OS相关内容:
二次出走OpenAI
其实Andrej Karpathy离职OpenAI并非是第一次。
早在他毕业于斯坦福(李飞飞高徒)之际,就在2016年作为研究员加入了OpenAI,并且在那里工作了1年零6个月。
后来Andrej Karpathy被马斯克挖走,入职特斯拉,并且一路做到了AI主管,直接向马斯克汇报。
Andrej Karpathy回归OpenAI是在2023年的2月,当时Sam Altman也发推文表示欢迎:
Welcome Back!
而在此之前近半年的空档期内,Andrej Karpathy则是在家尝试录网课、做开源项目,依然扎根在AI领域。
关于Andrej Karpathy
Andrej Karpathy1986年出生于捷克斯洛伐克。
15岁跟随家人移民加拿大多伦多——正是深度学习教父Jeffry Hinton远避到多伦多大学的时期。
Andrej 也幸运进入了多伦多大学,2009年本科毕业,同时拿下了计算机和物理学学位。
其后进入英属哥伦比亚大学的计算机科学专业,2011年拿到硕士学位。
在之后前往斯坦福读博,主攻AI视觉,师从李飞飞教授,2016年获得博士学位。
并且就在斯坦福读博期间,Andrej 就已经出名了。他亲自设计并主讲了一门名为「CS231n:用于视觉识别的卷积神经网络」的课程,成为斯坦福授课深度学习的讲师。
他在读博期间,发表的多篇论文都是CV领域的高引文章,还在Google、DeepMind两家公司实习过。
毕业后则去到了刚创办不久的AI研究机构OpenAI,主要研究计算机视觉。
也就在OpenAI,Andrej的天赋被马斯克看中。作为OpenAI的发起人之一,马斯克在接触到Andrej 后,他就知道这小哥展现的学习能力,绝不会止于计算机视觉领域。
于是“内部挖角”,把Andrej 从OpenAI带到了特斯拉——这也是马斯克后来被OpenAI踢出局的矛盾点之一。
据说马斯克曾放话,很多人把Andrej 当做优秀AI视觉科学家,但我知道,他会是全世界最顶级的AI领袖。
意思就是放在OpenAI或其他任何一个地方,都会埋没了他。
33岁进入特斯拉后,Andrej 先任特斯拉的AI和AutoPilot视觉总监,负责领导自动驾驶神经网络团队。
其后随着大神Jim Keller离职,Andrej 接管了整个AI团队。
那时Jim Keller从特斯拉AutoPilot副总裁岗位上出走,外界都认为没有人再能替代这样的大神。
但马斯克认为,最强之人已在阵中。
他把之前Jim Keller底下的2位青年才俊提拔到一号位,Pete Bannon负责硬件,Andrej Karpathy负责软件。
而就在这两位青年才俊领导下,特斯拉FSD横空出世,自动驾驶能力持续进化。
Andrej 小哥也确实如马斯克所言,实现了顶级AI视觉科学家向AI大牛的蜕变之路。
Andrej 有多受信任,在特斯拉每年的技术开放日上,Andrej 往往是最核心的演讲人。
而且马斯克还不断把最重要的业务给了他。
比如AutoPilot、FSD,以及人形机器人。
另外按照Andrej 的披露,特斯拉的超算Dojo部署,也会由他来负责。
只是没想到,马斯克如此信任的左膀右臂,就这样没有征兆的离职了。
虽然特斯拉之前有高管休长假后不再回来的先例,但Andrej 今年4月休假时,信誓旦旦会在调整之后回归岗位。
有意思的是,就在Andrej 休假后不久,马斯克就对外表示特斯拉需要裁员应对经济下行,以及严查考勤……一周打卡少于40小时的都要专门报备说明。
所以当时就有网友抖机灵:
可别忘了有个叫Andrej 的有两月没打卡了。
不过Andrej在离职之际,马斯克也是罕见的高管的离职送上了祝福。
One More Thing
在回归OpenAI的一年里,似乎Andrej Karpathy的存在感并非很强。
很多人对他上次的印象,或许就是在去年年底发布的关于大语言模型的科普视频。
时长1小时,全部为“非技术介绍”,涵盖模型推理、训练、微调和新兴大模型操作系统以及安全挑战。
视频上线油管仅1天,就已经有20万播放量,最为经典的就是那句“大模型本质就是两个文件”。
因此很多网友鉴于Andrej Karpathy此前离职在家录网课的经验,希望他能出更多视频。
并且即使在OpenAI上演宫斗大戏期间,他也并没有像其他成员那般在X上发表旗帜鲜明的站队立场,仅仅是简单发了个辐射警告标志:
加上此前发表过自己感兴趣的LLM OS,似乎离开OpenAI选择自己的项目只是时间的问题。
至于其本人接下来的计划,目前虽然细节无从得知,但OpenAI的一位发言人在一份声明中表示:
追求个人项目。
至于是否是众人猜测的LLM OS,是值得关注一波了。
— 完 —