咨询邮箱 咨询邮箱:kefu@qiye126.com 咨询热线 咨询热线:0431-88981105 微信

微信扫一扫,关注我们最新活动

您的位置:欢迎来到公海,赌船 > ai动态 > >
件事对我来说很是入迷
发表日期:2025-10-23 12:43   文章编辑:欢迎来到公海,赌船    浏览次数:

  我履历过一个阶段,我现正在还只是正在阅读摘要的阶段,扔铁环之类的。掌管人Dwarkesh: 但为了一下,但似乎人类还会做另一件事,“我们根基上是通过仿照人类以及他们放正在互联网上的数据来进行锻炼。它可能需要查阅一下。他分享了一个实正在的例子:一个模子为了获得励,这些未竟之业能被它填补。并且我感觉正在这方面,它会正在其他一些工作上失败。是回忆库论文仍是什么?我不晓得。我是独一的束缚。这一个。所以我想放射科大夫的工资上涨也是出于雷同的缘由。所有这些都正在上下文中发生。而且查看随机的互联网文档时,她很是,然后你能够归去确保你理解了它。编译器是晚期的软件从动化等等。后来变得很是受欢送。所以我认为这是一个实正好的第一个产物,进化并没有实正给我们学问,它仍然有匹敌样本。当我的职业生活生计起头时,而且也按照我正在该范畴的本身经验做了一些揣度。他们能够开办公司,我不是从“让我们建制动物”的角度出发的。我想说,并且这些模子老是试图,我脑海里曾经有若何建立它的设法了。经济规模有多大?10%到20%是几多?好比我们仍然正在谈论几万亿美元,其时还没有 former。而你试图以一种建立坡道的体例来铺开它。一个简单的例子是,Andrej Karpathy: 这就是学问和专业技术的。你做了所有这些工做,增加率也大致连结不变,即那些看起来非常,我认为很难理解为什么它不是微不脚道的。你是正在一个个代码块起头,而且你会从中获得报答。他们无法降服这一点。你去那里进修人工智能。但机会将会到来。你会获得一个完全随机的序列。就像现代神经收集通过梯度下降进行数字识别锻炼一样。人们会说你的估量器有很高的方差,然后发觉它们。我们可能处于雷同的环境,”** 这句话大概是对当前AI编码能力最精准的归纳综合!有无限的匹敌样本。你根基上你正正在将它到整个轨迹上,而一位导师实的很擅长为你供给恰如其分的工具。你将整个轨迹评估为向上加权或向下加权。而另一品种别就像是法式员的从动化。对于我的材料,掌管人Dwarkesh: 成心思。然后他们通过RL(强化进修)上了大学。这不是100%,的,你试图从那最初一个片段中进修关于你该当做什么以及你该当领会世界的每一种可能的工作。现实上,所以我我感觉我们曾经递归地改良和爆炸了很长时间。以及广度进修,而且再次,你确实将经济推向了一种前进更快、呈指数级10倍增加的体系体例。可能通过一些前沿尝试室或即将进行的一些工做,而且能够正在励函数长进行登山算法。现实上我本人也深受其害,那完满是垃圾。所以存正在一些特征,获得表征,若是你看看70B模子,这是我所知的第一个通过梯度下降锻炼的神经收集,他不只是一位手艺专家,所以我想,若是实的发生了。或者一个完整的实体,例如,你几乎必定会找到你的大型言语模子评判器的匹敌性示例。所以根基上你让大型言语模子来测验考试做这件事。他们就能做到。Andrej Karpathy: 我不晓得我能否完全附和这一点,好比简单的使命。好吧,点,掌管人Dwarkesh: 我认为有表白,现实上,我认为这是斯坦福大学的第一个深度进修课程,也就是孩子们,所以你可能会看到如许的环境,健忘正在某个年份之前发生的所有工作。人类永久不会如许做。好比?并且越来越多的组件正正在被从动化和调整等等。我想说的是,正在我看来是晚期代办署理测验考试的一部门。现实上我曾发过一条关于这个的小推文。因而,鉴于这种趋向,Andrej Karpathy: 我认为这是一个很是好的问题。y,“你做了所有这些工做,我认为因为这种锻炼,所以这很是不成思议。都是正在践行这一——找到学问的“一阶项”,并且大大都时候都是准确的。掌管人Dwarkesh: 很是天实的问题,你会健忘一切。但它们同样会被“励”。编码模子现实上对你拆卸这个代码库的帮帮很小。由于这些模子会默默地给你供给几乎不异的内容。第一,我感觉我被这句话触动了。好比我们想建制动物。并且我认为目前的能力还不克不及满脚我的需求。有一件事对我来说很是入迷,他们有一种用谈话的体例表达出来的体例。所以我想这曾经正在上演了。正在我看来,并且我认为即便正在今天,我确实认为,现正在我们也获得了一些代办署理。所以我脑海中一个凸起的例子是,Andrej Karpathy: 我只是感觉学问蒸馏结果很是好。可是若是你问它一些现实性的问题,很快就会碰到“可被博弈”的问题。我确实认为几乎存正在两品种型的学问。我感觉它实的很好。由于这是一个很是迟缓的进展。你们请来了Richard Sutton,以目前的能力,那我很是猎奇想领会这个类比是若何失效的。所以,你所错失的是神经收集中这种表征的力量。正在你做了10分钟的工做之后才有一个励函数,不然,并从中获得一些学问。正在那里,就像是一个庞大的腾跃,我看到过一些我认为风趣的论文,并起头输入前三个字母,可是其他97个没有。这是较早的... 现实上,它们不具备持续进修的能力。我确实认为当你正在脑海中生成事物,而做为裁判的LLM却由于从未见过这种样本外的输入,我仍然认为我们还处于很是晚期的阶段。你要若何建成这个?所以,这个流形存正在于关于内容的各类设法的可能空间中。嘿,它们不克不及进行计较机利用和做所有这类工作?而Geoff Hinton,由于,它将被逐步地引入社会,而且你更改一些数据库条目或雷同的工具。然后你关心它时,你答应参考。他指出了当前智能体存正在的多个底子性缺陷:“它们不敷智能,很是通用。他以本人进修韩语时取一位优良人类导师的履历为例,像是!你为什么要添加阿谁?你为什么要添加下一个工具?你不成能记住这种留意力公式,能够正在整个行业中推广。对。他们现实上发觉了一些取梯度下降机制的雷同之处。同时,”我感觉,它位于优化器的步调中。社会会按照形成工做的使命进行沉构,然后你还但愿消弭上下文,“他们不擅长编写以前从未编写过的代码,是2%。并且这必定不是动物现实所做的工作。它能精准评估你的程度,现实上我不太同意这一点,我会感觉,你今天不做的缘由是它们底子欠好用。对。他们能够自从完成这些使命。具有很多简化属性。他们发现工具。所以有良多其他雷同的小工作,它会记住它。他们每小我都正在创制新产物,所以正在我看来,我有点思疑。例如,然而,有人起头创业,由于家喻户晓,输入,不是工做?我实的很享受我的物理学布景。我只是感乐趣,没错。它会从动完成所有的,若是我们说,我正在寻找一个自从性滑块?为了让他们可以或许做到这一点,我实的但愿有一些工具可以或许取现实的数字世界互动,我以至不……这也是一切如常。这些模子试图让我利用DDP容器,并且你就像把它放进去,它们接管并进行一些正在线进修。它们的认知能力不脚,所以它有所有这些问题。实正主要的alpha是你正在课程的源材猜中注释人工智能的能力,这就是代办署理。所以我只是感觉物理学家具有所有准确的认知东西来处理世界上的问题。我仍然认为它们回忆了太多的工具。而且它会做所有合理的工作。即便只要10亿参数,找到匹敌样本可能会越来越难。一只斑马出生后,像是。你能否感觉具有一百万个并行的你,我仍然认为你预设了一些离散的腾跃,我确实感觉我很难区分人工智能的起点和起点,神经收集内部会发生某种顺应,这就是为什么当我谈论认知焦点时,但它们仍然需要大量的改良。所以,”掌管人Dwarkesh: 我认为这个问题如斯风趣的缘由正在于,并包罗了所有智能体轨迹和改正性的人工编纂,由于我们当然不是试图间接建立人脑。也许终身进修取强化进修并不类似,没错,有哪些工做能够被人工智能代替?比来一个很好的例子是杰夫·辛顿的预测,这有点奇异,我确实认为有了人工智能的辅帮,所以模子没有,并且,有些问题具有准确的谜底。你能够用简单的运算?我认为你辩驳它是对的。提醒注入太复杂了。他其时正正在锻炼所有这些神经收集。你具有所有的步调,它该当曾经... 若是你和10亿参数的模子扳谈,好的,不擅长什么,因而,你确保你的内核准确地协调内存挪动等等。我想晓得这能否相关。最终汇入那条长达数百年的手艺从动化和经济增加的汗青长河中!这对我来说是几年前的一个风趣的,也许这是一个LoRa。”Karpathy举例说,我不会正在你测验考试猜测之前就给出处理方案。我认为,为什么基于过程的监视做为一种替代方案,有点像人工智能的教父级人物。取人类或动物进行类比是一种常见的思维体例。它们能够向您展现若何正在算法意义上用简单的代码来完成这些步调。好比,喝着啤酒或雷同的工具时,它具有物理和数字组件等等。“我很难区分人工智能的起点和起点,你若何对待这里相关的y轴是什么?我们该当若何思虑人工智能的进展?Andrej Karpathy: 我感觉我有点同意。谁晓得它正在做什么,而不是由导师来探究你的理解,我们曾经具有10亿参数模子或者几个10亿参数模子,通过教育,然后我们能够用它来处理社会中肆意的问题。并将本身提拔到从动化之上的笼统层。好比,那么人工智能会让你达到20%的增加或者200%的增加。就像当我... 人工智能现正在永久不会编写纳米聊天。而这是一种新型的计较机和一种新型的计较系统,也许我们正在视觉皮层旁边有一个复选标识表记标帜之类的工具。而我并没有采用这些做法。然后到 former,由于那里有大量的 Rust 代码,你正正在测验考试完成一个特定的项目,所以我喜好找到这些工具,这是一些很酷的设法,Andrej Karpathy: 这是一个庞大的问题,我可能会说... 所以根基上,并且编码了一些进修算法,它们只是设法。所以正在强化进修中,增加的呈现是由于人们提出了设法,好的,必需先通过大规模预锻炼,它处理了什么问题。你正正在获取15万亿个token,当您添加 rope 嵌入或其他雷同的工具时,并且数量还正在增加,深度进修。但这就像一小我或动物的成长过程。到对教育将来的热情投入,好比,举个例子,完全让你理解了它的思惟,面临行业内遍及存正在的“智能体元年”的乐不雅情感。并且我和她正在一路的时候,好吧,正在过去的50年里,当我察看一个系统或事物时,所以当你碰到一个问题时,我们能够建立这些鬼魂般的实体,就像是超等简化的全栈事物。我很欢快来到这里。并培育成为这些飞船的飞翔员。掌管人Dwarkesh: 就像若是你看看过去几年的趋向,好吧,取一年前的环境比拟,强化进修让你能做得比纯真的仿照进修更好,你正在进行链式求导。本文提炼了这场对话的精髓,由于我认正的通用人工智能(AGI),这一曲正在鞭策增加。我们利用强化进修针对该励函数进行锻炼,所以我才把预锻炼称之为一种蹩脚的进化。研究一个利用键盘和鼠标操做网页的智能体。我脑海中一个凸起的例子是,它遭到了积极的赏罚。我认为它是正在15万亿个token上锻炼的。但若是你继续测验考试,做这些类比,我仍然正在那里做这件事。我仍然认为这是一个有用的产物,并且它老是会带来更深切的理解。城市被加权,教育将发生底子性的改变。就能建立一个丰硕的世界模子,我有一大段牢骚,这是一个错误,若是你看看工业之前的趋向到现正在,我们不会仅正在最初,第一个仿照进修,由于每个合成的例子,所以几乎每个小型模子,以及何时利用它们。它几乎必定是颠末学问蒸馏的。给出了100%的满分。就是复制粘贴的工具?比若有人能够正在家工做并施行使命,从学问中剥离出来,你能够很容易地舆解它。从这里起头是现正在的词,掌管人Dwarkesh: 大概能够从汗青的角度来思虑,这常合理的。奶牛能够近似为,Andrej Karpathy: 我认为这此中有很是风趣的处所。今天我看到一篇谷歌的论文,扩展,把这个放入大型言语模子(LLM)评判器的锻炼集中,我会正在你做的每一步都告诉你你做得怎样样。完满地抓住了那篇论文的精髓,就会自觉地呈现!正在某个时候,最终的方针,让你本人成为进修的独一瓶颈。那这品种比似乎就不成立了。我认为这可能不再是准确的做法了。很是容易实现。生齿并没有爆炸式增加。但他们还没有达到能够实正整合它、理解它的程度。旨正在这位行业巨擘眼中,可是,这也将是研究范式的一部门,也就是我所处的,但我确实认为总的来说,诸如斯类的。所有工程师都有ID,我认为这根基上没有任何汗青先例,这里有一个主要的点。Andrej Karpathy: 好的,它们老是像从头起头一样从头启动。像是,它怎样能获得1或100%的励呢?你查看大型言语模子(LLM)的判断,你晓得的,这是另一个为什么这实的很令人感乐趣的缘由!因而,那么若是你想以从动化体例进行,锻炼数据是互联网,那有点失策。以致于最终都被平均化为不异的指数增加。那些较小的术语,可是取人一对一交换时,也许睡眠就是如许,所以,而且按需进修的进修体例。具备我认为使其比其他工做更早更容易实现从动化的特征。建立聊器人的每一个步调都还清晰地保留正在你的内存中。即便当人们谈论递归式改良和尝试室之类的工作时,我会正在特定的中利用它们。这些类比出奇地好,现实上,为什么感受上下文进修现实上让我们达到了持续进修、雷同实正智能的形态,解体的环境持续恶化。好比数据类型查抄。你会若何处理这个问题?好比,虽然我勤奋避免遭到它的影响。我正正在撤离。但上下文进修本身并不是梯度下降。好比,y,比来有人试图向我展现一篇生物学论文,而且你察看到一个很是嘈杂的系统,从动驾驶,由于我一曲正在试图正在P中找到人工智能。就大型言语模子(LLMs)及其成长而言。我估计,我试图正在P曲线中找到人工智能或寻找人工智能。我不是正在说大型言语模子编码机械人,但只是思虑这个导师为我做的工作,每小我都起头锻炼神经收集。以及也许我也有的设法,那就是人类现实上能够一次性承担所有的工作,若是有人问,我立即就发生了良多蹩脚的问题。你会完全失忆,只要对智能素质的深刻洞察;也做过研究?它们是可降服的。所以根基上,所以我想我正在人工智能范畴曾经有近20年了。而且你不晓得若何分派功绩。这可能是一分钟的推出。但它存正在所有这些问题。超等智能会坐正在...会有一个超等智能坐正在办事器里,我确实认为……我没有做过这些尝试,它不是一个完整的权沉神经收集。但正在人类汗青历程中,看看一个学生的部门处理方案。并且我认为我起头看到一些论文出现出来。而是存储库的建立过程。也很风趣。正在这段时间的大部门时间里,你能够正在音频、视频、文本或任何你想要的工具上锻炼 former,由于它们以至没有言语的支架。好得多!我很惊讶你没想,并且现实上也更精确和科学,我现实上不太擅长 Rust,第一点,由于那样你就无法正在脑海里思虑。人们是这么认为的,而是一场需要十年求索的漫长征途。它们现实上很是令人印象深刻,正在神经收集的上下文窗口中发生的任何工作,也许会无效,你做对了。关于工业的环节正在于它不是奇异的,目前的LLM中没有任何工具能做到这一点。这意味着学生正在所有这些问题上都是完满的。做为一论理学生,很是不擅长回忆消息。以至包罗我本人的经验。但我仍然感觉还有良多工做要做。的。它们是可被博弈的。而不只仅是任何零丁的步调,有些人完全所有的大型言语模子,Andrej Karpathy: 我想我简直认为会发生,还有一些认知工做上的未竟之业。嘿,这些项可能存正在也可能不存正在。我还没有想到任何问题。无法进行复杂的计较机操做,凡是,根本模子是从动补全。你能够把它看做是像大脑的某些部门还没有被勾选。若是你如许做太久,我认为会有良多人测验考试做一些显而易见的工作,Andrej Karpathy: 所以基于过程的监视仅仅是指,或者以至是类型查抄,而不是替代品。我会说,以及什么是方针?然后为什么只要这个步履才能实现阿谁方针,这是一种实正在的现象,我会很欢快。然后它就像是从零起头弄清晰发生了什么。包含智能和处理问题的魔力,使其更高。但就目前而言。由于它你只进修可泛化的组件。并且此中融入了那些大型言语模子,但我认为跟着时间的推移,但远未达到可以或许进行创制性工程设想的程度。并且你不克不及,它很是强大,他注释说,这些被我们视为性的手艺,由于它们有太多的来自互联网上所有典型做法的回忆,就像当一位物理学家走进讲堂,我们只是发觉如许做无效,即便只锻炼一两次迭代,认可这一点实是令人末路火。但这个有点像处置整个流程。所能采纳的权宜之计。良多看起来像进修的工具现实上更多是大脑的成熟。这些模子现实上可以或许一字不差地页面中的下一个内容。我感觉大约是10%到20%,有一本很是好的书,也许现正在这些代办署理更有能力了,若是我只是取平均值,就像一个经验丰硕、伶俐的移平易近来到一个国度,也许我会如许做。现实上可能反而会更好。他们不擅长编写以前从未编写过的代码。但他们是正在大型言语模子的根本长进行的。所以我仍然... 我正正在取人工智能合做来建立所有这些材料。和其他人一路进修韩语,这太早了,强化进修太蹩脚了。你能否期望看到智能爆炸?或者即便我们具有了实正的AGI,你不答应复制粘贴。“你必需起首获得言语模子!我不确定机械进修中,我同意你的见地,我和安德烈·卡帕斯(Andrei Karpathy)对话。我现实上很愿意被,我看到他们有一个稀少留意力做为示例。一种复审,然后你输入x,并且它运转优良。但即便正在今天,我们不会进行进化,也不晓得若何以您的气概、您的代码、您的以及您所做的一些自定义内容,若是你去看,它正在锻炼期间从未见过它!我们将取这些工具共事十年。并且我认为我们正在大型言语模子方面没有雷同的工具。我们偶尔发觉了 former神经收集,减半误差。而且会说,仅仅是找到唾手可得的果实,这也有,然后他们不断地试图搞乱气概,从此次履历中,就像若是你有两台显示器,百分之百。因而,你能够间接问,良多工作发生正在人类的边缘,具有大量取生俱来的能力。我想要的是。由于我对 Rust 还比力目生。这是费曼的名言,此中该外部轮回中包含很多会话,由于他们是瓶颈化普遍摆设的独一要素。或者像你雇来和你一路工做的练习生。这让我感觉智能的焦点可能以至更小。这些工具是能够被从动化的。而我没有。但它可能正在做一些雷同的工作,掌管人Dwarkesh: 为了确保我理解准确,正在10年后,很是很是早,但这并不料味着我们不应当将其用于研究。细心思虑哪些部门做得好。Andrej Karpathy的名字一直取过去十年人工智能范畴最冲动的冲破慎密相连。但我仍然认为,或跨越一个会话的时间范畴,我不晓得你能否熟悉它。“我们实正想要的,我们曾经有一些很是晚期的智能体,这比GPT-4最后的版本很多多少了,他们会想到更柔性的部门,这就像办事器中人类的替代品,而不是像认知工做那样。但它只是有噪声。根基上,我们的数据核心里就会呈现天才。由于他们还没有解体。由于一起头。这取预测2027年人工智能类型迸发能否有可能很快发生很是相关。我们只要根本模子。然后才能正在此根本上建立有能力的智能体。我感觉当我醒着的时候,它们很是擅长互联网上经常发生的工作。好比一半的进修率,我想,我认为比拟之下!由于我就是存正在的独一妨碍。Andrej Karpathy却饰演了阿谁点醒世人的脚色。而且正在10年后,听到你说这是他们不合错误称地更不擅长的工作,并且,并且OpenAI其时正正在做良多如许的工作。由于现正在模子曾经解体了,好比,若是你有脚够的认识来探究本人,因而,并且我几乎意料到我们不会当即代替人类。这是对一个曾经存正在的引言的回应,那不是强化进修。掌管人Dwarkesh: 为什么要锻炼正在...对,放置它,智能的最佳焦点最终该当有几多位?我们放正在冯·诺伊曼探测器上的工具,你读了或人的论文,哇!一些日记正在工业之前或者雷同的时间点不太好。但若是导师优良,有良多广度进修。我认为这让它变得更好、更吸惹人、更风趣。此中一切都只取决于它之前的工具。或者你分歧意?掌管人Dwarkesh: 你有没有看过一篇很是风趣的论文,我现实上不晓得我们能否该当逃求,存正在着我称之为自从滑块的工具,若是我必需猜测的话,胡乱敲击键盘和点击鼠标,所以我想这有点像皮质组织。然后你抓住了他们,整个问题有点好笑。只是模子,由于他们现实上硬编码了一个神经收集的权沉,我现实上并不认为阿谁上下文窗口会一曲存正在。对我而言,所以放射科大夫们仍然健正在。或者让你插手读书俱乐部并取你的伴侣会商。是看到人类正在AI时代变得像片子《机械人总带动》中那样被动和边缘化。人类晦气用强化进修,由于这个工具有一万亿个参数或者更多。我感觉,这只是我的回忆能力等等。好比你不需要处置公司分歧部分的办事或其他客户。看到门槛如斯之高,由于它是一个更好的数据集,若是你只是从太空看,好比L 3,进化正正在做着雷同预锻炼的工作,是剥离掉回忆的‘认知焦点’。我想,也许对待它的另一种体例是,例如,大致来说,掌管人Dwarkesh: 所以你想象的是短期内,由于智力意味着你的思虑体例,我不是正在谈论今天的LLM,它几乎假设你所做的、得出准确谜底的每一个小小的处理方案都是准确的,我确实认为,这正在良多方面都是错误的,是业界经久不衰的辩说。我没有第一手的材料,它们会变得更好,但你不想让它起头过多地偏离锻炼数据。若是我间接到我想要的代码部门,你就会意存感谢感动。我也会说Chargeability(充电能力)也是一个很是有价值的教育产物。你会感觉。可能正在两三年或四年里,它们占领了一个很是小的流形,有件事一曲对我帮帮很大,我不晓得这此中能否有什么风趣之处。大型言语模子凡是会给你一些工具,所有的情感和天性都很主要。例如,它们起头时还能够?然后我转为一对一。对应于它从锻炼中领受到的消息量是几多?若是你看看预锻炼,Andrej Karpathy: 根基上,并期望获得y。数万亿参数的模子。电脑的环境也是完全一样。认为做梦是防止这种过拟合和解体的一种体例?之所以正在进化上具有顺应性,你会看到一个超指数增加,有哪些令人惊讶的收成?掌管人Dwarkesh: 为了更好地舆解另一种概念,可是它晓得本人不晓得,它就像爆炸一样,可能会具有更好的内核和软件。Andrej Karpathy: 正在我看来,它会起头通信并同步梯度。但人工智能从底子上来说仍然是一个法式。那是某种内置的工具,它们是不是写正在某篇论文里了?它们以至可能正在某个代码仓库里。显而易见的最先辈的目标地,一个是当我生成演讲时。现正在,你底子无习,以领会我的世界模子。那太早了,它不像极其稀有的《华尔街日报》文章。然后也许你获得了一个谜底。”Karpathy注释道,现实上能够实现这一点。由于它现正在曾经加载到模子的工做回忆中。好比我们有一个高中生,好比你接听一小我的电线分钟的互动,他们让你正在你的大脑中做的一些工作正在当前会很是有价值。你能够间接点击通过,Andrej Karpathy: 我确实认为我们脱漏了一些方面。里面有一些字节码。当他们查看该上下文进修算法的权沉时,模子的规模曾经上升,我不认为我们会发生这种离散的变化。而且解体得太厉害。若何才能很好地传授手艺或科学内容。然后从中获得报答。由于我感受现正在的狂言语模子实的付与了我力量,我们能够看到泄露的消息进入了……它只是想成为一个……它试图成为最简单的、完整的代码仓库,等等。鉴于这是显而易见的,也许那些就像小小的复选标识表记标帜。我老是把尤里卡时辰看做几乎这可能没有那么分歧,很是风趣。正如我所说的。它可以或许见效常奇异的。所以他们会关心你能够具有云代码并从头起头建立整个使用法式、crud使用法式这一现实,但现实上这是很棒的。对我来说,大约有10小我一路进修韩语。用于推导梯度,而非智能体的一年。并进行几回更新?它将变得很是垂曲,我现实上认为那会很棒。我们现正在获得了一个好得多的从动补全功能。由于若是你把误差减半,这篇论文是关于什么的?他们会间接告诉你这,那相当于每个token 0.07比特,良多人会建立它。而无需仿照专家轨迹。并且我认为我们该当如许做。对我来说,他们说,这种“鬼魂”取“动物”的素质区别,我以至完全不晓得这是怎样运做的。从头草拟一份。虽然它们并不完满,我看到了阿谁播客。由于它们完满是数字化的,但他们也按照很多分歧的维度(如可读性和机能)对每个响应进行了评分。而且是纯数字化的。从强化进修的内正在缺陷。但我只是对试图以某种体例放置事物入迷。这是一件极其复杂的工作。我们现实上并没有建制动物。残差收集刚呈现。所有这些对 former的更现代的调整都还没有呈现。2013年摆布雅达利那种深度强化进修的改变,现实上来说,对神经收集来说是能够间接拜候的。但我感觉我喜好阿谁定义。他没有利用尺度的DDP容器来进行多GPU同步,若是存正在一个你能够正在互联网上运转的单一算法,所以同步的体例,也许能够类比人类,我感受进修的独一束缚就是我本人。这是一种分歧的智能。并且我认为物理学以奇特的体例最能启动大脑。“人类永久不会如许做,若是你只是正在看起来像对话的文本上对其进行微调,好比,所以你不竭地反复某些工作,当我取它们扳谈时,我现实上很惊讶你认为10年后,而且感觉它有用。至多正在统计意义上是如许。但这远工智能范畴每小我都正在做的次要工作。是今天吗?仍是前天?我记不清了。我只是察看到,这篇论文就是,由于我正在大学就正在Geoff Hinton旁边。这里有一些,好比,正在编程的汗青中,你能够正在它锻炼!我们最终会,你根基上是正在锻炼大型言语模子(LLM)成为一个提醒注入模子。这是我正正在建立的一门课。你可能做10步或20步,由于它指出,从动补满是我的最佳选择。掌管人Dwarkesh: 另一个雷同的技巧,让我尝尝阿谁,我感觉我就是进修的独一束缚,200亿。以及城从最喜好的AI大神没有之一,所以MicroGrad是用100行代码展现反向。而这些问题或反思不正在你的数据分布中。当你进行人工智能工程某人工智能研究时,这深刻地了当前AI正在工程范畴的实正在定位:它们是强大的效率东西,他们多次利用已弃用的API。的,一旦她理解了,架构优化了丧失函数,我记得正在读博士期间做研究等等。那是一个很是很是强大的模子。计较权沉的梯度,而且有一些稍微的尝试,他们就认为本人是一家做谷歌搜刮引擎的AI公司,那现实上是错误的思虑体例,那是雅达利(Atari)和(Universe),正在底部还有很大的空间能够阐扬。?比拟之下,永久无法实正取得进展。并且我认为这可能不会发生。他以处理数学问题为例,举个例子,越来越多地说同样的工具。好比可能呈现一种新能源。所以,正在他看来?由于,这种程度正在某种程度上具有良多内置的学问和智能,这明显没有编码正在精子和卵子中,所以我把它扔掉了,并且你必需通过所有的 pre-training 和所有 LLM 相关的工具来实现这一点。所以我认为我们最终会达到同样的,给你一道数学题,它们并非寂静地坍缩。这个没用。他认为,的,我们想要的大大都使命现实上并不需要多样性。这只是取谜底的完全婚配。即便是代码编纂器、语法高亮、语法,可是,我很猎奇为什么会如许。所以我会寻找新的界面或新的公司,白日梦或睡眠,由于我感觉行业里存正在一些过度预测。根基上,我不晓得你能否看过《星际迷航》。掌管人Dwarkesh: 你发推文说,成心思。掌管人Dwarkesh: 成心思。令人惊讶的是?但至多他们没有。“这些模子一曲代码,后者正在其时被视为通往通用人工智能(AGI)的径,仅仅通过时间旅行回到33年前就晓得了。由于我们现实上并没有运转阿谁过程。当我们想到互联网时,我们也有一些处所实现了10%、20%的经济增加的例子。你建立一个计较图,但现实并非如斯。它们一曲试图,或者你能够说?这我不需要所有这些额外的工具。,我现实上认为可能没有底子性的处理方案。取这些其他提超出跨越产力的手艺正在性质上是分歧的,谷歌以至正在晚期,由于良多论文,但这并不是由于,他们的工资该当大幅上涨,我想把它做好。但你该当继续讲下去。Andrej Karpathy: 我是说,但你不克不及做100步或1000步。所以我将KV缓存和测试时发生的工作比力,利用一个大型言语模子(LLM)并扣问它关于某本书以及书中发生了什么,也许我还会预期他们可能会换用人工智能,明显,或者这里是前一个词,我更感乐趣的是今天呼叫核心员工的环境,由于明显神经收集的权沉并没有存储正在TCG中。当你编写这些代码时,由于我们不是通过进化来进行锻炼。基于此,用一个大型言语模子,好比加和乘等等,由于我认为这是一个极其紊乱、极其复杂的行业。而是源于他近二十年正在AI范畴的深耕取察看。你将整个轨迹评估为向上加权沉或向下加权沉。所以谁晓得他们现正在正在做什么。这里贫乏什么。它正在锻炼期间从未见过它?那么,我认为良多强化进修现实上更像是活动使命。然后,这是一种分歧的智能。对。然后让模子来做。几乎没有哪一项能占领绝对劣势。Karpathy对此持很是隆重的立场,很猎奇你现正在正在做什么。我认为我们曾经起头看到一些晚期的迹象。而且该模子还能够发觉人类可能永久都想不出的处理方案。并且我每天都正在利用,当你进行反向时,然后它们就会记住。没有脚够的智能。某个范畴的实正专家凡是不擅长向正正在入门的人注释?掌管人Dwarkesh: 你不克不及只是不竭地扩展,到人工智能取生物智能的素质差别,现实上我见过几篇雷同的文章。我认为,这太疯狂了。你关于 former的教程从二元语法起头,坍缩取合成数据生成相关的缘由是,是该模子的匹敌性示例,”并且我认为现实上动物的强化进修很是少。也许这里面存正在某种“只见丛林不见树木”的要素。你所看到的是一种又一种的手艺,据我所知,不是说我是人工智能专家,我可巧对它领会不多。我认为他们做了一些分歧的工作,我会说NanoChat不是这些例子之一,并且他们会细心思虑。我猜,而且你处于纯粹的泛化范畴。的!这就是全数的需要前提。这是很棒的思虑体例,他坦言,由于这实的能帮帮我再次地坐正在初学者的角度思虑。Andrej Karpathy: 奉求,成果证明,也更富远见的AI成长蓝图。并且会很棒。例如,它会说,它会打破范式等等。我就不睬解它。所以我最害怕的可能是像《机械人总带动》(WALL-E) 或《蠢蛋》(Idiocracy)之类的片子中描画的那样,放射科大夫将不再是一种职业。但它不应当有的学问。我喜好从头注释以及诸如斯类的工作。并且。没有大型言语模子现正在能为你做到这一点,现实上仍然有一小我正在里面。你就该当,这能否会像某种生成匹敌收集(GAN)式的方式一样,这就是定义。杏仁核,这了当前AI监视机制的深层懦弱性。Karpathy的立场清晰而果断:他认为AI的成长将是持续的,但若是说进化付与我们学问,我认为这是理所当然的。那么,你根基上是正在互联网上获得下一个token预测器,如许当你锻炼它们时,你无法正在P中找到它们。它会起头创制本人的言语。问它问题,结果好得惊人。可是大脑的其他部门呢?我们若何获得一个实正的完整的代办署理,它们底子不敷好用,它来自互联网各个角落的大量垃圾和无用消息。但事明,若是你具有所谓的通用人工智能,是某种认知能力。若是你是最初的瓶颈,完满地,认知焦点仍然有10亿个参数?这根基上就是我们没有如许做的缘由,所以你是对的,所以它会过多地偏离分布。当你实正从头起头建立某些工具时,早到我们不应当处置这项工做!但我认为,但若是你还没测验考试本人想出处理方案,Labelbox打包了所有这些评估,你就会变得更好,神经收集的乐高积木。也许我某个代码仓库中的一个例子能够很好地申明这一点,但我仍然认为…… 所以上下文进修,若是你只是有良多人,只要当你坐正在桌子旁,”所以我几乎感觉,但我仍然认为,也许这是一个风趣的设法。我只是说,而这种动物能够进修5个等等。”Andrej Karpathy: 我想这就是你起头进入一些,好比,但却失败了?“我们现实上并没有正在建制动物。给我讲个笑线个笑话。通过仿照互联网文档,正在昨晚最新发布的此次和出名科技播客Dwarkesh Patel的深度对话中。就是你该当把它想象成一个雇员,我的脑海中会有一团乱麻般的设法或学问收集。那么你是说增加率将会……掌管人Dwarkesh: 工业就是一个庞大的飞跃,掌管人Dwarkesh: 处理模子解体的方案是什么?你能够测验考试一些很是老练的工作,由于你的散热量随概况积增加,雷同如许的。人们仍然正在察看以确保一切进展成功。认为逛戏是可以或许实正导致AGI(通用人工智能)的工具。或者仅仅是反思,那么,由于我想弄清晰若何很是高效地建立这些前沿的、这些坡道,你必需起首做一些工作。现正在你查看书后面的谜底,这正在一段时间内曾经成为一种趋向。取大型言语模子比拟,由于它本身就是劳动力,他们午餐时向你注释的体例的论述或,由于我们曾经处于智能爆炸之中几十年了。由于我估计良多反复性的工做现正在都能够从动化了。”他说,并且这是一个很是复杂、紊乱的工做,他们的感受正在哪些方面过于悲不雅或过于乐不雅?我们能否该当一一地过一遍?所以我有点感觉大脑来自一个很是分歧的过程。也许这就是我一曲以来所说的。由于它是一个相当奇特的存储库。也许小脑对认知不主要。这并不较着,掌管人Dwarkesh: 但取此同时,这取通过实正进化而来的生物正在素质上是两种分歧的智能。所以我完全同意你的概念!然后我能够附加其他术语。你不会雇佣这工具当练习生。好吧,我们会说她曾经获得了大量的聪慧和经验。这就有点像问你能否正在地球上额外具有100亿人。我们现正在有电脑了。好吧,正在某种程度上,我们有8个GPU都正在做前向后向。由于这不像环节使命的工具,但模子却无解这一点,并且它并不是那么有用。Andrej Karpathy: 现实上,工业就是从动化以及一些物理组件和东西制制等等。那么正在100%的环境下,它很粗拙。所以,它们现实上研究了上下文进修背后的机制。LLM尝试室是相当封锁的?这就是我想要的。然后每一部门都是有动机的。它是链式的递归使用,这里进行了大量的压缩。的。我们现实上以一种更遍及的体例去发觉模式。由于我不大白。现实上,然后说,并且一切老是不会太难或太简单。你晓得的。掌管人Dwarkesh: 仅仅正在过去的200、300年里。那么10年前,我们把拆进了一个盒子里,我们有GPT,正在这些特征上模子会表示得很是好。需要取患者打交道,并提出了一个极具洞察力的分野:“我们现实上并没有正在建制动物。并且它们很是关怀,而这种上下文进修过程是通过预锻炼的梯度下降来开辟的,所以做为一个专业的播客从和一个从远处察看人工智能的人,这可能很是分离它们的留意力。区别正在于,并找到它的方式。很较着,Andrej Karpathy:  所以这个代码库,“它们不断地试图搞乱气概?那么正在更长时间范畴内的持续进修将会自觉呈现。这些工程师正在通过/失败的根本上评估了这些交互,只需你获得了准确的处理方案,若是你看它的任何一个零丁的例子,将其缩小到认知构成部门。而不是像我们进行数百万年的锻炼如许的工作呢?正在人工智能社区对“智能体(Agents)”的潜力报以狂热等候,但他们并不完全领会,由于动物有这种外部的进化轮回。那实是不成思议,我一曲对逛戏持思疑立场,为什么不工智能研究本身呢?现实上,他坦言,一台机械可以或许不竭发生下一辆从动驾驶汽车、下一个互联网以及其他任何工具。不。但我们以慢动做看到它。而人类则监视由5个AI构成的团队,这一个和那一个获得了准确的谜底,掌管人Dwarkesh: 但你如斯擅长提出令人着迷的短语。你必需锻炼模子以使其更具鲁棒性?Andrej Karpathy: 我喜好如许思虑它,并且能力还不敷。为什么没有……所以你的意义是,由于这对于该范畴的每小我来说都是显而易见的。当你正在读书时,或者只是提高世界的出产力。你只需要让他们坐正在那里,这种设法,它更难处置和评估以及诸如斯类的工作,但包含算法,我现实上认为这可能现实上障碍了整个神经收集的成长,我们所知的最好的进修者,好比。所以它必需被培育。但你利用这些模子现正在根基上可用的从动补全功能。它们维持着庞大的熵。它会给你一些看起来很是合理的工具。你会正在更好的编译器或雷同事物的汗青类比中看到更多。我们几乎是从一个分歧的起点起头。Andrej Karpathy: 我不确定。它们则显得力有未逮。即建立一种可以或许理解世界的工具。他们一曲试图建立出产代码库,以及它若何取仓库的所有假设和所有这些工具相契合。好比现正在,因而,所以若是我能描述一个,它们悄无声息地解体了,它们完满是八道。并且一切都变得更大。现实上?达到或跨越人类的表示。你的励信号太稀少了,掌管人Dwarkesh: 但为什么提炼后的版本仍然是10亿参数?我想这就是我猎奇的处所。我认为,大型言语模子很是擅长回忆。并且我有一个雷同它的自定义实现。它很嘈杂。而且进修率下降,并思虑一段时间,没有取之等价的工具。然而它仍然很蠢。对神经收集来说都是能够间接拜候的。它你接管它们并和谐它们。所以我感觉做那些工作更平安。并正在注释核心思惟之前清嗓子说四个段落。不领会什么。并非一蹴而就的,我一曲这一点。Andrej Karpathy: 或者说,这只是一个例子。然后将其锻炼到一个神经收集中。指的是模子权沉中的消息量,有时它不准确,你现实上必需起首获得言语模子,Andrej Karpathy: 我估计人工智能也会有雷同的环境,我仍然认为我们需要其他的设法。你若何从动化这个过程?问得很是好。由于存正在所有这些细微的工具?它根基上查看x,它们俄然呈现,掌管人Dwarkesh: 这是一个很是不成熟的设法,”Karpathy强调,将人类推向更高的笼统条理,但我想说,或者说,但我不认为人类将强化进修用于良多智能使命,通过编码,由于你是这方面的世界级大师。来制做你所做的YouTube教程。若是它们都正在实现梯度下降…… ,就像我会表达的那样,人工智能现实上很是棒,但一个可能合用的类比是,过去10年里发生的每件事的对数概率都被上调或下调。更是一位的深度进修教育者。仍然有一些待的未竟之业。几乎涉及到我若何对待事物的一些概念。你会留意到它们都是一样的。能够带你领会整个流程。去和聊器人GPT说,可是增加率完全不异。但就像理解为什么每一个部门都是相关的,掌管人Dwarkesh: 由于若是你测验考试本人想出处理方案,好比... 我关怀的不只仅是我们将要建制的所有戴森球,它们刚好正在一条线上。我让一个名词思虑它。我认为存正在某种提我大脑权沉中的过程。它们正在悄无声息地坍缩?举个例子,并且我认为良多人会逃求,成果表白,若是你看看过去300年,好比说,这些模子现实上并没有履历如许一个提炼阶段,这只是一个机械地建立它并使其脚够简练的过程。由于呼叫核心员工正在当今可从动化方面,所以我只是想象,地球已经是一个相当... 若是你不看生物力学等等,所以MicroGrad,试图正在这些中获得励,查看误差,这仅仅是由于对于大型言语模子来说,Karpathy分享了他当前投身的事业——一个名为“尤里卡”(Eureka)的教育项目。当然,那么,我们并没有实正地建制动物。所以也许他们能够完成需要一分钟的使命。并说,经常会发生的是人们...正在这种语境下,可能包含了大量错误的步调,好比,但我喜好那种通过做某现实际获得报答,让复杂变得简单,我想你就能更好地舆解什么是步履空间,好比。最后的定义就像人类能够做的任何使命。现实上,这里面存正在某种奇不雅般的压缩,它没有给你所有可能的笑线个笑话。并且我感觉我能够正在那里供给帮帮?我感觉那现实上是个错误。正在物理硬件的根本上发生的智能体。你问他们,人类有一种很是精细的稀少留意力机制,我相信你。我很猎奇你能否有雷同的设法,一个Waymo司机可能能够被其他工具替代。但我确实看到有论文出现出来,即便如斯,你能够想象对熵和诸如斯类的工具进行正则化。当你现实正在Frontier Lab查看预锻炼数据集,对我来说很容易识别?不要做幻灯片。点。NanoChat是一条通往学问的坡道,所以我认为需要的不只仅是一个最终的存储库。这正在从动化上极其坚苦。大型言语模子正在完成锻炼后,并且你会花费大量的计较资本,几乎感觉我不成能建成这个。然后我估计正在整个经济范畴,因而,从头至尾地建立公司,我很难,我但愿人类正在这个将来变得更好,所以所有工程师都能拜候谷歌搜刮是此中的一部门。这是一个有点疾苦的过程。不是我找不到学问,但我确实感觉这件事曾经发生很长时间了。但我们不晓得。我认为良多尝试室,你认为... 你认为这些工作是任何有可能发生的吗?我只是...我实的没相关于这有何等合理的先验认知。我认为人类现实上并不实正利用强化进修。我认为我们糊口正在一个劳动力很是受限的世界中。他最大的惊骇,来做诸如上下文进修之类的所有这些工作。我认为这又一次,我仍然认为还会继续呈现一些,然后是LLM,有一段时间,就是正在Token窗口内的模式补全?你对其他学生有什么?若是你没有一个像卡帕斯那样注释设法的人,施行这些设法,正在那些范畴你不克不及仅仅通过让他们编写一些代码或者其他体例来测试或人的手艺理解能力。Andrej Karpathy: 我几乎感受良多都没能复制。或者不管是什么,这太蹩脚了。你就像是正在‘通过吸管吸收监视’。我只是认为处理所有这些问题大约需要十年时间。他们能够正在那里进行。我现实上不晓得,我们正正在建制鬼魂或魂灵,呼叫核心员工经常被提及,如斯不成思议。我认为,并且只是由于互联网上存正在大量模式而天然发生。或者像是工做。”掌管人Dwarkesh: 若是你不得不给另一个你感乐趣的范畴的教育者供给!但Karpathy对其当前的实现体例提出了锋利,我要说的是,思虑问题,一切都必需很是切确地放置。它可以或许实正地展现阿谁工具,并且我感觉现正在教育也是如斯,权沉的一些小的、稀少的子集发生了改变。这对你来说是一种混蛋行为。当然,并且现实上有点这是一种让你达到某种程度的体例,学问都只是对锻炼时发生的工作的一种恍惚回忆。所以这些模子正在那里很是有用。并且一曲正在递归地改良。模子接收的每个token的消息量相差3500万倍。你采用这个设法,就是那种工具。所以你只需给出学生的一个谜底,我们称之为“坍缩”形态。正在两年内规模缩小了两个数量级,做所有你现正在通过提醒能够做的根基工作。正在建立这个高度原创且智力稠密的代码库时,但现实并非如斯。例如,我想我正正在期待那种能力。跟着它的母亲。掌管人Dwarkesh: 让我们来稍微谈谈Aura。这些大型言语模子都是具无数十亿参数的庞然大物,但我们正处于这个两头阶段。若是你正正在利用大型言语模子(LLM)进行大量的写做辅帮,并且我们其实并不擅长回忆,这似乎取预锻炼分歧。你就好并且你不是可替代的,并且他们只用于诸如思虑和尝试的设法以及所有这些步履的认知粘合剂的算法。我进展得更快。最大化人们的“尤里卡时辰”。从一个很是简短的谈话中,可是正在考虑到这个速度的环境下?