绘制行为结构的蜂窝基础

微信号：inooooow
不接反杀，想去别人群里开挂，开不了不用加。
复制微信号

　　实验使用了成年雄性C57BL/6 J小鼠（n = 13； Charles River Laboratories）。在20–24°C下的12小时光/暗周期（07：00–19：00）中，将小鼠饲养在专用的住房设施中，湿度为55±10％。小鼠实验具有四个队列：两个队列的四个队列，一个组为三个，三个队列和一个队列，并根据下面的“行为训练”中概述的标准预选。没有使用统计方法来预先确定样本量，但我们的样本量与先前出版物中报道的样本量相似（例如，参考文献12中）。将小鼠与同窝窝室饲养，直到实验开始并免费获得水为止。在整个实验过程中，随意提供食物，并且在实验之前可以随意提供水。在测试时，小鼠年龄为2-5个月。根据牛津大学动物使用指南进行实验，并根据英国内政部项目许可P6F11BC25进行。　　一组任务必须在3×3网格迷宫中找到4个奖励位置（称为A，B，C和D）的序列，并在循环中重复。只有在访问了先前的目标之后，每个位置的奖励才能获得，因此必须顺序访问目标才能获得奖励。一旦动物获得奖励，下一个可用的奖励就位于位置B（依此类推），然后动物在位置d获得奖励D然后奖励A再次可用，从而产生重复循环。ABCDE任务的扩展是其中的五个奖励。在位置A的奖励交付时（国家A的开始）播放了简短的音调，这标志着每次审判的一个循环的开始。除了第一个奖励位置的单个试验内存之外，这在A个位置的任务之间创造了等效性。　　当动物处于物理迷宫中时，它可能位于节点（可以传递奖励的圆形平台之一，编码为1-9，如图1a所示），也可以在边缘，这是节点之间的桥梁。如图1a所示，九个迷宫位置连接如右上角照片和相邻的示意图，仅沿着基本方向连接。在我们的特定迷宫中，边缘仅沿着基本方向排列，因此，位置1仅连接到位置2和4（图1A，右上）。　　一个具有特定奖励位置序列的ABCD循环的示例（例如，1-9-5–7；奖励A位于位置1；位置9中的奖励B，依此类推；图1A）。　　同一任务的不间断试验块。我们使用了20分钟的课程。请注意，在给定的一天，受试者可以接触到同一任务的两个或多个会话。在这20分钟内，允许动物完成尽可能多的试验。会议结束时，将动物从迷宫中移开，然后放回家居笼子或单独的封闭的休息/睡眠盒中。　　从整个ABCD循环中进行一次特定任务，从位置A的奖励开始，然后在下一次动物再次获得奖励（例如，具有以下配置的任务的试验12的试验12：1-9-5-7-7开始，从第12次开始，动物在位置1中获得奖励，并以第13次动物在位置获得奖励的位置1）。　　在特定位置获得奖励的动物与在下一个奖励地点获得奖励之间的时间段。在动物获得奖励A并在动物获得奖励b时结束时，陈述A开始；当动物获得奖励D并结束时，当动物获得奖励A时，状态D开始。　　国家的广义定义。例如，从A到B的发展是一个过渡，并且从C到D的发展也是一个过渡。　　动物在奖励地点之间取得了多少进展，而在它们之间花费的时间百分比。除非另有说明，否则我们会将其分为早期，中间和晚期进度，这对应于从一个奖励地点到下一个奖励地点所花费的三分之一的增长。例如，如果动物在一个奖励和另一种奖励之间需要9秒钟，那么早期进球跨越了前3秒，则中级进球跨越了下3 s，而后期进球跨越了最后3秒钟。这将随着动物完成一个状态所需的时间长度而扩展：例如，如果在两个奖励之间需要15 s，则每个目标 - 过程垃圾箱的长度为5 s。在ABCD任务中，目标进度重复四次，因为有四个回报（因此，奖励A的早期目标进度和奖励B的早期进度进度将有一个进度，依此类推）。　　我们用它来指迷宫中的一步选择。在迷宫中的每个节点上，动物都可以选择两个或更多附近的节点可供参观。例如，当节点1中，动物可以选择移动到节点2或节点4（图1A）。　　迷宫尺寸：45×45×30厘米（长度×宽度×高度）。迷宫的外尺寸：66×66×125厘米。外部迷宫墙：我们使用电磁场屏蔽窗帘（Electro烟雾屏蔽（产品编号：42601036644431）），而不是实心墙壁，以定制切割以覆盖迷宫的整个外部。节点尺寸：11×11厘米。桥梁长度：7厘米。水库高度（从注射器的底部到地板）：80–85厘米。水库填充到30毫升。所有迷宫组件的设计和材料的详细信息可在https://github.com/pycontrol/hardware/tree/master/master/gridmaze上找到。　　在4个队列中总共进行了13只小鼠进行实验。对于每个队列，根据以下标准，预先选择了3-4只小鼠进行10-20只小鼠的实验：　　在手术后恢复至少一周后（请参阅“手术”），将动物受到限制。将动物保持在其基线重量的88-92％的重量，该重量是在水限制之前计算出的，但在植入和从手术中恢复后（请参阅“手术”）。这是为了确保他们在任务期间仍有动力收集水奖励，而不是过分，因为已知动机会对基于模型的绩效产生负面影响58。在实验开始前至少三天，动物在迷宫上以及睡眠盒中至少三天时习惯于将动物束缚在电生理记录线上。在此期间，将动物重新引入了部分连接的迷宫（在可用的9个节点中只有5-7个，而不是全部连接），而束缚在电生理电线上，如果动物在任何节点上戳其鼻子，则可以在那里提供水奖励。只有在动物在节点上戳鼻子后才可用奖励滴。在此阶段，没有明确的任务结构，除了一旦在一个节点获得奖励，动物必须访问另一个节点才能获得进一步的奖励（也就是说，与上述预选前标准的步骤3一样，但植入和绑扎）。因此，动物（Re）得知，在韦尔斯（Wells）中戳了奖励，获得了奖励，在获得奖励后，必须转到另一个节点。当动物在20分钟的时间内获得> 40的奖励时，将动物过渡到任务。请注意，未植入3只动物（从1个同类的动物），因此，对于这些动物，预选和预训练的奖励会议是一个又一件（有关小鼠同伙的更多详细信息，请参见“数字”）。预读或预选过程中输送的水量高于训练，通常为10-15 µL。　　总体而言，在该部分连接的迷宫中，动物接受了几乎2×20分钟的课程，在所有可用节点中都会呈现奖励，并且在预选前和预训练中总共最多8×20分钟。所有这些会话具有连接可用节点的不同配置。　　动物在使用pycontrol59控制的奖励（图1A）中导航自动3×3网格迷宫（图1A）。水奖励（3-4 µL）在4个不同的位置顺序呈现。动物不得不在给定的奖励节点中戳戳，打破了红外光束，这触发了奖励下降的井中。在交付奖励A后，可以从位置B获得奖励，但仅在动物在新位置戳戳之后。一旦动物在位置A，然后B，然后C然后D获得奖励后，奖励A再次可用，从而产生重复循环。动物有20分钟的时间来收集尽可能多的奖励，如果犯任何错误，则不会放弃时间。然后，在开始新的会议之前，将它们至少距离迷宫中至少有20分钟的时间（在没有任何水的情况下）。对于每个会话，使用定制的电磁场屏蔽窗帘（Electro Smog Shielding（产品编号：4260103664431）），从方形迷宫的另一侧随机输入动物。这是为了确保迷宫的各个侧面都等同于进入迷宫和退出点，从而最大程度地减少了任何位置的偏好/厌恶，并最大程度地减少了使用不同方面作为方向提示。将一张提示卡放在迷宫的一个角落上的高高（至少垂直于迷宫垂直50厘米）作为定向提示。在头部层面看不到线索。　　虽然所有位置都得到了相同的奖励，但当动物消耗奖励时，交付了简短的纯音（2 kHz的2 s）。这确保了任务状态在不同的任务序列上具有可比性。在整个会话中存在白噪声，以避免从外部噪音中分散注意力。　　为每只鼠标选择了任务配置（奖励位置的顺序），同时满足以下标准：　　在前10个任务中，当动物的性能达到70％时，动物被转移到了新任务（即，在所有过渡中至少有70％的奖励之间的最短空间路径之一）在10个或更多的连续试验中或在200个或更多试验的性能中平稳。在这十个任务中，每天最多要进行四个课程，要么是所有相同的任务，要么是在动物达到标准时，将两次旧任务和两次新任务的课程进行。从任务11开始，动物每天都学会3个新任务，每天结束时再次重复第一个任务，总共提供4个会话，并使用模式X – Y – Z – X'进行4个课程。　　为了测试音调对性能的行为效果，对于同类群，3个小鼠还暴露于ABCD任务中，从状态开始，在50％的试验中随机省略了音调（在会议的第一个A中总是响起音调）。　　为了进一步测试我们在这里发现的神经元表示的一般性，第四个队列（2只小鼠）执行了ABCDE任务。这是在小鼠完成所有40个ABCD任务后完成的。在第一天，将小鼠暴露于2项新的ABCD任务，然后进行一系列不同的ABCDE任务（一只鼠标为11个，另一只鼠标为13个），跨越了4个记录天。和以前一样，动物每天经历三到四场会议。　　我们测试了给定鼠标的任务是否相关。对于这些交叉任务相关性，我们不仅将序列彼此比较，而且还与彼此的变化版本进行了比较，以确保我们详尽地捕获任务序列中的任何相似性。任务之间的相关性与给定鼠标的所有可能偏移都相对于所有可能的变化，然后在扩展数据中报告了平均相关值。此外，选择任务是使同一动物所经历的两个任务是在物理空间中彼此旋转的。　　动物在整个实验中经历的任务序列是随机和平衡的。在这项研究中，仅使用一个实验组（额叶皮质中的硅探针植入物），因此无需盲目。　　手术前48小时取水受试者，然后用异氟烷（3％诱导，0.5-1％维持）麻醉，用丁丙诺啡（0.1 mg kg -kg -1）和美昔康（5 mg kg -kg -1）处理，并将其放置在刻板的框架中。将安装在微型训练（Ronal工具）上的硅探针植入了可回收的外壳（Protolabs）中的硅探头，将其植入MFC（前至前方（AP）：2.00，内侧 - 侧面（ML）：-0.4：-0.4，pordorsal-ventral（-0.4），侧面 - 侧面（dv）：-1.1.0）和一个螺钉均为螺丝固定。AP和ML坐标相对于Bregma，而DV坐标相对于脑表面。手术后3天，每天给小鼠额外的剂量，并在手术后仔细监测7天，然后在训练前24小时放回水限制。在实验结束时，动物被灌注。大脑被固定并成像以识别探针位置（扩展数据图2A）。我们使用软件草药57（版本0.2.8）根据组织学图像将探针定位到小鼠大脑上的解剖位置（图2A和扩展数据图2B）。对于Neuropixels录制，这是通过查找整个探针轨道直接完成的。对于剑桥神经技术探针，我们发现了6柄中的每个小腿的最高入口点，并根据探针后手术后的最终DV位置和基于纳米的降低来推断底部。图2a中的每只鼠标和扩展数据图2B都标记了这一点，并与标准化的模板匹配，以推断与探针位置相对应的解剖区域。　　使用这种方法，我们发现所有记录的神经元中有90.7％是在组织学上定位在MFC区域中的：前腰带皮质中的68.3％，前扣带回皮质中的11.3％，额叶皮层为6.1％，在M2中为5.0％。在其余的9.3％中，由于错误地将其定位到ATLAS坐标内的特定PERI-MFC区域中，由于它们被错误地定位于Peri-MFC白质区域，因此可能是由于实际区域边界的差异，并且在Herbs软件提供的标准模板中衍生的差异是2.2％，在PERSAL PETUNCAL PEDUNCAL PEDUNCAL PEDURAIL，1.1％或者是1.2％，1.1％或者在1.1％中。皮层，侧间隔核中的0.3％，嗅皮层中的0.3％。我们在整个手稿的分析中使用了所有记录的神经元，但指示这些神经元与扩展数据图中的不同MFC区域有关。2i，4j，k和7f。　　剑桥神经技术F系列64个硅通道探针（横跨前轴前到后轴的1毫米的6柄）用于4个队列中的3个（5小鼠）中的3个。为了从MFC记录，我们在预先聘请期间降低了探测〜100 µm，以达到脑表面以下-1.3至-1.5 mm之间的最终DV位置（即-2.05和-2.25 mm之间，距离Bregma）。这将大多数通道都放置在前皮层中（http://labs.gaidi.ca/mouse-brain-brain-atlas/）（图2A和扩展数据图2B）。对于第四个队列（2只小鼠），我们使用了固定在距脑表面为3.8-4 mm的DV位置的Neuropixels 1.0探针，距Bregma的AP 2.0 mm，距Bregma的ML -0.4。这使我们能够从MFC的整个内侧壁中有更多区域记录，包括诸如次级运动皮层（M2），背侧和腹侧前扣带回（ACC）和额叶皮层等区域，以及前脑质皮层（图2A和扩展数据图2B）。在30 kHz中获得了与OpenEphys收购板相连的32频道Intan RHD 2132放大器板（Intan Technologies），在30 kHz中获得了神经活动。使用Pycontrol系统输出的同步脉冲同步行为，视频和电生理数据。使用Kilosort60，版本2.5和3对录音进行了峰值，并使用PHY（https://github.com/kwikteam/phy）手动策划。群集被归类为单个单元，并保留以进行进一步分析，如果它们具有特征性的波形形状，则在自相关中显示出明显的难治性周期，并且随着时间的推移稳定。　　为了增加每个神经元评估的任务数量，我们将成对的串联成对以获得六个任务。对于串联的双天，我们通过在两天内记录的会话中加入所有二元文件来跟踪神经元。通过标准的kilosort管道运行一个带有两天的数据的串联二进制文件，以自动提取和排序尖峰。我们根据标准标准手动策划该文件的输出：　　这些标准导致1 ms和2 ms耐火周期的峰值总数分别为：0.033％±0.003％和0.076％±0.004％平均的峰值。我们还注意到，有99.2％的神经元在2 ms或更多时具有最大的尖峰计数下降。　　辍学率：通过将策划之前的“良好”单位与策展后的产量进行比较，我们发现串联双天的辍学率为51.4％。这与单天的辍学率为29.7％相比。　　我们发现，串联绝大多数成功地捕获了几天的同一神经元。为此，我们利用了MFC神经元特征的高度保守目标调整（图2）。我们评估了从同一天开始采取的不同任务之间的“目标 - 过程相关性”，然后重复了相同神经元的，以换取从不同日期采取的一对任务。这使我们能够在几天内（在ABCD和ABCDE时代）索引细胞基本调整的程度。由此可见：　　我们使用DeepLabCut61（2.0版）在视频数据中对小鼠进行了跟踪，这是一种基于Tensorflow Machine Learning库中的无标记姿势估算的Python软件包。使用一组在ImageJ中定义的二进制掩码，将鼠标头背面的位置转换为感兴趣的信息区域（迷宫节点或边缘，动物都在每个框架中）。　　使用Python（3）代码对所有数据进行分析。此使用定制代码，但使用了库，例如Numpy（1.22.0），Scipy（1.10.1），Matplotlib（3.7.3），Scikit Learn（1.3.2），Pandas（2.0.3）和Seaborn（0.13.2）。　　通过量化过渡的百分比（例如，a至b）来评估性能，其中动物采用了最短的可用路线之一（例如，扩展数据图1J）或整个试验的百分比，在该试验中，动物在所有过渡过程中采取了最短的路径（扩展数据图1K）。我们还量化了奖励之间的路径长度，并将其除以最短的长度，以给出每个试验的相对路径距离（例如，扩展数据图1i）。　　当使用最短路径过渡的百分比作为标准时，在分析或经验上计算机会水平。通过假设随机扩散动物并计算动物将以N步骤从节点X移动到节点Y来计算分析机会水平。这在扩展数据中使用了图1O，以确保将DA与BA/CA进行零拍量化的比较是公平的。通过使用探索会议中记录的每只动物记录的位置转换矩阵来计算经验机会水平，然后再接触迷宫上的奖励。经验机会是在两个不同的地方计算的：　　正确的过渡熵（在奖励之间采取最短途径时，动物的熵）是针对奖励之间最短一条途径的过渡计算的。我们计算了给定过渡的所有可能最短路径上的概率分布，并计算出以下计算的熵：　　其中x是对数基础，它设置为最短路由的数量，而pk是每个过渡的概率。因此，1的熵表示完全没有偏见来走任何一条路径和0的熵，意味着只采用其中一条路径（即最大刻板印象）。　　为了量化迷宫探索中预先配置的偏差对扩展数据中ABCD任务性能的影响。图1H，我们分析了：　　这种相关性总体上是积极的，这表明当动物采取更高（更长的）路线时，它们通过高概率步骤进行操作，也就是说，在任何任务曝光之前，它们都易于接受。这表明错误与持续的行为偏见有关。　　我们旨在定义一个任务空间来投射神经元的活动。为了实现这一目标，我们将代表神经元活动和迷宫位置的矢量对齐和归一化矢量与任务状态。将活动对齐，使得奖励的消费构成了每一行的开始（试验）和下一个奖励的消费a开始了新的行。达到归一化，使所有状态都由相同数量的垃圾箱（90）表示，而不管在每个状态下花费的时间如何。因此，每行的第一个90箱代表奖励A和B之间的时间，B和C之间的第二个时间，第三个在C和D之间以及D和A之间的最后一个。然后，我们计算了每个箱的平均神经元活性。因此，每个神经元的活性由N×360矩阵表示，其中N是试验的数量和360箱代表每个试验的任务空间。然后，通过在试验中取平均值，并通过拟合高斯核（Sigma = 10°）进行平均。为了避免平滑时边缘效应，平均阵列与自身连接三遍，然后平滑，然后提取中间三分之一以表示平滑的阵列。为了反映任务的圆形结构，在极地图上投影了这种归一化和平滑活性的平均值的平均值和标准误差（例如，图2C，D）。　　为了评估MFC神经元调整到任务空间的程度，我们使用线性回归来对每个神经元的活性和排列测试进行建模以确定显着性18。具体而言，我们旨在量化神经元的目标 - 过程和位置调整在多个任务和状态之间保持一致的程度。为此，我们使用了一项丢弃的交叉验证设计：我们将所有任务分为由四个状态中的每个州跨越的时间段，并使用了除一种任务 - 状态组合以外的所有数据来训练模型。其余的任务 - 状态组合（例如，任务3，状态B）用于测试模型。重复这一点，以使每个任务 - 状态组合被视为测试期一次。使用训练期来计算相对于奖励（五个目标垃圾箱）和每个迷宫位置（九个可能的节点位置）的五个目标进度的平均点火率。边缘被排除在分析之外，因为它们在最早的目标箱中没有系统地访问。目标进度和训练任务状态组合的位置的平均点火率用作（单独的）回归器，以测试测试数据中电池的bined点火速率（固定任务态组合）。我们注意到，此过程仅给每个变量提供一个回归器，其中回归器的值等于训练数据中有关变量的给定垃圾箱中单元格的平均点火率。例如，如果神经元在训练数据中的位置6中以平均速率为0.5 Hz发射，则每当动物位于测试数据中的位置6时，“地点”的回归器的值为0.5。实际上，该分析询问在不同的任务 - 状态组合中将给定神经元调整为变量是否一致。为了评估任何推定的任务调整的有效性，该模型添加了许多潜在的混杂变量。这些是：加速度，速度，奖励时间，距离奖励的距离。对于所有任务 - 状态组合，重复了此过程，并为每个组合重复了一个单独的回归系数值。　　为了评估给定神经元的显着性，将其调整为给定的变量，我们要求它通过两个标准：　　仅通过两种测试的神经元被视为特定变量，并在图2G和扩展数据中报告了图2E。我们注意到，我们在手稿中的其他任何地方都不会使用此调谐状态。在我们取消空间神经元（例如，扩展数据图2J，K和4D，G）的位置，我们故意使用不太严格的空间调整标准来确保即使是弱或残留空间调谐的神经元也被排除在分析之外（这不包括76％的神经元），并确保结果有强大的效果调整。在我们在状态神经元中的子集中，我们使用下面的部分中概述的不同标准。　　为了确定整个人群是否被调整为给定变量，我们执行了两种比例z检验，以评估给定变量具有显着回归系数值的神经元的比例在统计学上高于5％的机会水平。　　为了确定ABCDE任务中目标过程是否也很强，我们执行了与上述ABCD任务完全相同的过程（扩展数据图3B）。此外，为了确定在具有不同抽象结构的任务中是否保存了目标进行调整，我们在经历了ABCD和ABCDE任务的队列上进行了额外的GLM。我们使用了火车测试拆分，ABCDE任务用作培训任务，以确定不同目标垃圾箱和不同位置箱的平均点火率，然后输入这些值以在ABCD任务中执行回归，这些任务被列入了测试任务。我们再次增加了加速度，速度，从奖励和奖励作为共同回19的距离的时间（扩展数据图3F）。　　为了将轨迹调谐的任何神经元从下面的滞后调谐分析中排除，我们还用当前位置和下一步的连接来代替一个单独的GLM。这给出了24个可能的位置位置组合的矢量，它们以与上方调整相同的方式用作回归器。也就是说，训练任务状态组合的位置 - 隔离位置组合的平均发射率被用作测试在测试数据中对电池的bined点火速率进行测试（固定任务状态组合）。这是在回归目标进度，加速度，速度，奖励时间以及与上述奖励距离的距离时完成的。对于所有任务 - 状态组合，重复了此过程，并为每个组合重复了一个单独的回归系数值。然后将平均回归系数与来自排列数据的第95个百分位数（使用上述圆形移动）进行了比较。这是唯一使用的标准，这意味着我们故意宽大地确保在扩展数据中，将任何甚至较弱的轨迹调谐细胞都排除在图8C中。　　对于国家调整，我们首先想测试在给定任务中是否将神经元调节为给定状态。因此，我们分析了与上面的GLM分开调整的状态调整，该调整明确测试了跨任务的一致性。相反，我们使用了z得分方法。首先，我们在每个州和试验中采用了峰值射击率，每次试验给出4个值：即具有尺寸为n×4的最大活动矩阵，其中n是试验的数量。然后，我们将此最大活动矩阵的每一行（即，对于每个试验的平均值为0，标准偏差为1）。然后，我们在所有N试验中提取了首选状态的z得分 <0.05 for a given task were taken to be state-tuned in that task. We also used a more stringent P value of <0.01 to assess whether results where we only use a subset of state-tuned neurons are robust even for highly state-tuned neurons. This is used when assessing the degree of generalization and coherence of neurons across tasks (Extended Data Fig. 4b,e: see ‘Neuronal generalization’) and when assessing invariance of cross-task anchoring (Extended Data Fig. 8b: see ‘Lagged task space tuning’ section below). 　　To visualize and further quantify the structure of neuronal activity in individual tasks, we embedded activity into a low dimensional space using UMAP, a non-linear dimensionality reduction technique previously used to visualize mFC population activity34,49. For this analysis we only used concatenated double days that: (1) had at least 6 tasks; and (2) had at least 10 simultaneously recorded neurons. As input, we used z-scored, averaged, time-normalized activity of each neuron recorded across concatenated double days (see ‘Activity Normalization’) and repeated this for each task. For ABCD tasks, this gave an n x 360 input matrix where n is the number of neuron tasks (each neuron repeated for 6 tasks) and 360 bins represent 4 × 90 bins for each state. This allowed us to assess the manifold structure within (rather than across) tasks. This high-dimensional (n × 360) matrix was then used as an input to the UMAP, with the output being a low-dimensional (3 × 360) embedding. We used parameters (3 output dimensions, cosine similarity as the distance metric, number of neighbours = 50, minimum distance = 0.6) in line with previous studies34,49. 　　The output of this was plotted while projecting either a colour map indicating goal-progress (for example, Fig. 2h, left) or task state (for example, Fig. 2h, right) onto the manifold. This showed a hierarchical structure where goal-progress sequences were concatenated into a floral structure that distinguished different states. To quantify this effect we conducted the UMAP analysis separately for each recording (double) day and measured distances in the low dimensional manifold between: (1) bins that have opposite goal-progress bins and different states (across-goal progress); (2) bins that share the same goal-progress bin but represent different states (within-goal progress); and (3) bins that have the same goal-progress bin but where state identity was randomly shuffled across trials to destroy any systematic state-tuning (shuffled). This latter control was used as a floor to test whether distances between states were significantly above chance (which all analyses show that they were). This analysis showed that bins across different states that share the same goal progress were significantly closer than those across opposite goal progress, providing further support for the hierarchical organization of mFC neurons in a single task into state-tuned manifolds composed of goal-progress sequences. To ensure state-discrimination is not due to any spatial tuning, we repeated this analysis for only non-spatial neurons (excluding even weakly spatially tuned neurons; see ‘Generalized linear model ’; Extended Data Fig. 2j,k). We also repeated the same procedure for data from the ABCDE task (Extended Data Fig. 3g,h). 　　Importantly, these manifolds in Fig. 2 and associated extended data figures pertain to individual tasks. They do not show a manifold that generalizes across tasks. Our findings in Figs. 3 and 5 show that the abstract task structures are not encoded by a single manifold, but rather a number of separate SMBs, each anchored to a different location–goal progress combination. It is not possible to visualize the entire multi-SMB manifold using UMAP or any dimensionality reduction method given that the minimum number of possible anchors (9 locations × at least 3 goal-progress bins = a minimum of a 27-dimensional space) makes the full manifold high-dimensional and hence not amenable to being compressed into a lower number of dimensions. In reality we predict many more modules given the high resolution of goal-progress tuning (Fig. 2c–f) and the fact that spatial anchors are typically multi-peaked, giving a large number of possible spatial pattern combinations and hence many more than 9 possible anchors (for example, Fig. 5g). This forces us to use high dimensional methods like the coherence and clustering analysis in Fig. 3 and the anchoring analysis in Fig. 5 to analyse the SMBs. Another way of stating this is to note that dimensionality reduction techniques are useful when visualizing each time point in the task as a single point in a low-dimensional space. However, we find that each time point in the task is actually represented by multiple points on multiple SMBs, each encoding a lag from a different anchor (Fig. 5). This means we cannot meaningfully plot the full SMB structure using the dimensionality reduction techniques used in the field. A useful comparison point are toroidal manifolds of grid cells in the mEC. Here the torus is only visible when a large number of neurons (>从单个模块中分离出100）。我们原则上可以显示一个SMB的多种多样。但是，鉴于我们要处理的MFC任务模块的数量级比MEC网格模块（通常为6个）高（其中6个）我们需要的神经元产量的订单比目前可在单个MFC模块中获得100+神经元可获得的最佳皮质产率高。　　为了评估单个神经元是否在任务中保持其状态偏好，我们量化了一个任务中神经元和另一个任务中同一神经元之间的角度。在这些分析中仅使用了状态调整的神经元。为了确保我们捕获了坚强的状态调整神经元，我们将分析限制为在记录的任务中有三分之一以上的神经元调整的神经元。在研究状态调整的细胞的整个手稿中都使用此子集。量化神经元之间的角度是通过在任务y中旋转神经元间隔10°来实现的，然后计算旋转的点火速率向量与任务X中的平均点火率向量之间的Pearson相关性。使用这种方法，我们发现了每个神经元的旋转，从而获得了最高相关性。对于交叉任务比较，我们计算了整个人群中角度的直方图，并在两个比较中平均（x对y和x对z）。在任务直方图中，通过将任务X与任务X'进行比较来计算（图3B）。为了计算概括其状态调整的神经元的比例，我们发现了两个比较（x对y和x对z）的最大旋转。然后，我们将所有任务的旋转的每一侧设置为45°作为概括阈值（图3B中的橙色阴影区域）。因为这代表了可能的旋转角度的四分之一，所以机会水平等于m/4，其中m是比较的数量。当在一个比较中计算概括时，机会水平为25％，而进行两个比较时，机会水平为1/16（6.25％）。这个概括的定义说明了强大的目标 - 过程调整，从而确保单个任务对任务比较的“接近零”比例的机会水平为1/4，而对于2个任务任务比较，无论目标 - 过程调整如何。　　也可以在神经元之间的调整关系级别上表达概括。例如，在一个任务中调整为A和C的两个神经元可以在另一个任务中调整为B和D，从而保持其任务空间角度（180°），但在任务跨任务中重新映射。为此，我们计算了对神经元对之间的调整角，并评估了跨任务的一致性。通过通过10°旋转一个神经元的间隔旋转一个神经元并计算神经元K的平均点火载体与神经元j的旋转射击向量之间的相关性来计算该角度。最高的皮尔逊相关性的旋转给出了神经元间的角度（图3C）。因此，我们将任务X中一对神经元之间的角度与任务Y和Z中的神经元之间的角度进行了比较。在两个比较（x vess y和x vess z对z）中，对跨任务直方图的直方图平均，而在任务x与任务x进行比较x'（图3C）计算了任务内部的直方图。为了计算跨任务相干的神经元对的比例，我们发现在两个比较（x versus y和x对z）中，每对之间的角度之间的最大旋转是最大的旋转。然后，我们将所有任务的旋转的每一侧设置为45°作为相干阈值（图3C中的橙色阴影区域）。因为这代表了可能的旋转角度的四分之一，所以机会水平等于m/4，其中m是比较的数量，因此一个比较为25％，两个比较为1/16（6.25％）。这种连贯性的定义说明了强大的目标进行调整，从而确保单个任务对任务比较的“接近零”比例的机会级别为1/4，而对于2个任务任务对比的比较，无论目标 - 过程中，而不是目标 - 策略进行比较。　　该方法通过找到与任务相同的神经元相匹配的最佳旋转来量化重新映射。尽管这主要与视觉上检查点火峰的变化所看到的角度很好地对齐，但在某些情况下（例如，图3A，Neuron 3，session X与z），但“最佳旋转”角度和“峰值峰峰”角之间存在差异。这是因为最佳旋转度量将调整曲线的整个形状考虑在内。因此，当有一个以上大小的峰（例如，扩展数据中的神经元2、4和6）时，峰的大小的小变化是鲁棒的，这将在使用峰进行峰值进行交叉接触变化时计算重新映射角度时会引入重新映射角度时的主要不准确。因此，我们偏爱基于最佳旋转的方法。但是，我们注意到，计算角度的任何歧义都会引入非结构化的噪声，而不是引起诱发错误连贯性的任何偏见。然而，为了使这一点鲁棒化，我们重复单细胞的概括和成对的连贯性分析，同时仅使用两种方法的状态神经元（即使用最佳的旋转分析方法和峰值峰值变化方法）对所有交叉交易进行比较（替代数据图4C，F）。例如，这将排除图3a中的神经元3，在一个跨课程中，当使用最佳旋转与X与z比较中的峰值变化方法时，在一个跨课程中的比较旋转不同。我们表明，即使在这种情况下，相同的结果也会成立：单个神经元不会概括，但对神经元的成对在整个任务扩展数据中部分相干图4C，f。　　为了评估MFC种群是否被组织成相干旋转神经元的模块，我们使用了聚类方法。在琐碎的情况下，所有神经元随机重现，我们期望16个可能的簇。这是因为我们评估了三个任务的聚类，这给出了两个比较（x对y和x对z）。对于每次比较，给定神经元可以重现的4种可能的方法，创建4组（神经元重新映射为0°，90°，180°或270°）。在第二个比较中，神经元可以通过另外四种方式重现。因此，簇的数量为16（即42）。假设重新映射始终是90°的间隔，也就是说，完美的目标调整。实际上，目标过程并不完美，因此在无效状态下预计会有更多的簇。为了避免这样的假设，我们创建一个无效的分布，可以在所有任务中保留神经元的状态调整和目标进行调整，但是每个神经元否则否则否则跨任务随机重新映射。该程序如下：　　步骤1：在所有比较中，对成对的神经元之间的最大差异，并将其转换为最大圆距离（1 - cos（角度）），从而产生一个距离矩阵，反映了神经元之间的相干关系（Incroherence矩阵）。　　步骤2：使用T-分布的随机邻居嵌入（使用Scikit的TSNE函数学习歧管库，具有困惑= 5），计算此不一致矩阵的低维嵌入。　　步骤3：在此嵌入式数据上使用层次聚类（使用Scikit学习群集库的AgrogomerativeClustering函数，距离阈值= 300）。该过程将神经元分为反映神经元之间连贯关系的簇。我们注意到，此分析得出了跨三个任务获得的簇数（模块）的数量，而不是任意大量任务的真实数量的模块数。　　我们通过计算每个记录日计算的群集的轮廓分数来量化聚类的程度：　　其中a =平均群集内距离，b =群集间距离之间的平均值。我们重复了相同的过程，但是对于列出的数据，在所有任务中，任务X和目标过程中的状态调整与真实数据相同，但是每个神经元的状态偏好跨任务随机重新映射。这使我们能够比较真实和排列数据的轮廓得分（图3D）。为了在同一图中可视化簇和内部神经元的调整，我们从单个记录日绘制了一些示例神经元，其中X和Y轴代表态调节，Y轴根据其群集ID（沿Z轴沿Z轴的排序订购是任意的；图3E）。　　任务-SMB模型预测神经元的存在，这些神经元的存在，这些神经元从代表行为步骤的特定锚点（无论任务序列如何）维持不变的任务空间。具体而言，行为步骤是目标进步的结合（在操作上分为早期，中间或晚期）和位置（节点1-9）。为了测试这一预测，我们使用了三种互补分析方法。所有这些分析均在数据上进行了两个记录日并同时进行尖峰分组，每只动物总共提供了六项独特的任务（其中两个例外，每个都有四个和五个任务；请参见“数字”下的排除）。对于所有这些分析，仅使用了状态调整的神经元（请参阅“状态调整”）。　　使用串联天数的主要原因是为概括分析提供足够的动力（在图5中）。本质上，目的是捕获动物访问相同锚点（例如相同奖励位置）但以不同序列访问相同锚点的多个实例。我们可以获得的任务越多，我们就可以在不同的任务序列中采样相同的奖励位置。通过3个任务，总共提出了12个奖励位置（4×3），这意味着9个奖励位置中的每个位置平均在1.33个不同的任务中看到。有6个任务，平均在2.67个不同的任务中经历了奖励位置。这使我们能够以交叉验证的方式以不同的任务序列评估相同的锚点，从而评估滞后的锚定调整是否在跨任务中保存。例如，无论动物现在是否位于位置1还是8。对于非回报的位置，在位置7中的奖励之后，一个神经元将2个状态发射2个状态，这种情况更加复杂，依赖于动物在奖励之间的行为轨迹，但相同的定性原则适用：更多的任务可以使更多的访问访问到给定的行为步骤，作为不同行为序列的一部分。　　方法1：单锚对齐。这种方法假设每个神经元只能具有单个目标播放/位置锚点，并量化该神经元的任务空间滞后在整个任务中保存的程度。我们通过选择目标/地点连词来拟合锚，从而最大程度地提高了一个（训练）任务以外的所有（训练）任务之间的滞后曲线之间的相关性，并通过评估该锚是否导致左输出（测试）任务中的锚固滞后来进行评估。通过首先识别动物访问给定的目标/地点的时间，并对本次访问开始的数据进行了360箱（1个试验），然后平均与给定任务中的所有访问对齐的活动，以及如上所述的平滑活动（在“活动归一化”下）。然后将这种重组的活性在整个任务中进行比较，以计算神经元的平均对齐/归一化触发率向量之间的角度（θ）。这实际上涉及对“神经元概括”的所有步骤，但对于锚定的活动而不是状态A对准活性。这是针对所有可能的任务组合完成的，然后通过距离= 1 - cos（θ）来计算距离矩阵（M）。该距离矩阵M具有尺寸NTRAINing任务×NTRAINing任务×Nanchors（通常为5×5×27，因为通常有6个任务，这意味着使用5个训练任务，而3×9可能的锚点对应于3个可能的目标 - 启动bin（早期，中间和晚期）和9个可能的混乱位置）。然后可以在所有比较中平均距离，以找到给定训练任务给定锚的所有比较之间的平均距离，从而生成平均距离矩阵（MMEAN）。该MMEAN矩阵具有Ncomparisons×Nanchors的尺寸；其中ncomparisons = ntraining任务-1; 通常，这将是4×27。此Nmean矩阵中具有最低值的条目提供了训练任务和目标播放/位置锚的组合，最能使神经元保持一致 - 选择的培训任务被用作参考任务，以进行下面的比较。接下来，将神经元在测试任务中的平均活动保持一致，以访问从训练任务中计算出的最佳锚点。这允许计算该对齐的活动阵列在参考训练任务中相对于对齐活动的重新校准的程度 - 如果它已重现为0°或接近0°（在零的任一侧的45°跨度内），则神经元的锚定（即，与跨任务保持一致的角度保持一致的角度）。对于给定的测试训练拆分，我们计算了所有神经元中角度的直方图，然后我们对所有测试训练拆分的直方图进行平均，以可视化训练和测试任务之间角度的整体分布（例如，图5B）。为了进一步量化对准程度，我们测量了在测试任务与参考训练任务中神经元的锚定位活性与参考训练任务之间的相关性。重要的是，为了说明细胞的强烈目标进行调整，我们仅在计算此相关性时仅考虑神经元在其首选的目标 - 过程中的活性（图5C）。通过发现锚定活性最大的滞后，可以确定神经元的滞后滞后。下面将此滞后用于“预测行为选择”。　　方法2：滞后空间相似性。为了检测假定的滞后任务空间神经元，我们计算了空间调整到过去动物处于不同任务滞后的位置（图5E）。尽管空间神经元应在零滞后的相同位置（s）始终发射，但跟踪目标 - 过程/位置锚的内存的神经元将在过去的非零任务滞后以跨任务的空间相关性显示峰值（图5E）。为了量化这种效果，我们使用了一种交叉验证方法，但使用了所有任务，只有一个任务来计算跨任务空间相关性最大的滞后，然后测量剩余任务中的空间图与该滞后的训练任务之间的Pearson相关性（图5F）。为了说明神经元的强烈目标进行调整，在每个神经元的首选目标进度中计算了所有地图。我们注意到，是在每个神经元的首选目标仓中计算出的点火速率。然后将空间位置得出相同的垃圾箱（即“现在的”），或者在过去的bin中依次进一步（以每个州的3个目标 - 过程箱的分辨率，总共使12个垃圾箱跨越了整个4个州）。　　方法3：型号拟合。对于每个神经元，我们都计算了一个回归模型，该模型将状态调整活动描述为目标 - 过程/位置的所有可能组合以及每个可能的目标 - 过程/地点的所有任务滞后。因此，神经元可以在特定的目标过程/位置连接处开火，但也可以通过此目标制作/地点在任务空间中的特定滞后。我们使用了一个弹性网（使用Scikit Learnear_model软件包中的ElasticNet函数），其中包括正则化项，该项是L1和L2规范的1：1组合。正则化的α设置为0.01。每个神经元总共使用了9×3×12（312）个回归器，对应于9个位置，3个目标式垃圾箱（因此27个可能的目标启动/位置锚点）和锚点中的12个滞后（4个状态×3个目标 - 前进箱）。我们在五个（培训）任务上训练了该模型，然后使用了结果回归系数来预测剩下的（测试）任务中神经元的活性。为了确保我们的预测结果是由于状态偏好而不是目标发展偏好的强烈影响（图2），训练和交叉验证仅在每个神经元的首选目标进度中进行。对于非零滞后神经元，我们仅使用锚固滞后的所有三个最高回归系数值的状态调节神经元（锚定为30°或更多的锚点），在训练任务中，图5H（一个状态）或更多）。同样，对于非零滞后神经元，我们仅使用30°（图5H，右）或90°（扩展数据图8A）的回归系数值，以预测细胞的状态调整。这确保了预测仅是由于滞后活性而不导致的，而不是直接将神经元调整为目标 - 过程/位置连接。　　以上分析将神经元活性模拟为锚固滞后的线性函数。为了研究我们的发现对这个假设的鲁棒性，我们使用使用非线性（对数）链接函数的线性 - nlinlinear-Poisson模型重复了此分析。我们使用了正则化alpha = 1。这种类型的模型传统上用于对神经元的调整进行建模。　　对于扩展数据图2中报道的每个小鼠效应。7e，i和8e，我们测试了平均交叉验证相关性高于0的小鼠的数量是否高于机会，机会水平是均匀的分布（每只小鼠相关平均值的分布50:50）以上和低于零的分布）。我们在此机会水平上使用了单方面的二项式测试。所有七只小鼠都需要为该测试具有平均正值，以产生显着性。　　SMB模型提出，在动物做出特殊选择之前很久，应从特定的记忆缓冲区沿特定的记忆缓冲区的活动颠簸可以预测行为选择。通过“选择”，我们的意思是决定从一个节点转移到迷宫上的一个相邻节点之一（例如，从位置1开始，我应该转到位置2或4？；图6A）。为了测试这些选择是否可以从远端神经元活动中预测，我们使用了逻辑回归模型。在此分析中，我们仅使用始终锚定的神经元，即神经元具有相同的锚固和相同滞后的神经元，以在至少一半的任务中锚定。这取决于单锚分析（图5A；请参见“滞后任务空间调谐”，方法1：单锚定对齐），以找到每个单元格中其首选锚和滞后的锚点。此外，为避免由于简单的空间调节而污染我们的结果，我们仅使用了远离其锚固势的神经元（即整个状态的三分之一（即，在ABCD任务中至少在锚固的任务空间中至少30°）（例如，图6C）的任务中的任何一侧都延伸了（至少为90°）。对于ABCDE任务，等效的“接近零段”周期为24°（一个状态为72°的1/3；扩展数据图9i）。我们测量了给定神经元在其爆发时间的活性，即神经元相对于其锚固滞后的时间。确切地说，这是从锚点开始的滞后时间开始的平均点火率，从锚点到达该点的任务空间30°（状态的1/3）。每次动物处于目标/地点连接时，这项平均活动都是通过试用试验进行的，这是在相关目标/地点锚点之前的一步（例如，如果锚点处于早期目标2处，则可能是可能的目标进度，这是可能的目标/地点，这是：较晚的目标进度是1，即将到达位置1，位置1，位置1，，位置为1，，是一个目标进度。较晚的进球进展3，进球的后期进展为5；参见图1a中的迷宫结构。我们使用这项活动来预测一个二进制向量，该二进制向量在动物访问锚点时将其值为1，而当动物可以访问锚点（即，距离它是一步之遥），但没有选择参观锚点。为了消除自相关先前的行为选择，我们将过去的选择添加到回归模型中。对于图6b，c和扩展数据中的第一个回归分析图9C，我们添加了先前的选择作为单个回归器（每个试验都是自变量矩阵中的列）。一旦我们确定了扩展数据中先前选择的回归系数，我们将指数衰减函数拟合到这些系数上，并在图6中的所有后续回归中使用了该核，图9和扩展数据图9以不同的重量给予了不同的权重，取决于它们发生了多少个试验。这创建了一个单一的回归剂，该回归器过去最多可容纳10个试验。此外，为了评估SMB模型预测的任何观察到的预测是否特定于爆发时间，我们重复了其他控制时间的逻辑回归：随机时间和决策时间（在ABCDE的潜在锚定访问之前，ABCD的潜在锚定访问量为30°，在ABCDE的潜在锚点访问之前）。我们也在从爆炸时间（ABCD任务90°，180°，180°和270°）移动一个状态间隔的时间和（对于ABCDE任务）（72°，144°，216°和288°）。这保留了单元格的目标偏好，但不能保留锚点的滞后，使我们能够测试整个任务空间中锚定的精确滞后是否对于预测未来选择很重要。我们进一步重复了此回归，仅将神经元与锚锚更远端的神经元（即锚的两侧至少90度相距：扩展数据：图9D）而且仅用于访问非零目标 - 过程锚（即非奖励位置：扩展数据图9E – H）。　　为了调查与任务相关的MFC活动的内部组织，我们在包含来自动物家居笼子的床上用品的单独围墙中记录了神经元活动，但没有奖励或与任务相关的提示。在第一个任务开始之前，动物预先备份在这些“睡眠箱”中睡觉/休息。我们在给定的一天和每一次会议之后的任何任务之前均测量了整个睡眠/休息课程的神经元活动。第一次（预任务）睡眠/休息时间为1小时，会议间睡眠/休息时间长20分钟，最后一项任务后的睡眠/休息时间为30-45分钟。除了第一次睡眠课程以外的所有课程都被指定为“任务后”睡眠课程。　　在导致睡眠分析的部分中，我们表明神经元是相对于彼此依次组织的（图2和3），并且相对于锚点（图5）（图5），从这些锚点的固定滞后始终发射。我们通过说明神经元可用于以任务周期为节奏的方式来预测动物的未来选择来进一步显示中小型企业的任务结构（图6）。建立此任务结构化的顺序活动之后，我们的目的是测试：（1）该顺序活动是否内部组织（即，在没有任何结构化任务输入的情况下存在）；（2）内部组织的顺序活动是打开的（创建延迟线）还是封闭（创建环）。　　在250毫秒的垃圾箱中对活性进行了归纳，并使用此bined活性计算了每对神经元之间的互相关。在此分析中，我们仅使用始终如一的锚定神经元，即神经元具有与最佳锚固剂相同的目标/位置连接，并且在至少一半的任务中具有相同的锚点。然后，我们回归了与这种睡眠互相关的相同锚点的神经元对之间的清醒角差。这个角度是从给定的一天的第一任任务中进行的，以进行任务前的睡眠，以及在所有任务后睡眠课程的睡眠会议之前的任务。这个想法是，与较远的神经元相比，在给定的神经元状态空间中，神经元在给定的神经元空间中彼此之间更接近。因此，我们评估了回归系数为负的程度（即较小的距离与较高的相关性相关）。如果从锚点的滞后分布均匀，则向前和圆形距离将是正交的，因此向回归增加向前距离将是冗余的。但是，从锚点中滞后的分布并不统一（扩展数据图7C），因此我们将向前距离增加到回归中，以消除延迟线对结果的任何可能贡献。我们指的是共同锚定的神经元对之间的正向距离。如果神经元内部组织在一条线上，则一对神经元之间的正向距离越大，则两个神经元在神经元状态空间中彼此之间越远，因此它们的共同活性越小（图7a）。圆形距离与前距离的前距离相关 <180 but anti-correlated with forward distance for pairs of neurons with a forward distance of >180，如果状态空间是一个环，则神经元在彼此之间倒退。我们使用线性回归来计算所有始终如一的锚定神经元对共享相同锚的圆形和正向距离的回归系数（扩展数据图10A），以及将这些神经元对共享（图10A），以及将这些神经元对与跨锚的神经元对进行比较时（图7C）。为了控制位置和目标进行调整，我们在回归分析中添加了空间图相关性和循环目标距离。　　为了进一步分析状态空间是否是圆形的，我们比较了在不同的正向距离上的神经元对（共享同一锚）之间的睡眠互相关。如果状态空间是圆形的，则应给出V形曲线，并在最低的前距离和最高向前距离处具有高的互相关，这两个曲线都对应于低圆形距离。换句话说，互相关与前向距离曲线的斜率对于成对向前角应该为负 <180° and positive for angles >180°。延迟线将在所有成对角度都会产生负面的倾斜曲线。与圆形状态空间一致，我们观察到图7d中的V形曲线。此外，为了研究睡眠阶段或睡眠对我们结果的影响的影响，我们在任务前和任务睡眠后（扩展数据图10b）以及自睡眠以来的不同时间进行了相同的分析（扩展数据图10c）。　　我们进一步分析了共有同一锚的神经元是否比具有不同锚固锚的神经元显示出更强的状态空间与睡眠共同关系。我们对共有相同锚的神经元或具有不同锚的神经元的对睡眠互相关进行了圆形距离的回归（图7C）。和以前一样，我们将空间相关性和目标距离进行了协调。　　动物：总共有13只动物用于由3个不同的实验者（A.L.H.，M.E.-G.和A.B.）进行的4个单独的同类群体进行的行为记录 - 这些动物中有4只仅完成10个任务，作为第一个队列的一部分，其余7个完成了至少40个ABCD任务。三只动物执行了额外的ABCD任务，其中50％的试验中省略了奖励A的语气。两只动物执行了其他ABCDE任务。　　在13只动物中，总共7只动物用于电生理记录，其余6只动物在下面占：　　排除：在分析中不包括动物：所有动物（13）均包含在行为分析中，并且在3个任务日（7）中包括电生理信号的所有动物都包含在电生理分析中。　　神经元：我们报告了“神经元 - 天 - ”，也就是说，在整个手稿中总结了每天的神经元产量。　　神经元周的总数：　　补充表1提供了更多细节，其中概述了每种分析的小鼠，记录日，任务，会话，神经元和神经元对的数量以及用于包容的标准。　　有关研究设计的更多信息可在与本文有关的自然投资组合报告摘要中获得。

本文来自作者[yjmlxc]投稿，不代表颐居号立场，如若转载，请注明出处：https://yjmlxc.cn/jyan/202506-5869.html