长期运动记忆的组合神经代码

微信号：inooooow
不接反杀，想去别人群里开挂，开不了不用加。
复制微信号

　　这项研究基于来自36只小鼠的数据（雄性和雌性小鼠的年龄比第60天的年龄更高）。15只GP4.3小鼠（Thy1-GCAMP6； Jackson实验室，JAX 024275）用于纵向两光子钙成像。其中，由于几天中匹配的神经元数量较少，因此从随后的神经元数据分析中删除了一只小鼠（请参阅“两光子成像数据的预处理”）。使用了五只GAD2-IRES-CRE小鼠（JAX 010802）在家庭笼中进行ALM Photobions。另外五只GAD2-IRES-CRE小鼠仅用于家庭笼中的行为训练。十一只SLC17A7-CRE小鼠（JAX 023527）越过CRE依赖性GCAMP6F记者AI148小鼠（JAX 030328）进行行为训练，但由于行为性能差而没有用于钙成像（扩展数据图1I）。　　所有程序均符合贝勒医学院机构动物护理和使用委员会批准的方案。将小鼠安置在12:12反向的光中：黑暗循环，并在黑暗阶段进行测试。在未测试的天数，小鼠接受了0.5-1毫升的水。在其他日子里，在持续1-2小时的实验课程中测试了小鼠，那里接受了所有水（0.5-1 mL）。如果小鼠没有保持稳定的体重，他们会接受补充水65。所有外科手术均在1-2％的异氟烷麻醉下无菌进行。丁丙诺啡持续释放（1 mg kg -1）和美洛昔康持续释放（4 mg kg -1）用于术前和术后镇痛。去除头皮前，局部给予布比卡因和利多卡因的混合物。手术后，允许小鼠在水限制前自由进入水，至少3天。　　用透明的头骨盖和头杆41,65制备小鼠。去除背骨上的头皮和骨膜。对于GAD2-IRES-CRE小鼠中的ALM光抑制作用，AAV8-EF1A-DIO-CHRMINE-MSCARLET46（Stanford Gene Gene Vector and Virus Core; Titre 8.44×1012病毒基因组（VG）每ML注入左ALM ALM 2.5 mm（BREG MM，BREG MM 1.5 MM，均为0.5 MM）。每个深度）使用带有玻璃移液（20–30 µm直径尖端和斜角）的Nanoliter 2010喷油器（世界精密仪器）。将一层氰基丙烯酸酯粘合剂应用于头骨。将定制的头杆放在头骨上，并用透明牙齿丙烯酸固定在适当的位置。在覆盖整个裸露的头骨的氰基丙烯酸酯粘合剂上施加了一层薄薄的透明牙齿丙烯酸。　　对于在GP4.3小鼠中的两光子钙成像，还在ALM上植入了玻璃窗口。在左ALM上（距Bregma前2.5毫米，侧1.5毫米）进行直径为3.2 mm的圆形颅骨切开术。切除了颅内的硬脑膜切开术。使用光学粘合剂（Norland Products; NOA 61）和UV Light（Kinetic Instruments Inc.; Kinetic Instruments inc。; Spotcure-b6）合并了由两个直径3毫米直径的盖玻片（Warner Instruments; CS-3R）组成的玻璃组件（Warner Instruments; CS-4R）组成的。使用氰基丙烯酸酯粘合剂（Elmer; Krazy Glue）和牙齿丙烯酸（Lang Dental Jet Repair丙烯酸； 1223-Clear），将玻璃窗固定在颅骨切开颅骨颅骨周围的颅骨上。　　先前已经描述了自主式家庭式系统中的行为任务和培训的详细信息43。简而言之，主页（约20×20毫米）位于家用笼子的额叶。头部的两个侧面装有宽阔的轨道，该轨道将定制的头杆（26.5毫米长，宽3.2毫米）带入一个狭窄的间距，在该间距中可以触发两个安装在头端口的侧面。在开关扳机时，通过气动驱动（Festo; 557773）的两个空中活塞（McMaster; 6604K11），以夹住头杆。放置了一个定制的3D打印平台，位于头部车前的家用笼子内。阶段用负载电池（Phidgets; CZL639HD）嵌入，以记录小鼠体重。该体重感应阶段还用于在头部固定过程中检测挣扎并触发自我释放。将一个带有两个Lickspouts（相距5毫米）的Lickport放在头部的前面。每个Lickpout电气耦合到自定义电路板，该自定义电路板通过舔触点时通过完成电路检测到舔脚。41,66。水奖励由两个电磁阀（Lee Company; LHDA1233215H）分配。触觉指令舔任务的感觉刺激是头部右侧的机械杆（直径1.5毫米）。杆通过线性电动机（Actuonix; L12-30-50-12-I）驱动，并在不同的位置呈现以刺激晶须。听觉教学舔任务的感官刺激是由放置在头部载体前面的压电蜂鸣器（CUI设备； CPE-163）提供的纯音（2 kHz或10 kHz）。同一压电蜂鸣器提供了触觉和听觉任务中的听觉“ GO”提示（3.5 kHz）。　　存储在微控制器（Arduino; A000062）上的协议操作了自主型和行为任务的自主训练的小鼠，并进行了光遗传学测试。简而言之，将老鼠放在家里笼子里，可以自由地舔两个舔嘴，这些舔嘴被放置在主笼子里。奖励的Lickpout在左右的Lickspouts之间交替（每次3次），以鼓励在两个Lickpout上舔。训练的这一阶段使小鼠适应了舔小鼠，而舔轻便的小鼠逐渐撤回了远离家用笼子的头部。Lickport缩回持续，直到Lickpouts的尖端距离头部大约14毫米。在这一点上，小鼠只能通过触发头杆触发头固定开关来进入头部手术。在30个成功的自愿头固定开关触发后，激活气动活塞以将开关触发器上的头杆夹住（“自愿头部固定”；图1C）。头部固定训练方案不断增加气动夹具持续时间（从3 s到30 s）。当来自载荷感应平台的体重读数超过上部（30 g）或较低（-1 g）阈值时，这种夹紧会自行发出。在头部固定过程中，小鼠的明显运动通常会产生超过阈值的重量读数的大波动。在训练过程中，对这些阈值进行了动态调整。　　当小鼠通过达到30 s的头部固定持续时间成功执行了头部固定训练方案时，开始了触觉舔任务的下一个训练协议。在触觉指令舔任务中，小鼠使用晶须来区分杆子的位置，并报告了选择选择水奖励41,65的选择（图1D）。将杆呈现在沿前轴相距6 mm的两个位置之一。距右晶须垫约5毫米后极点位置。样品时期定义为杆回缩开始后极点运动到0.1 s之间的时间（样品时期，1.3 s）。跟踪延迟时期，在此期间，小鼠必须将信息保持短期内存（延迟时期，1.3 s）。听觉的“ GO”提示（持续时间为0.1 s）指出了响应时期的开始，而小鼠报告了通过舔两个Lickspouts之一的选择。任务培训有三个子协议，可以分阶段塑造小鼠行为。首先，一个“定向舔”子协议训练了小鼠舔舔和在两者之间切换。然后，一个“歧视”子协议教导小鼠以方向舔报告极点位置。最后，一个“延迟”子协议教会小鼠在延迟时期内预定舔，并逐渐（以0.2 s的步骤）逐渐舔“ GO”提示，以将延迟时期的持续时间提高到1.3 s。在延迟子协议结束时，头固定持续时间从30 s进一步增加到60 s。每20个成功的头部固定后，头部固定持续时间增加了2 s。这样做是为了在每个头部固定中获得更多的行为试验。该程序还调整了每种试验类型的概率，以纠正小鼠的偏差舔。　　首先对小鼠进行一次训练，以一种感觉运动意义（图1B，任务上下文1；前极位置→舔左，后极点位置→右舔右）。然后，将极点位置和舔方向之间的对应关系逆转（任务上下文2；前极位置→舔右，后极点位置→左舔）。在几个月的时间里，小鼠可以根据实验学习多个回合的感觉运动扭转逆转（请参阅“表现逆转的性能标准），并适应成像设置”）。　　对于听觉教学的舔任务，对小鼠进行了训练以执行方向性舔，以报告样品时期呈现纯音的频率（图5B，任务上下文3; 2 kHz（低音调）→舔左，10 kHz（高音调）→向右舔）。诸如延迟时期（1.3 s）和听觉GO CUE之类的任务结构（3.5 kHz，0.1 s）与触觉的舔任务相同。　　对于在家庭笼中进行了光遗传学实验的小鼠，当小鼠达到> 75％正确且 <50% early lick for 100 trials in a given task contingency (Fig. 1e,h). Mice learned multiple rounds of contingency reversals before optogenetic experiment initiated. Optogenetic experiment was manually initiated based on inspections of behavioural performance (Fig. 1h). 　　Mice for two-photon imaging were over-trained in each task context to reach performance criteria of >80-85％的100次试验正确。过度训练转移到两光子设置后，促进了更快的习惯。在老鼠在家庭式训练中获得了高水平的任务性能后，我们将小鼠转移到成像设置中，在这些设置中，他们在两光子显微镜下的每日会话中执行了相同的任务。在此期间，小鼠被单独安装在自动式房屋笼系统之外。需要持续几天的短暂适应期才能习惯小鼠在显微镜下执行任务（扩展数据图1E – G）。一旦小鼠恢复了任务性能（通常> 75％），我们就开始成像会议。在跨多个会话进行成像后，小鼠再次返回自动家庭笼子，他们在其中学习了其他任务。通过这种方式，我们在自动化的家笼和两光子设置之间反复转移小鼠，尽可能长时间（扩展数据图1F，G）。　　对于触觉的舔任务，首先在一个感觉运动意外进行了训练和成像（图3B，任务上下文1）。在两光子显微镜下进行成像后，我们将小鼠转移回了家笼，并逆转了感觉运动意外（图3B，任务上下文2）。在转移到两光量设置之前，将小鼠在新任务偶性中进行了过度训练，以在任务上下文（任务上下文1→2; 10小鼠）之间重新构图相同的ALM种群。在成像后的小鼠子集中，我们在家用笼中的先前偶然性中重新训练了小鼠（图4B，任务上下文1'）。在达到熟练的任务性能之后，我们将小鼠转移到两光子设置中，然后再次成像相同的ALM种群（任务上下文1→2→1'; 5小鼠）。在小鼠的子集中，我们再一次重复一次逆向逆转，并在四个任务上下文中成像（任务上下文1→2→1'→2'； 3小鼠）。　　对于听觉教学的舔任务，在触觉任务上下文1和2中首先对小鼠成像，然后在听觉任务中训练以跨任务上下文训练相同的ALM种群（任务上下文1→2→3; 8 MICE）。　　先前已经描述了家庭笼中ALM光抑制的程序43。通过放置在头载上方的光纤（Thorlabs; M79L005）传递了633 nm激光器（Ultralaser; MRL-III-633L-50 MW）的光（图1G）。病毒注射部位的光刺激是通过透明的头骨。光抑制是一个40 Hz正弦曲线，持续1.3 s，包括光静脉偏移期间100 ms线性坡道，以减少反弹神经元活性67。在样品，延迟或响应时期，光刺激在试验的随机子集中（18％）进行。光刺激始于任务时期的开始。在每个试验中，光刺激功率为2.5、12.5或25 MW。因此，每个光刺激条件的概率为2％（总计9条条件）。头骨表面的光束尺寸为7.07 mm2（直径3.0 mm）。2.5、12.5和25.0兆瓦的功率对应于0.35、1.77和3.54 mW mm -2的光强度。光强度的这一范围远低于先前的研究41,42（通常为1.5 mW，光束直径为0.4 mm，对应于11.9 mW mm -2）。为了防止使用视觉提示将光刺激试验与对照试验区分开，使用627 nm LED在小鼠眼睛附近的所有试验中进行了掩蔽闪光。蒙版闪光始于样品时期的开始，一直持续到可能发生光刺激的响应时期结束。　　使用两个CMOS摄像机（Teledyne Flir； BlackFly BFS-U3-04S2M）从底部和侧视图（扩展数据图1A，B和5E）来测量小鼠的口面运动。底部和侧视图均以224×192像素和每秒400帧获取。老鼠在完全黑暗中执行了任务，并在红外940 nm LED照明下录制了视频（Luxeon Star; SM-01-R9）。自定义的书面软件控制了视频采集68。　　thorlabs bergamo II两光子显微镜，配备有可调飞秒激光器（相干；变色龙发现）由Scanimage 2016a（Vidrio）控制。GCAMP6S在920 nm时感到兴奋。用2×变焦（512×512像素，600×600 µm）以16倍的水浸入透镜（Nikon，0.8 Na，3 mm工作距离）收集图像。对于所有成像会话，我们通过串行扫描五个平面（30或40μm沿Z轴沿Z轴均匀间隔）进行了体积成像，每个平面在6 Hz时进行了体积成像。所有成像平面的深度范围均低于毛皮表面的120-500μm，激光功率范围为80-225 MW，测量在物镜以下。为了识别单个视野（FOV）的空间位置，我们在任务过程中成像之前在pial表面成像（扩展数据图2B）。为了在几天内监测相同的ALM神经元，我们在最浅表成像平面周围以10 µm的间隔保存了6个参考图像，以进行所有成像会话，并根据会话跨会话的目视检查确定了最相似的成像平面。　　在每个任务上下文中，多天都对多个FOV进行了成像。在多个任务上下文中成像相同的FOV。在所有实验中，从第一次成像会话到最后一个成像会话的总持续时间为26-233天（扩展数据图1G； 95.86±71.95天，跨小鼠的平均值±S.D.）。　　绩效计算为正确选择的一部分，不包括早期舔试验和无舔试验。在训练35-40天后的表现从未超过70％的小鼠在任务学习中被认为没有成功（扩展数据图1H，i）。机会表现为50％。通过将光抑制作用与使用配对的两尾t检验的对照试验进行比较（图1i）来量化光抑制的行为效应。为了量化给定任务上下文中任务学习的速度（图1F和扩展数据图1C，6G和10D），我们计算了符合绩效标准> 75％正确的试验数量 <50% early lick for 100 trials. We excluded the trials in the head-fixation training protocol from the initial task learning for a fair comparison. 　　We used DeepLabCut69 to track manually defined body parts. Separate models were used to track tongue and jaw movements (Extended Data Fig. 1a,b). The development dataset for model training and validation contained manually labelled videos from multiple mice and multiple sessions (correct trials only). For tongue network model, 6 markers were manually labelled in 500 video frames. For jaw network model, 5 markers were manually labelled in 300 video frames. The frames for labelling were automatically and uniformly selected by the program at different timepoints within trials. The labelled frames of the training dataset were split randomly into a training dataset (95%) and a test dataset (5%). Training was performed using the default settings of DeepLabCut. All models were trained up to 500,000 iterations with a batch size of one. The trained models tracked the body features in the test data with an average tracking error of less than 2.5 pixels68. 　　To analyse tongue and jaw movements during the response epoch, we defined single lick events based on continuous presence of the tongue volume in each frame44. Tongue volume was determined from the internal area of the four tongue markers (Extended Data Fig. 1a, left), which were located at the corners of tongue. Lick events were separately grouped based on the lick duration for further time-bin-matched correlation analysis. x and y pixel positions of the tongue tip trajectories were calculated by averaging the frontal tongue markers in each frame. x and y pixel positions of the jaw tip trajectories were calculated by averaging the three frontal jaw markers in each frame. For each lick event, we obtained four time series (x position, y position, x velocity and y velocity) for the tongue (or jaw) tip trajectories (Extended Data Fig. 1a,b, middle). To calculate the similarity between the tongue (or jaw) tip trajectories across lick events (within lick left or lick right), we computed Pearson correlation on the time series for all pairwise lick events within and across sessions. We then calculated the average correlation for the four parameters (x position, y position, x velocity and y velocity) and compared them within session and across sessions (Extended Data Fig. 1a,b, right). 　　To examine jaw movements during the delay epoch across task contexts, we calculated the x and y displacement jaw tip position by subtracting the average jaw position in a baseline period (1.57 s) before the sample epoch (Extended Data Fig. 6f). 　　Imaging data were preprocessed using Suite2p package70 to perform motion correction and extract raw fluorescence signals (F) from automatically identified regions of interest (ROIs). ROIs with >1偏度用于进一步分析。Neuropil校正的痕迹估计为Fneuropil_corred（T）= F（T） - 0.7×Fneuropil（T）。为了可视化活动（图1D，顶部和扩展数据图2J，左），在每个试验中分别计算为（f -f0）/f0，在每次试验开始之前，在每次试验开始之前的1.57 s期间，F0是平均的基线荧光信号。对于所有其他分析，我们计算了反浏览活性，以避免跨任务时期的缓慢递减钙动力学的溢出影响（扩展数据图2J）。为了计算反应活性，从所有试验中进行了fneuropil_corrys condecated condenented，将ΔF/F0（2型）计算为（f -f -f0）/f0，其中F0是在60 s滑动窗口内计算为中位数的基线基线。随后，使用OASIS算法48（扩展数据2J）对ΔF/F0（2型）进行反浏览（图2J），在本研究中使用自动退缩模型估算了自动退缩模型的时间常数。在这项研究中，所有分析使用了反浏览活动，除了图2D（TOP）和扩展的数据。1型和2型ΔF/F0在其F0计算中仅差异。　　为了在几天内跟踪相同神经元的活性，使用CellReg Pipeline47将来自同一FOV的单个ROI的空间足迹在不同的成像日对齐。该概率算法计算最近邻居的神经元对与所有其他邻居之间的神经元对之间的质心距离和空间相关性的分布（扩展数据图2G，H）。基于分布之间的双峰性（最近的邻居与其他邻居），CellReg算法计算了估计的假阳性和假阴性概率。通过使每对ROI的两个估计错误率最小化，该概率算法可以识别共注册的神经元并量化这些共同注册神经元的注册分数（扩展数据图2i）。如果质心距离和空间相关模型的平均平方误差高于0.1（预定的超参数），则细胞算法会产生误差，而FOV被认为是在几天中未能找到共同注册的神经元的未发现。由于未能在所有成像过程中发现匹配的神经元，因此从随后的所有神经元数据分析中删除了一只小鼠，这主要是由于成像窗口质量不佳。在共同注册的神经元中，仅在一次成像会议中具有可靠反应的神经元（即，在试验平均和试验型型型ΔF/F0（1型）pear型ΔF/f0（1型）周围时间表图（PSTHS）之间的相关性，该相关性使用第一个与第一个相对于试验> 0.5分析进行了计算。　　在我们在同一任务上下文中跨多个会话中相同的FOV成像的实验中，我们将会话定义为专家 - 和专家及以后的会话（图2）。如果随着时间的流逝，我们对同一FOV进行了成像，则两个会话被定义为专家和专家及以后的会话。如果随着时间的推移，我们从同一FOV进行了2次以上的会话成像，则将专家和专家的会议定义为成对的会议。具体而言，对于单个神经元分析（例如，图2E，K），我们仅比较了第一和第二成像会话，以避免在同一会话中包含重复的数据点。这两个课程分别定义为专家和专家的会议。对于种群水平的活性投影和解码分析（图2i，j），我们包括了所有可能的成对比较。对于每一对，所使用的两个会话分别定义为专家和专家的会议。　　在样本，延迟和响应期间，使用来自不同试验类型的反应活性（非二线两尾t检验，p，p< 0.001; correct trials only). We used the early sample epoch (first 0.83 s, 5 imaging frames), late delay epoch (last 0.67 s, 4 frames), and early response epoch (first 1.33 s, 8 frames) as the respective time windows for the statistical comparisons and all the following analyses (Extended Data Fig. 4a–c). To examine the stability of single neuron selectivity index, we first identified significantly selective neurons in each task epoch. We then determined each neuron’s preferred trial type (‘lick left’ versus ‘lick right’) using the earlier imaging session in task context 1. Next, selectivity index was calculated as the difference in activity between trial types divided by their sum (anterior versus posterior pole position for sample epoch selectivity; lick left versus lick right for delay and response epoch selectivity; correct trials only). To define preferred trial types in earlier sessions, a portion of the trials were used for statistical tests to determine significant selectivity and the preferred trial type, then independent trials were used to calculate selectivity index within the same session. We then calculated selectivity for the defined neurons in later sessions or across different task contexts. 　　For error trial analysis (Extended Data Fig. 2k,l), only the imaging sessions with more than ten error trials for each trial type were analysed. Selectivity was calculated as the difference in trial-averaged activity (deconvolved calcium activity) between instructed lick right and lick left trials, using correct and error trials separately. Selectivity was calculated during the early sample epoch, late delay epoch, and response epoch. 　　To analyse the encoding of trial types in ALM population activity, we built linear decoders that were weighted sums of ALM neuron activities to best differentiate trial types. We examined the encoding of four kinds of trial types: (1) anterior versus posterior pole position trials for stimulus encoding during the sample epoch in the tactile-instructed lick task; (2) low tone (2 kHz) versus high tone (10 kHz) for stimulus encoding during the sample epoch in the auditory-instructed lick task; (3) lick left versus lick right for lick direction encoding during the delay epoch; and (4) lick left versus lick right for lick direction encoding during the response epoch. 　　To build the linear decoder for a population of n ALM neurons, we found a n × 1 vector coding direction (CD) in the n dimensional activity space that maximally separates response vectors in different trial types during defined task epochs—that is, CDSample for stimulus encoding during the sample epoch, CDDelay for lick direction encoding during the delay epoch, and CDResponse for lick direction encoding during the response epoch. To estimate the CD vectors, we first computed CDt at different time points as: 　　where are n × 1 trial-averaged response vectors that described the population response for each trial type at each time point, t, during the defined task epochs. Next, we averaged the CDt vectors within the defined task epoch to separately estimate the CDSample, CDDelay, and CDResponse. CDSample, CDDelay, and CDResponse were computed using 50% of trials and the remaining trials from the same session or from different sessions were used for activity projections and decoding (Fig. 2g; correct trials only). 　　To project the ALM population activity along the CDSample, CDDelay, and CDResponse, we computed the deconvolved activity for individual neurons and assembled their single-trial activity at each time point into population response vectors, x (n × 1 vectors for n neurons). The activity projection in Figs. 2–5 and Extended Data Figs. 3–5, 7 and 9 were obtained as CDSampleTx, CDDelayTx, and CDResponseTx. 　　To decode trial types using ALM population activity projected onto the CDSample, CDDelay and CDResponse (Figs. 2–5 and Extended Data Figs. 4, 5, 7 and 9), we calculated ALM activity projections (CDSampleTx, CDDelayTx and CDResponseTx) within defined time windows and we computed a decision boundary (DB) to best separate different trial types: 　　σ2 is the variance of the activity projection within each trial types. Decision boundaries were computed using the same trials used to compute the CD vectors and independent trials were used to predict trial types. To examine decoding performance across task contexts, we restricted the analysis to decoders with accuracy of >0.7在会议中进行了培训（交叉验证性能）。这是因为，如果解码器首先表现出低的解码性能，则由于解码器的训练不佳，其他会话中的解码性能通常会很低。　　为了分析跨任务环境沿活动空间的其他维度的活动变化，我们使用试用型平均活动定义了“统一的转移（US）AXIS7”：　　其中的n×1响应向量描述了在延迟时期结束时舔左和舔右试验的试验平均响应。我们分别计算了每个任务上下文更改的轴轴，即任务上下文1→2，US1→2，对于任务上下文2→1'，US1'，US1'，US1'→2'对于任务上下文1'→2'（扩展数据图8B）。对于活动投影（扩展数据图8C），使用革兰氏– SCHMIDT工艺将美国轴与CD矢量进行正交，以捕获活动空间的活动变化，而活动空间的尺寸不选择舔方向的活动（“移动irrerevant subspace”）。我们使用50％的试验计算了美国向量，其余50％的试验用于活动投影（扩展数据图8C）。扩展数据中的点产物计算出没有任何正交化的计算。　　用延迟时期的指示定向舔任务对持续两秒钟的模拟进行了建模。模拟的第一秒是样品时期，在此期间提供了特定于特定于试验的外部输入，最后一秒钟是去除输入的延迟时期。编码方向计算为延迟时期（）结束时舔左舔右试验的网络活动之间的差异，类似于神经数据。试验类型始终是通过指示在不同任务上下文（跨意外逆转）中的指示舔方向定义的。　　RNN由50个单位组成，该单元具有由方程式控制的动力学　　神经元I的尖峰速率在哪里，将突触时间常数设置为200 ms，是神经元J到神经元I的突触强度，是试验型（TT）依赖性的神经元I的外部输入，并且是神经激活功能。　　连接矩阵W是从高斯分布中随机初始初始初始初始初始初始初始初始初始初始初始初始初米的将网络缩放为最大特征值等于0.9。为了产生持久活动，网络必须具有大于或等于一个的特征值。与特征值初始化的网络大于一个倾向于学习具有高维持续活动的任务，这与ALM Dynamics14不一致。用特征值初始化少于一个倾向于产生较低维度的持续活动。　　外部输入强度是从平均等于零和s.d的高斯分布中得出的。0.3。两个不同的输入向量用于前极和后极位置试验。　　行为读数B由线性投影给出，延迟时期结束时的时间是高斯随机读取向量，分别对应于向右和向左运动。　　通过时间（BPTT）使用反向传播对RNN进行了训练。输入（）和读数重量（和）是固定的，并且仅对RNN内部的复发权重进行了训练。对于每种试验类型，沿正确的读数方向进行了训练的活动，以匹配从样本时期开始开始的活动坡道，并且对不正确的读数方向进行了训练以零激活。对于任务上下文1，表现与沿着渐变和零激活相关，呈现与相反的行为有关。这些关联是针对任务上下文2的逆转。对100次迭代的网络进行了培训。　　在RNN中，行为读数依赖于许多单位（密集和）。因为AFF网络中只有2个单位导致行为输出，因此读数的这种差异可能会影响这些网络如何学会产生反向输出。因此，我们还测试了RNN，其中我们将行为读数固定到只有2个单位（例如AFF网络）（稀疏和），但所有结果都保持不变。　　ALM电路包含AFF电路图案54。AFF网络是一个复发电路，在该电路中，延迟时期期间的准备活动通过一系列活性状态。每个活动状态可以建模为前馈网络中的一层。此外，网络中的晚层通过反馈连接连接到早期层。在这里，我们为培训AFF网络开发了一个框架，以生成选择性选择性的持久活动。　　在详细介绍用于培训AFF网络的学习规则之前，我们首先介绍了几个功能，这些功能使AFF网络有利。训练神经网络需要将输入单元连接到输出单元进行计算的途径，以及将输出与学习输入联系起来的途径。在最简单的情况下，输出输入反馈可能会干扰输出计算的输入。AFF网络和一般的非正常网络不会产生回荡的反馈。因此，可以通过单独的通道构建双向输入将输入链接到输出的AFF网络。　　AFF（通常也称为非正常）网络是通过将正顺序转换应用于纯粹的前馈网络来构建的。往馈电网络的正同质转换具有两个有用的解剖目的：（1）它们形成了从晚层到早期层的反馈连接；（2）它们形成稳定的兴奋性/抑制连接，以消除新形成的反馈连接可能导致的任何混响。在此模型中，我们使用从晚层到早期层的反馈连接来传达性能反馈信号，允许AFF网络通过错误反向传播学习。　　我们首先构建了一个纯粹的前馈网络，其中4层称为输入（n; 30个单位），隐藏的第1层（H1; 200单位），隐藏的第2层（H2; 5个单位）和输出（O; 2个单位）（扩展数据图11）。仅向输入层提供试验类型（TT）依赖性外部输入。前馈连接矩阵（和）将这些输入传达给下游层，并从均匀的正分布中初始化。接下来，我们添加了从O到H2（）以及H2到H1（）的反馈连接，以提供训练前馈连接的性能反馈。反馈连接与馈电连接匹配，以便。这些反馈连接提供了脚手架，以精确地实现错误反向传播以训练前馈连接。但是，电路中的反馈连接的存在将向网络引入反馈，这将干扰其前馈计算。　　为了取消此反馈引起的混响，我们结合了其他稳定层S1（200个单位）和S2（5个单位）（扩展数据图11）。H1层中的每个隐藏单元都与稳定层S1中的稳定神经元相匹配，该神经元与其配对的兴奋性神经元相同的反馈连接，并计划与兴奋性伴侣相同强度的抑制连接。同样，H2中的每个神经元在S2中具有相应的单元。从数学上讲，这种关系被写成　　和　　由于精确平衡的激发和抑制作用，这种复发网络是非正常的。所有特征值等于零。这个非正态网络具有两个独立的途径，一个将输入层连接到输出层，可用于计算。另一个将输出层链接到输入层，可用于学习。　　使用错误反向传播对网络进行训练；计算一个错误信号，然后将输出层中的每个单元发送回每个单元。反馈连接将此错误信号传达给早期层。稳定网络可确保此错误信号不会回荡。因此，方程式给出了隐藏层H1和H2中神经元中的反向传播信号　　与错误的回传中一样，通过获取前向通行活动和向后传球活动的乘积来更新前馈权重（即）。例如，H1层中的神经元I连接到H2层中的神经元J，根据规则进行更新　　该规则应用于所有馈电连接（即，和）。更改前馈权重必须破坏网络中的精确平衡。为了保持稳定性，必须更新稳定的重量以精确取消进料重量的更改　　基于此方程的补偿权重变化应用于稳定层中的所有连接（即，也是）。　　对AFF网络进行了培训，可以与RNN建立相同的关联。与RNN不同，AFF利用线性神经元激活（），因此动态受方程式控制　　此外，由于AFT自然会生成坡道信号54，因此未对输出单元进行训练以匹配始终的坡道信号，而是经过训练以在延迟结束时在特定级别上激活。例如，在前试验中，舔右输出单位（TR）的舔右输出单元（TR）的目标为TR（t = 0）= 6，TR（t = 0）= 0。　　对于每个网络，我们将每个单元的选择性计算为在每个任务上下文中舔右和Lick左试验之间的活动差。我们使用单数值分解（SVD）计算了网络选择性矩阵的特征向量。SVD的数据是n×t矩阵，其中包含n个单元在t时箱中的选择性（从任务上下文1和2中选择性的选择性）。三个向量通常在两个任务上下文中捕获了大多数网络活动差异（扩展数据图11F）。然后，我们旋转了3个特征向量，以使第一个向量与任务上下文之间的网络选择性矩阵的差异对齐。投影在第二个矢量上的网络活动与跨任务上下文的网络输出相关，并在延迟时期表现出渐变活动，因此称为输出模式（扩展数据图12a，b）。　　为了检查跨任务上下文的CDDELAY重组，这是刺激模式强度的函数（扩展数据图12C），我们总结了跨时间在刺激模式下投射的网络活动。将此活性强度标准化为每个网络的平均活性，以实现在不同网络之间进行比较。　　样本量与现场使用的样本量相似：用于行为和两光子钙成像，每个条件三只小鼠或更多。没有使用统计方法来确定样本量。在多只小鼠中复制了所有关键结果。根据他们的菌株或实验者将小鼠分配给实验组。除非另有说明，否则研究人员在实验和结果评估过程中不会对小鼠组分配视而不见。试验类型是由计算机程序随机确定的。上面描述了使用t检验和其他统计检验的统计比较。除非另有说明，否则所有统计数据均为双面。我们将Pearson的相关性用于线性回归。误差线表示平均值±S.E.M.除非另有说明。图2C和扩展数据中的代表性图像图2a，c，d均在所有FOV中重现（n = 78个视野，14只小鼠）。　　有关研究设计的更多信息可在与本文有关的自然投资组合报告摘要中获得。

本文来自作者[yjmlxc]投稿，不代表颐居号立场，如若转载，请注明出处：https://yjmlxc.cn/life/202506-4853.html