2026-05-13 每日论文

来源	独立页面
arXiv	arXiv
bioRxiv	bioRxiv
medRxiv	medRxiv

arXiv

标题	作者	发布日期	PDF链接	摘要
覆盖计算机使用的人类动作空间：数据合成与基准测试	Miaosen Zhang	2026-05-12	PDF	计算机使用代理（CUA）可自动化屏幕操作，如GPT-5.4和Claude所示。然而，它们在复杂、低频交互中的可靠性仍然较差，限制了用户信任。我们对先进模型失败案例的分析表明，GUI操作中存在长尾模式，即相对少数的复杂多样交互占据了不成比例的任务失败比例。我们假设这一问题主要源于复杂交互数据的稀缺性。为解决此问题，我们提出新基准CUActSpot，用于评估模型在五种模态（GUI、文本、表格、画布和自然图像）及多种操作（点击、拖拽、绘制等）上的复杂交互能力，覆盖比以往主要聚焦GUI控件的点击中心基准更广泛的交互类型。我们还设计了基于渲染器的数据合成流水线：自动为每种模态生成场景，记录截图和元素坐标，并由LLM生成匹配指令和操作轨迹。在此语料库训练后，我们的Phi-Ground-Any-4B模型性能优于参数少于320亿的开源模型。我们将于https://github.com/microsoft/Phi-Ground.git发布基准、数据、代码和模型。
SenseNova-U1：基于NEO-unify架构统一多模态理解与生成	Haiwen Diao	2026-05-12	PDF	近期的大型视觉语言模型（VLM）仍受制于一个根本性矛盾：理解与生成被视为独立问题，导致架构碎片化、级联流水线以及表征空间错位。我们认为这种割裂不仅是工程实现上的缺陷，更是阻碍原生多模态智能涌现的结构性限制。为此，我们提出SenseNova-U1——基于NEO-unify构建的原生统一多模态范式，其中理解与生成作为单一底层过程的协同视角共同演化。我们发布两个原生统一变体：SenseNova-U1-8B-MoT与SenseNova-U1-A3B-MoT，分别基于密集（8B）和混合专家（30B-A3B）理解基线构建。这些从第一性原理设计的模型在文本理解、视觉语言感知、知识推理、智能体决策及空间智能方面，可与顶尖的纯理解型VLM相匹敌。同时，它们展现出强大的语义一致性与视觉保真度，在常规或知识密集型任意到图像（X2I）合成、复杂文本信息图生成、以及带/不带思维模式的交错视觉语言生成任务中表现优异。除性能外，我们公开了详细的模型设计、数据预处理、预训练/后训练及推理策略以支持社区研究。最后，初步证据表明我们的模型已超越感知与生成范畴，在视觉-语言-动作（VLA）和世界模型（WM）场景中表现强劲。这指向更宏大的路线图：模型不再进行模态间的翻译，而是以原生方式跨模态思考与行动。多模态AI不再是连接独立系统，而是构建统一系统，并信任必要能力将从内部涌现。
EgoForce：基于前臂引导的单目自我中心相机空间3D手部姿态估计	Christen Millerdurai	2026-05-12	PDF	从用户视角通过单颗头戴相机重建手部的绝对3D姿态与形状，对于AR/VR、远程临场及以手部为核心的操控任务中的实用化自我中心交互至关重要，这类场景要求传感设备保持紧凑且不引人注目。尽管单目RGB方法已取得进展，但仍受限于深度尺度模糊性，且难以泛化至头戴设备多样化的光学配置。因此，模型通常需要在特定设备数据集上进行大量训练，而这类数据集的获取成本高昂且耗时。本文通过提出EgoForce框架解决上述挑战，该单目3D手部重建系统能从用户（相机空间）视角恢复鲁棒的绝对3D手部姿态及其位置。EgoForce通过单一统一网络，可兼容鱼眼、透视及畸变广角FOV相机模型。我们的方法结合了可微分前臂表征以稳定手部姿态、统一的手臂-手部Transformer从单张自我中心视图预测手部与前臂几何结构以缓解深度尺度模糊性，以及光线空间闭式求解器实现跨多种头戴相机模型的绝对3D姿态恢复。在三个自我中心基准上的实验表明，EgoForce达到了最先进的3D精度，在HOT3D数据集上相比先前方法将相机空间MPJPE降低28%，并在不同相机配置下保持稳定性能。更多详情请访问项目页面：https://dfki-av.github.io/EgoForce。
从网页到像素：将智能搜索引入视觉感知	Bokang Yang	2026-05-12	PDF	视觉感知将高层语义理解与像素级感知连接起来，但现有大多数设置假设识别目标的决定性证据已存在于图像或冻结的模型知识中。我们研究了一个更实际但更困难的开放世界场景：在定位可见物体之前，必须先通过外部事实、近期事件、长尾实体或多跳关系来解析该物体。我们将这一挑战形式化为"感知深度研究"，并引入WebEye——一个以物体锚定的基准数据集，包含可验证证据、知识密集型查询、精确的框/掩码标注以及三个任务视图：基于搜索的定位、基于搜索的分割和基于搜索的VQA。WebEye包含120张图像、473个标注物体实例、645个独特问答对和1,927个任务样本。我们进一步提出Pixel-Searcher，一种智能搜索到像素的工作流程，可解析隐藏目标身份并将其绑定到框、掩码或接地答案。实验表明，Pixel-Searcher在所有三个任务视图上均达到最强开源性能，而失败主要源于证据获取、身份解析和视觉实例绑定。
CausalCine：多镜头视频叙事的实时自回归生成	Yihao Meng	2026-05-12	PDF	自回归视频生成旨在实现实时、开放式的合成。然而，电影叙事并非单一场景的无限延伸，它需要推进不断演变的事件、视角转换以及离散的镜头边界。现有的自回归模型在此场景下往往表现不佳。这些模型主要针对短程延续进行训练，将长序列视为扩展的单镜头，在长程生成中不可避免地会出现运动停滞和语义漂移。为弥补这一差距，我们提出CausalCine，一个交互式自回归框架，将多镜头视频生成转化为在线导演过程。CausalCine在镜头切换间进行因果生成，实时接受动态提示，并复用上下文而无需重新生成先前镜头。为实现这一目标，我们首先在原生多镜头序列上训练因果基础模型，以在加速前学习复杂的镜头转换。随后提出内容感知记忆路由（CAMR），该机制根据基于注意力的相关性分数而非时间邻近性动态检索历史KV条目，在有限活跃记忆下保持跨镜头连贯性。最后，我们将因果基础模型蒸馏为少步生成器，实现实时交互式生成。大量实验表明，CausalCine显著优于自回归基线模型，在解锁因果生成的流式交互能力的同时，接近双向模型的能力。演示地址：https://yihao-meng.github.io/CausalCine/
AlphaGRPO：通过可分解的可验证奖励解锁UMMs中的自反思多模态生成能力	Runhui Huang	2026-05-12	PDF	本文提出AlphaGRPO框架，将组相对策略优化（GRPO）应用于AR扩散统一多模态模型（UMMs），无需额外冷启动阶段即可增强多模态生成能力。该方法释放模型内在潜力以执行高级推理任务：推理式文本到图像生成（模型主动推断用户隐含意图）与自我反思优化（模型自主诊断并修正生成结果中的偏差）。为解决真实多模态生成场景中稳定监督的挑战，我们提出分解式可验证奖励（DVReward）。不同于整体标量奖励，DVReword利用大语言模型（LLM）将复杂用户请求分解为原子化、可验证的语义与质量子问题，再由通用多模态大模型（MLLM）评估以提供可靠且可解释的反馈。大量实验表明，AlphaGRPO在GenEval、TIIF-Bench、DPG-Bench及WISE等多模态生成基准测试中均取得稳健提升，并在未经过编辑任务训练的情况下，于GEdit编辑任务中实现显著性能增益。这些结果验证了自我反思强化方法能有效利用模型固有理解能力引导高保真生成。项目页面：https://huangrh99.github.io/AlphaGRPO/
重新审视光度模糊性以实现精确的高斯溅射表面重建	Jiahe Li	2026-05-12	PDF	近年来，基于可微渲染的表面重建技术取得了显著进展，但普遍存在的光度歧义性严重制约了现有方法的发展。本文提出AmbiSuR框架，探索基于高斯泼溅的内在解决方案，实现高鲁棒性的光度歧义表面三维重建。通过重新审视基础理论，我们发现表示中存在两种固有的基元级歧义，同时揭示了高斯泼溅在歧义自指示方面的内在潜力。基于此，我们首先引入光度去歧义方法，约束病态几何解以形成明确的表面结构。随后提出歧义指示模块，释放自指示潜力以识别并进一步引导修正欠约束重建。大量实验表明，在多种具有挑战性的场景中，我们的表面重建效果优于现有方法，展现出广泛的兼容性。项目主页：https://fictionarry.github.io/AmbiSuR-Proj/
LongMemEval-V2：面向经验同事的长期智能体记忆评估	Di Wu	2026-05-12	PDF	在专业化的网络环境中，长期记忆对智能体至关重要，其成功取决于能否回忆界面功能、状态动态、工作流程及常见故障模式。然而，现有针对智能体的记忆基准测试主要关注用户历史记录、短时轨迹或下游任务成功率，未能直接评估记忆系统是否有效内化环境特定经验。为填补这一空白，我们提出LongMemEval-V2（LME-V2）基准测试，用于评估记忆系统能否帮助智能体获取在定制化环境中成为知识渊博协作者所需的经验。LME-V2包含451个手工构建的问题，覆盖网络智能体的五项核心记忆能力：静态状态回忆、动态状态追踪、工作流知识、环境陷阱识别及前提意识。每个问题均配有包含最多500条轨迹和1.15亿词元的历史轨迹数据。我们采用上下文收集框架：记忆系统通过处理历史轨迹，为下游问答任务提供紧凑证据。我们提出两种记忆方法：AgentRunbook-R——基于RAG的高效记忆系统，通过知识池存储原始状态观测、事件及策略笔记；AgentRunbook-C——将轨迹存储为文件，并在增强沙盒中调用编码智能体收集证据。实验表明，AgentRunbook-C以72.5%的平均准确率取得最佳性能，超越最强RAG基线（48.5%）和现成编码智能体基线（69.3%）。尽管性能提升显著，基于编码智能体的方法存在高延迟成本。虽然AgentRunbook-C推进了准确率-延迟的帕累托前沿，但仍有较大改进空间。这些结果共同确立了LME-V2作为开发环境经验长期记忆系统的挑战性测试平台。
Pion：一种通过正交等价变换保持频谱的优化器	Kexuan Shi	2026-05-12	PDF	我们提出Pion，一种基于正交等价变换的、用于大语言模型训练的谱保持优化器。与Adam和Muon等加性优化器不同，Pion通过左右正交变换更新每个权重矩阵，在训练过程中保持其奇异值不变。这产生了一种优化机制，能够在保持权重矩阵谱范数固定的同时调节其几何结构。我们推导了Pion的更新规则，系统性地审视了其设计选择，并分析了其收敛行为及若干关键特性。实验结果表明，Pion在大语言模型预训练和微调中，为标准优化器提供了一种稳定且具有竞争力的替代方案。
用于可扩展视觉Transformer的弹性注意力核心	Alan Z. Song	2026-05-12	PDF	视觉Transformer（ViT）通过利用全对全自注意力机制实现了强大的数据驱动扩展能力。然而，这种灵活性带来了与图像分辨率呈二次方增长的计算成本，限制了ViT在高分辨率领域的应用。该方法的核心假设是：成对令牌交互对于学习丰富的视觉语义表征是必要的。在本研究中，我们挑战了这一假设，证明无需任何直接的补丁间交互即可学习有效的视觉表征。我们提出VECA（视觉弹性核心注意力），这是一种采用高效线性时间核心-外围结构化注意力的视觉Transformer架构，通过少量可学习核心实现。在VECA中，这些核心充当通信接口：补丁令牌仅通过核心令牌进行信息交换，核心令牌从零开始初始化并在各层间传播。由于N个图像补丁仅与分辨率不变的C个可学习"核心"嵌入直接交互，对于预设的C值，该方法实现了线性复杂度O(N)，从而规避了二次方扩展问题。与先前的交叉注意力架构相比，VECA保留并迭代更新全部N个输入令牌，避免了小型C路瓶颈。结合沿核心轴的嵌套训练，我们的模型能在推理过程中弹性权衡计算量与精度。在分类和密集任务中，VECA在降低计算成本的同时达到了与最新视觉基础模型相媲美的性能。我们的研究确立了弹性核心-外围注意力作为视觉Transformer可扩展替代构建模块的地位。

bioRxiv

标题	作者	发布日期	PDF链接	摘要
胚胎结构的时间到空间模式化可能涉及时间信息的主动转化，而非直接映射。	Garcia-Guillen, J.	2026-05-13	PDF	胚胎发育中空间模式如何形成，经典解释是法国国旗模型，即细胞通过解读形态发生素浓度阈值获得位置身份。然而在许多发育系统中，空间模式是通过基因表达的时间程序逐步转化为空间组织而涌现的。在短胚带昆虫赤拟谷盗中，产生体节的分节基因周期性表达和建立区域身份的间隙基因非周期性表达，均在胚胎后部依次启动，并以波的形式向前传播。理解这种时间基因表达程序如何转化为空间模式仍是重大挑战。为解决该问题，我们开发了基于杂交链式反应的连续多重成像策略，可在同一胚胎中可视化多达十个前后轴模式基因。通过结合内含子-外显子标记，我们建立了推断前后轴模式形成过程中基因表达动态和传播行为的框架。利用该框架，我们发现间隙基因表达域在组织延伸过程中持续动态变化并继续传播，表明空间模式在整个发育过程中被主动重塑。随后我们直接比较了后部时间基因激活与分节基因和间隙基因最终空间组织的关系。令人惊讶的是，初级分节基因在空间中保留了时间相位关系，而间隙基因则不然。相反，间隙基因表达域的相对位置在向前移动过程中逐渐改变，表明间隙基因的最终空间组织是在传播过程中主动重塑的，而非直接继承自初始时间序列。间隙基因表达域的持续传播行为表明，这种重塑可能源于基因间差异化的传播动力学，和/或模式形成过程中基因调控互作的渐进式重构。这些发现共同揭示，时间到空间的模式化过程可能涉及时间信息的主动转化，而非简单的时间到空间映射。
ContextTAD：基于Hi-C接触图谱的TAD识别中的上下文感知边界学习方法	Long, W.	2026-05-13	PDF	动机：从Hi-C接触图谱中可靠地识别拓扑关联结构域（TAD）在高分辨率和实际测序深度下仍具挑战性。核心原因在于许多识别方法主要从局部信号中学习边界证据，而域兼容性主要在后续解码阶段处理，因此学习到的边界分数并未针对最终决定TAD结果的组装步骤进行显式优化。结果：我们提出ContextTAD，一种深度学习TAD识别方法，能从捕获TAD尺度结构上下文的更广局部Hi-C窗口中学习边界证据。ContextTAD不将边界预测视为孤立的逐bin分类问题，而是利用上下文感知表示生成左右边界轨迹，并针对下游TAD组装进行显式优化。具体而言，该模型结合了二维Hi-C窗口的多尺度特征提取、奖励兼容边界组合的对目标以及正则化窗口级边界证据的计数目标。由于高质量TAD注释的有限可用性，用于TAD识别的监督深度学习方法仍然罕见。为解决这一瓶颈，我们通过整合高覆盖度Hi-C结构与互补的边界相关基因组信号构建了改进的训练注释，从而为模型训练提供更可靠的监督。我们在标准比较评估、测序深度鲁棒性分析和跨细胞类型迁移设置中，将ContextTAD与多种替代TAD识别方法进行基准测试，发现它在广泛设置中表现强劲，对生物学支持的TAD具有最佳整体恢复能力。可用性：https://github.com/ai4nucleome/ContextTAD 联系方式：yanlinzhang@hkust-gz.edu.cn
胶质母细胞瘤中星形胶质细胞的免疫抑制活性依赖于ZEB1，并被CXCL14所拮抗。	Clement, M.	2026-05-13	PDF	胶质母细胞瘤是一种无法治愈且致命的脑癌。免疫疗法为胶质母细胞瘤患者提供了新的有前景的治疗选择，但这些癌症的高度免疫抑制特性构成了棘手的临床障碍。胶质母细胞瘤的免疫逃逸由肿瘤微环境中的细胞间相互作用驱动，近期研究已确定星形胶质细胞是免疫沉默的重要贡献者[1, 2]。细胞可塑性是反应性星形胶质细胞的关键特征，驱动着促炎或抗炎状态的异质性[3]，但星形胶质细胞-免疫相互作用的分子调控机制仍不完全清楚。本研究探讨了胶质母细胞瘤相关星形胶质细胞的细胞可塑性是促进还是抑制肿瘤进展，并发现星形胶质细胞可塑性的丧失会导致T细胞募集和免疫激活。我们通过临床前模型的单细胞测序、体内遗传扰动以及体外小鼠和人类实验系统，评估了星形胶质细胞可塑性如何影响胶质母细胞瘤微环境中的免疫功能。结果显示，胶质母细胞瘤周围的星形胶质细胞表达干细胞相关转录因子ZEB1，而条件诱导性星形胶质细胞特异性敲除Zeb1可显著抑制胶质母细胞瘤生长并延长生存期。在星形胶质细胞Zeb1缺陷小鼠模型中，T细胞募集和激活的增加与免疫趋化因子CXCL14的表达升高相关，而在实验性胶质母细胞瘤模型中通过病毒递送CXCL14可提高生存率。我们的数据支持CXCL14作为重编程肿瘤微环境的候选治疗靶点，能够限制并减缓胶质母细胞瘤的生长与进展。
炎症诱导的表观遗传记忆恢复老年中枢神经系统中少突胶质前体细胞的再生能力	Cabeza-Fernandez, S.	2026-05-13	PDF	尽管由少突胶质前体细胞（OPCs）介导的中枢神经系统（CNS）再生过程——髓鞘再生发生在炎症环境中，但炎症对OPC髓鞘再生能力的长期影响仍不明确。本研究探讨了全身性炎症对成年OPC的短期与长期影响，以评估短暂炎症是否触发OPC中指示炎症记忆的持久染色质重塑。我们观察到脂多糖（LPS）和聚肌胞苷酸（Poly(I:C)）均能诱导长期表观遗传修饰，但仅LPS引发了类似耐受性的记忆。LPS介导的耐受性记忆增强了老年小鼠脱髓鞘后的OPC分化，减少了轴突损伤。我们的发现揭示了OPC对炎症的表观遗传记忆机制，该机制使成年OPC能够适应炎症挑战，有望用于减轻神经炎症并增强衰老及神经退行性疾病中的髓鞘再生效率。
两栖动物发育运动重组中前庭神经元群体的差异成熟	Barrios, G.	2026-05-13	PDF	前庭神经元是前庭-运动功能（如前庭-脊髓反射和前庭-眼反射）通路的核心元件。为满足行为需求，电生理神经元特性会充分适应支撑这些不同前庭反射的感觉-运动计算。在青蛙变态发育过程中，姿势-运动系统发生完全重组，而眼动系统变化极小，这可能与前庭神经元特性迄今未知的变化相关。我们利用这一独特模型，研究前庭相关行为重组背后的中枢发育机制。中枢前庭神经元呈现两种电生理表型：具有持续放电的强直型神经元，以及主要因Kv1.1通道激活而产生短暂放电的相位型神经元。对幼虫和幼蛙阶段前庭脊髓（VS）和前庭眼（VO）神经元的电生理记录及Kv1.1免疫标记显示，大多数VS神经元在幼虫期表现为强直型放电，而在幼蛙期转为相位型放电；而VO神经元在整个发育过程中主要保持强直型。VS群体中相位型与强直型神经元比例的变化部分归因于神经发生。但我们提供的证据表明，电生理表型转换是伴随这些中枢前庭神经元成熟的并行发育机制。综合来看，我们的结果表明，中枢前庭神经元群的成熟过程与其参与的前庭-运动功能在变态诱导下的重塑高度相关，其最终目的是确保神经元元件特性充分适应行为约束的发育变化。
去甲肾上腺素对皮层网络的时空动态调控	Barnes, C.	2026-05-13	PDF	大脑活动与认知表现出状态依赖的波动，这可能反映了包括去甲肾上腺素（NE）在内的神经调节系统的影响。尽管去甲肾上腺素能神经元的活性与睡眠-觉醒周期及瞳孔动态高度耦合，提示其可能作为全局性唤醒信号，但近期证据表明这些细胞可能存在模块化分区。此外，不同神经调节信号是否呈现独特的时空模式尚不明确。我们通过同步双色介观成像技术，分别对大脑新皮层中的NE与钙信号、NE与乙酰胆碱（ACh）信号进行联合观测，并结合高密度电生理记录，探究NE释放与神经活动的关系。研究发现：皮层NE信号模式随行为状态变化，并与功能连接增强相关；NE与ACh的同步成像揭示了两者信号间存在时空动态耦合；睡眠剥夺会破坏NE信号传递及功能连接。综上，我们的研究证明NE提供了一种多模态信号，将行为状态转变与皮层网络交互联系起来。
母体高脂饮食驱动性别特异性小胶质细胞重塑血清素能奖赏回路	Bilbo, S.	2026-05-13	PDF	母体营养影响后代大脑发育，并决定其终生罹患神经系统疾病的风险，但将母体代谢状态与后代行为联系起来的神经环路机制仍不明确。本研究发现，母体高脂饮食（mHFD）会破坏关键出生后窗口期内小胶质细胞与血清素的相互作用，导致中脑边缘环路出现持久且性别特异性的改变。在小鼠模型中，mHFD选择性增加了出生后第14天雄性（而非雌性）后代伏隔核（NAc）中血清素能纤维密度，这与小胶质细胞对血清素（5-HT）投射的吞噬作用减弱同步发生。这种早期过度支配持续至成年期，表现为雄性后代NAc中5-HT释放增加，以及背侧中缝核神经元活动的投射特异性改变。功能上，这些环路改变与奖赏驱动型学习加速相关，而通过化学遗传学激活NAc投射的5-HT神经元可重现该表型。综上，本研究揭示了母体饮食通过小胶质细胞介导的机制，以性别特异性方式编程血清素能环路组装与行为，为早期代谢炎症与终生神经功能之间提供了潜在联系。
断奶后社会隔离诱导伏隔核（NAc）神经元中基因表达改变和组蛋白修饰失调。	You, J.	2026-05-13	PDF	缺乏社交互动会导致啮齿类动物出现多种行为异常，包括焦虑水平升高、社交行为改变和认知能力受损。表观遗传因素调控基因表达，但其如何参与青少年社交隔离（jSI）诱导的行为改变仍不清楚。本研究聚焦于伏隔核（NAc）——奖赏系统中调控动机相关行为的关键脑区。我们首先对神经元细胞核进行RNA测序，发现与神经元功能、转录及表观遗传调控相关的基因发生改变。差异表达基因（DEGs）的蛋白质-蛋白质相互作用（PPI）分析显示，下调基因中的关键节点包括膜受体（Ntrk2、Grin3a和Grik1）及凋亡调控因子（Bcl2）。为探究jSI诱导的基因表达改变是否由组蛋白修饰介导，我们进一步对四种组蛋白修饰（H3K4me1、H3K4me3、H3K27ac和H3K27me3）进行CUT&Tag分析，结果表明表观遗传改变可能参与神经元功能及转录调控。对已发表组蛋白修饰相关因子（包括Kdm6b、Brd4和Setd1a）调控的RNA-seq数据重新分析提示，这些酶可能参与jSI诱导的基因表达改变。综上，我们的综合分析表明组蛋白修饰调控参与jSI相关的NAc基因表达改变。
模拟频谱，而非综合征：中风失语症口语阅读的大规模个体化建模	Staples, R.	2026-05-13	PDF	计算模型是我们理解阅读的神经认知基础的关键。这些模型可以模拟失读症综合征的理想化特征，但在现实中，失读症患者呈现的是多种混合缺陷而非理想化综合征。要构建完整的阅读认知理论，计算模型必须能够解释这种个体差异，然而这一点从未被证实。我们对83名左半球卒中幸存者进行了口语阅读及非阅读性语音和语义加工测试。研究表明，通过对人工神经网络阅读模型施加分级语音和语义损伤，可以模拟个体失读症特征，从而创建代表不同卒中幸存者的匹配模型。匹配模型中语义层和语音层的损伤程度与直接测量的语义和语音加工缺陷高度相关。但我们也发现模型在模拟匹配卒中幸存者的阅读表现时存在系统性偏差。本研究结果支持基于过程缺陷的失读症理论，证实了大规模个体化失读症建模的可行性，并提出了进一步改善模型与人类阅读行为对应性的方法。
行为证据挑战了物种特异性眼部形态作为人类视线追随主要限制的观点。	Shafiei, M.	2026-05-13	PDF	先前研究表明，人类对物体指向性目光极为敏感，这种目光能有效引导注意力转向共同关注的物体。这与非人灵长类动物形成对比——后者通常需要更显著的目光线索才能达到类似的注意定向效果。然而，跨物种的眼部形态差异是否导致这种表现差距尚不明确。为探究此问题，我们通过真实人类或恒河猴头部虚拟形象提供的目光线索，检测了人类空间注意的隐蔽性转移。相较于目光不一致的试验，目标检测在目光一致的试验中显著增强，且两种虚拟形象产生的目光提示效应相当——尽管猴眼缺乏人类眼睛特有的显著特征。因此，眼部形态本身并不会显著调节人类由目光驱动的注意定向，而人类对猴眼目光线索的可靠运用，恰恰凸显了物种间对目光信号感知敏感性的显著差异。

medRxiv

标题	作者	发布日期	PDF链接	摘要
人类严重发热伴血小板减少综合征发生相关环境因素的系统综述	Lee, G.	2026-05-13	PDF	发热伴血小板减少综合征（SFTS）是一种新出现的蜱传病毒性疾病，在老年人中致死率较高，对亚洲地区构成日益严重的公共卫生威胁，且向区域外地理扩散的潜力不断增加。然而，当前防控措施仍主要局限于个体层面的蜱叮咬预防，反映出对维持SFTS传播的生态机制——特别是环境因素如何影响媒介、动物宿主和人群间的传播动态——仍存在认知空白。我们系统回顾了2910项研究，综合分析了环境因素与人群SFTS发病关联的证据。温度、湿度、降水量、海拔和土地覆盖类型与人类SFTS发病始终呈现非线性（常呈倒U型）关联，这凸显了采用能捕捉环境因素固有非线性影响的分析框架的必要性。然而，我们未发现任何关于环境因素如何影响媒介或动物宿主中SFTS发病的定量评估，也未发现针对这些因素在传播周期各阶段作用的阶段性评估，导致蜱-动物-人类界面中多维环境效应被简化为仅基于人类病例的过度简化估算。为填补这些关键空白，未来研究必须优先通过机制建模方法，结合"同一健康"框架下的跨境监测，阐明SFTS传播周期各阶段的环境驱动因素。随着气候和土地利用变化持续重塑媒介栖息地并扩大风险区域，此类研究对于增强生态学认知、指导基于"同一健康"的监测防控策略至关重要，从而减轻SFTS日益增长的跨境疾病负担。
撤回：氧化平衡评分与骨关节炎：基于NHANES、RNA-seq和孟德尔随机化的多组学研究	Liu, T.	2026-05-13	PDF	作者已撤回稿件，原因如下：本研究中骨关节炎的诊断完全基于NHANES问卷中参与者的自我报告，未经影像学检查或临床体格检查确认。我们现在认识到，这种方法存在严重的分类错误偏倚风险，包括非差异性和差异性分类错误，原因如下：参与者可能将骨关节炎与其他关节炎疾病（如类风湿关节炎、痛风和纤维肌痛）混淆。这种误报在健康素养较低的个体中尤为常见，而这类人群在我们的数据集中占骨关节炎组的较大比例。由于缺乏影像学或临床验证，被标记为骨关节炎的研究人群具有高度异质性，不能视为经过验证的病例定义。本研究未按解剖部位（膝、髋和手部骨关节炎）区分骨关节炎。不同部位的骨关节炎具有不同的病理生理机制和风险因素特征，这限制了研究结果的生物学可解释性。这种分类错误偏倚很可能是非随机且差异性的。骨关节炎组中教育水平较低的个体比例更高（初中及以下学历占15.94%，对照组为9.82%），而这一人群更可能误报其诊断。这引入了系统性偏倚，可能高估或削弱观察到的氧化平衡评分与骨关节炎之间的关联，且此类偏倚的方向无法事后确定。鉴于本研究的核心暴露-结局关联（氧化平衡评分与骨关节炎之间），以及后续的转录组学和孟德尔随机化分析，均基于此结局定义建立，我们得出结论：常规修订无法解决这一根本缺陷。因此，需要采用完全不同的骨关节炎诊断和确认策略。据此，我们正式请求撤回本预印本。我们计划使用经过验证的骨关节炎病例定义重新设计研究，并在未来提交全面修订的新版本。因此，作者不希望本作品被引用为项目参考。如有任何问题，请联系通讯作者。
使用人工智能优化间质传感器与毛细血管穿刺在血糖评估与分类中的一致性	Ecker, L. R.	2026-05-13	PDF	引言：血糖监测对糖尿病管理至关重要。连续间质葡萄糖监测系统比毛细血管血糖测量创伤更小，但在高血糖水平时两者一致性下降。人工智能方法，特别是长短期记忆等循环神经网络，已展现出模拟血糖时间动态和校正方法间差异的潜力。目的：开发并验证基于人工智能的模型，使其能够从间质葡萄糖数据预测毛细血管血糖值，改善方法间一致性并优化血糖状态分类。方法：本回顾性观察研究分析了来自已发表匿名数据集的708组配对毛细血管血糖-间质葡萄糖测量值。数据预处理包括卡尔曼滤波、稳健归一化、时间窗口化及通过过采样进行类别平衡。训练具有双输出的长短期记忆模型，同时执行毛细血管血糖回归和血糖状态分类。采用回归指标（平均绝对误差、均方根误差、决定系数）、分类指标（准确率、F1分数）和一致性分析（Bland-Altman）评估模型性能。结果：人工智能模型将平均偏差从+16.27 mg/dL显著降低至-2.08 mg/dL，与原始毛细血管血糖-间质葡萄糖差异相比，一致性界限明显收窄（-129.5至+162.0 mg/dL对比-47.3至+43.2 mg/dL）。高血糖（94.6%）、糖尿病前期（93.7%）和正常血糖（100%）的血糖分类准确率较高，低血糖分类表现较低（66.7%）。结论：基于长短期记忆的人工智能模型展现出从间质葡萄糖测量值预测毛细血管血糖并校正方法间差异的强大能力。这些发现支持将人工智能增强型血糖估算整合到临床监测系统中，以优化治疗决策。
一种能够计算随时间变化测试位置的视野模式空间平均值的线性变化率的方法	Turpin, A.	2026-05-13	PDF	目的：介绍一种在测试模式随时间变化的视野序列中计算空间平均值的线性变化率的方法。方法：首先描述新方法，然后通过模拟50个视野序列验证其性能，其中进展发生在随机位置，测试模式通过每次就诊时添加随机位置而演变。将基于固定24-2模式平均值的线性回归斜率估计值，以及通过新方法在添加测试位置时推导出的斜率，与模拟中的已知真实值进行比较。结果：对于随机视野和随机测试模式，基于24-2模式的MD线性回归斜率与使用新方法在测试模式变化的序列中计算的斜率之间的误差差异小于0.003 dB/年（配对t检验，p < 0.001）。结论：在测试模式随时间变化的视野序列中，可以计算反映真实潜在变化率的空间平均值线性变化率。
前列腺癌侵袭性的种系多基因评分	Xu, G. J.	2026-05-13	PDF	背景前列腺癌（PCa）进展或侵袭性的风险分层通常基于临床病理特征，其中部分特征可能受遗传因素影响。我们开发了一种新型胚系多基因风险评分（PRSagg），用于预测发生侵袭性前列腺癌的可能性。方法 PRSagg基于百万退伍军人计划（MVP）中38,688例前列腺癌患者的数据（仅病例分析），通过全基因组搜索与诊断时前列腺癌分级分组相关的变异位点进行开发。我们使用.632自助法在MVP完整数据集中检验PRSagg与分级分组的关联。在MVP中初始未接受治疗的局限性前列腺癌队列中，我们检验了PRSagg与不良结局（后续发展为分级分组4-5级、转移和/或根治性治疗后生化复发）的关联。外部验证数据来自PRACTICAL联盟患者（n=45,214）和ProtecT随机试验中接受主动监测的参与者（n=316）。每增加一个标准差（SD）的比值比（OR）及95%置信区间经年龄、遗传祖先、既往开发的前列腺癌风险多基因评分（PHS601）和良性前列腺特异性抗原升高多基因评分（PRSPSA）校正后计算。对于转移结局，额外校正了诊断时PSA水平。结果在MVP训练数据集中，PRSagg（172个变异位点）与诊断时更高分级分组（OR=1.53 [1.51-1.56]）及监测期间不良结局风险增加（OR=1.13 [1.09-1.18]）相关。这些发现在外部数据集中得到验证。PRSagg与诊断时更高分级分组的概率增加相关（OR=1.09 [1.06-1.11]）。在ProtecT接受主动监测的参与者中，PRSagg与更高的转移风险相关（OR=2.15 [1.02-3.88]）。在MVP中具有高多基因风险（发生任何前列腺癌）的参与者中，PRSagg高且PSA升高遗传风险低的男性侵袭性疾病风险最高。结论在发生前列腺癌的男性中，常见胚系变异加权总和（PRSagg）与前列腺癌侵袭性独立相关。这些发现可为未来研究胚系因素对肿瘤演化的影响及基于风险分层的主动监测强度提供参考。
整合性全基因组关联研究揭示COVID-19易感性与住院风险位点与长新冠相关	cheng, z.	2026-05-13	PDF	长新冠构成重大公共卫生挑战，其特征是报告有超过200种涉及多个器官系统的症状，而全基因组关联研究（GWAS）因该疾病的症状异质性和现有数据集统计效力有限而受阻。为克服长新冠队列样本量不足或异质性问题，本研究采用基于代理变量的假设生成策略，通过分析COVID-19宿主遗传学倡议（HGI，第7版）中关于COVID-19易感性、住院率及长新冠的GWAS汇总统计数据，优先筛选可能促成长新冠的候选风险位点，最终获得62个由独立单核苷酸多态性（SNP）代表的候选位点。这些SNP根据其与急性期COVID-19的关联分为三组：（1）重症COVID-19特异性SNP，例如映射至SARS-CoV2入侵相关两个已知位点（ACE2 [rs190509934]和TMPRSS2 [rs12329760]）的SNP，以及DPP9（rs7251000）、FOXP4（rs12660421）和HLA-DQA1（rs17219281）的变异，这些位点与重症COVID-19显著相关，但在非住院COVID-19病例中信号较弱；（2）与重症和轻症COVID-19均相关的SNP，包括ABO基因附近的SNP（rs505922）；（3）非住院特异性SNP，如KCTD16（rs62401842）和WASF3（rs56143829）的变异，揭示了轻症COVID-19病例特有的遗传贡献因素。利用HGI近期发布的长新冠GWAS数据对这些候选SNP进行验证，发现大多数候选SNP与长新冠的关联性显著减弱。进一步对48个GTEx组织进行COVID-19住院率/易感性/长新冠GWAS的转录组全关联研究（TWAS）表明，这些候选SNP邻近基因（62个SNP中的43个）在心脏、大脑和肌肉相关组织中的长新冠关联信号相对较弱，尤其值得注意的是DPP9（rs7251000）、CCR1（rs17078348）和THBS3（rs41264915）等显著TWAS靶点，其与长新冠的关联性远弱于急性期COVID-19。全表型组TWAS还发现HLA-DQA1（rs17219281）、HLA-A（rs9260038）、HLA-C（rs1634761）、GSDMB（rs9916158）和FOXP4（rs12660421）与长新冠密切相关的其他表型存在关联。这些结果通过利用急性期COVID-19数据为长新冠研究提供了新见解。
群体规模蛋白质组学技术实现了脓毒症中的自适应数字孪生建模。	Scott, A. M.	2026-05-13	PDF	脓毒症是全球主要致死原因之一。目前，脓毒症的异质性使得患者在急诊入院时难以进行分层，阻碍了精准医学的实施。本研究获取了3009例患者样本的临床参数和血浆蛋白质组图谱，开发了基于数字孪生的脓毒症建模框架。该模型在急诊入院时即可准确诊断脓毒症和感染，同时提供持续性器官功能障碍、死亡率和重症监护室入院的预后预测。此外，模型还能基于患者独特的蛋白质组轨迹提出可治疗性通路建议，确定感染部位和病原体类型，并在急诊入院时识别哪些患者可能从血管升压药治疗中获益。该框架有望推动脓毒症精准医学发展，并为数据驱动的疾病建模和临床决策支持提供通用方法。
检索增强型Claude Opus 4.7和GPT-5.5在核心脏病学委员会备考考试中超越人类表现（且Claude就此起草了一篇论文）	Killekar, A.	2026-05-13	PDF	背景——既往研究评估了大语言模型（LLM）在美国核心脏病学会（ASNC）委员会备考考试中的表现。在缺乏领域特定上下文的情况下，最佳模型（GPT-4o）得分63.1%，低于估计的65%及格线和人类受训研究员（FITs）78%的平均分。提供教科书上下文后，GPT-4o在纯文本题目上提升至73.8%，但仍未达到人类受训者水平。新一代结合检索增强生成（RAG）的LLM能否超越这一差距尚不清楚。方法——Claude Opus 4.7和GPT-5.5分别对2023年ASNC委员会备考考试的全部168道题目（141道纯文本、27道基于图像）进行了5轮测试，使用RAG结合核心脏病学教科书、配套图谱和ASNC临床指南。Claude采用本地FAISS语义检索，GPT-5.5使用Azure云托管向量存储。性能与既往LLM结果及13名人类FITs进行比较。结果——在5轮测试中，Claude Opus 4.7平均准确率为86.3%±1.4%（文本88.8%，图像73.3%）。GPT-5.5平均准确率为86.7%±2.2%（文本88.5%，图像77.0%），但每轮因安全过滤器平均拒绝12.2道题目（7.3%）。两个模型均超过人类FITs平均分（78.0%）和估计及格线。与无上下文的GPT-4o（63.1%）相比，这代表18个月内提升了23个百分点。结论——新一代结合RAG的LLM在核心脏病学委员会备考题目上已超越人类受训者平均水平，表明其在心血管影像学中作为教育工具和知识参考辅助手段具有显著潜力。
通过种系全基因组测序分析不明原因家族性癌症，揭示了多种癌症易感性中介因子。	Fields, N.	2026-05-13	PDF	癌症常因共享环境和遗传因素而在家族中聚集。然而，许多家族性癌症病例缺乏临床确认的致病性胚系变异（PGV）。我们分析了"全民健康研究项目"中2,726名无PGV个体的胚系基因组和家族史，包括18种癌症类型中具有广泛家族史的1,496例病例，以及1,230名无家族史的健康对照。我们发现了罕见的等位基因系列结构变异，这些变异使具有林奇综合征表型的个体中MSH2失活，并在乳腺癌中使BRCA1失活。癌症多基因风险评分在病例中富集，并与家族内癌症诊断模式相关。全外显子组罕见变异分析提名了六个候选易感基因，包括甲状腺癌中的TSTD2和乳腺癌中的BRAT1。总体而言，影响已知基因的多基因风险和罕见变异解释了5%的未明确家族性癌症，当纳入新提名的风险因素时，这一比例增至11%。
上位SNP网络分析（ESNA）：一种用于全基因组高阶遗传相互作用检测的可扩展框架	Zhang, Y.	2026-05-13	PDF	尽管全基因组关联研究已广泛应用于探究人类群体常见性状与疾病的遗传基础，但已发现的关联位点仍无法完全解释估算的遗传力。这种缺失的遗传力可能部分由上位效应或基因-基因相互作用解释。然而现有检测上位效应的方法仅限于成对相互作用和/或靶向基因组区域。本文提出名为"上位SNP网络分析"的新型模型，该模型利用全基因组SNP数据检测高阶上位相互作用。ESNA在并行计算框架中采用无标度网络算法，可识别相关SNP模块（即汇聚于共同生物学通路的潜在互作变异），同时提升计算效率。我们应用ESNA探究CHILD队列研究中学龄前儿童反复喘息和哮喘等呼吸系统结局的上位相互作用。基于1899名儿童775,569个SNP的全基因组数据，ESNA识别出914个SNP网络模块，其中9个模块与2-5岁反复喘息显著相关（P<5.47×10⁻⁵）。此外，这些喘息相关模块中有7个也与5岁前哮喘显著相关（P<5.47×10⁻⁵）。通路富集分析显示，相关模块包含的SNP位于既往与哮喘及细胞应激反应、神经系统发育等生物学过程相关的基因中。与现有基于网络的上位效应检测方法相比，ESNA在计算效率方面实现显著提升：内存使用减少50%，全基因组SNP数据处理速度提升48倍。代码实现与文档详见https://github.com/ComputationalGenomicsLaboratory/ESNA。