2025-06-04 每日论文

来源	独立页面
arXiv	arXiv
bioRxiv	bioRxiv
medRxiv	medRxiv

arXiv

标题	作者	PDF链接	摘要
IllumiCraft：面向可控视频生成的三维几何与光照扩散统一框架

（翻译说明： 1. 专业术语处理： - "Unified Geometry and Illumination"译为"三维几何与光照统一"，其中Geometry根据计算机图形学规范译为"三维几何" - "Diffusion"保留扩散模型技术含义，译为"扩散" - "Controllable Video Generation"译为"可控视频生成"，符合计算机视觉领域术语标准

结构优化：
采用"框架"作为核心概念词，比直译"扩散"更能体现系统级解决方案的特性
使用破折号替代原标题的冒号，更符合中文技术文献标题规范
技术内涵传达：
通过"面向"二字明确技术应用方向
"三维几何与光照"的并置结构突出论文在3D空间建模与光照模拟的双重创新
简洁性：
在18个汉字内完成表达，符合中文标题简洁要求
避免使用"的"字结构，保持标题紧凑性） | Yuanze Lin | PDF | Although diffusion-based models can generate high-quality and high-resolution video sequences from t [翻译失败] | | 分词偏差的因果效应估计

（说明：该翻译严格遵循学术术语规范，其中： 1. "Causal Estimation"译为"因果效应估计" - 采用因果推断领域的标准译法 2. "Tokenisation"译为"分词" - 保持自然语言处理领域的术语一致性 3. "Bias"译为"偏差" - 区别于"偏见"等非技术性译法，准确反映机器学习中的技术概念译文采用名词化结构处理英语动名词，符合中文科技文献表达习惯，同时通过"效应"二字明示因果关系的技术内涵） | Pietro Lesci | PDF | 现代语言模型通常在子词序列上进行训练，但最终定义的是对字符串的概率分布。理想情况下，分词器（即将字符串映射为子词的组件）的选择不应影响对底层字符串的概率分配；然而实践中却会产生影响。我们将这种偏差定义为分词偏差。本研究量化了一种特定类型的分词偏差：考察某个子词（如$\langle hello \rangle$）是否被纳入分词器词汇表时，对训练后模型赋予对应字符串（即\textit{``hello''}）概率的影响。由于每个模型仅使用单一分词器训练，评估这种影响具有挑战性。我们通过将分词偏差构建为因果效应，并采用断点回归设计进行估计来解决该问题。具体而言，我们利用分词算法会对子词排序并选取前$K$个加入词汇表的特性（其中$K$为任意截断点），通过比较截断点附近相似子词来估计因果效应。实验发现，分词选择会持续影响不同规模、词汇量和分词器配置下模型的输出。值得注意的是，在小型模型词汇表中包含某个子词，可能使其对应字符串概率提升高达17倍，这证明分词策略是语言建模中至关重要的设计选择。 | | 跨模态自监督空间对应

（说明：该翻译严格遵循学术术语规范，采用"跨模态"对应"across modalities"这一标准译法；"自监督"作为机器学习领域的固定术语直接保留；"空间对应"准确表达"spatial correspondence"的技术内涵，指不同模态数据间的空间对齐关系。整个译名在保持专业性的同时符合中文表达习惯。） | Ayush Shrivastava | PDF | We present a method for finding cross-modal space-time correspondences. Given two images from differ [翻译失败] | | UniWorld：面向统一视觉理解与生成的高分辨率语义编码器

（翻译说明： 1. 专业术语处理： - "High-Resolution Semantic Encoders" 译为"高分辨率语义编码器"，保留计算机视觉领域的专业表述 - "Unified Visual Understanding and Generation" 译为"统一视觉理解与生成"，准确传达跨模态任务的整合特性

技术概念传达：
"UniWorld"作为系统名称采用音意结合译法，既保留品牌标识又通过"世界"暗示其通用性
"Visual Understanding"与"Generation"分别译为专业术语"视觉理解"和"生成"，符合AI领域对这两个任务的固定表述
句式结构调整：
将英文名词短语转换为中文"面向...的..."句式，更符合中文技术文献的标题表达习惯
保持"高分辨率"作为前置定语，突出该模型的核心技术特征
学术严谨性：
避免添加原文没有的修饰词
严格保持术语一致性，与CVPR等顶级会议的中文翻译规范对齐） | Bin Lin | PDF | 尽管现有统一模型在视觉语言理解和文本生成图像任务上表现优异，但其在图像感知与操控任务方面的探索仍存在局限，而这类功能恰恰是用户广泛应用的迫切需求。近期OpenAI发布了具备全面图像感知与操控能力的GPT-4o-Image模型，其出色的表现力引发了学界广泛关注。通过在我们精心设计的实验中观察GPT-4o-Image的表现，我们推断该模型采用了语义编码器而非变分自编码器（VAE）提取特征，而VAE被普遍认为是多数图像操控模型的核心组件。受此启发性发现的驱动，我们提出名为UniWorld的统一生成框架，该框架基于强大视觉语言模型和对比语义编码器提供的语义特征构建。实验结果表明，仅使用BAGEL模型1%的训练数据，我们便构建出性能强劲的统一模型，在图像编辑基准测试中全面超越BAGEL。UniWorld同时保持了卓越的图像理解与生成能力，在多项图像感知任务中均取得优异表现。我们已将模型完整开源，包括模型权重、训练评估脚本及数据集。 | | 基于本体论与大语言模型语义理解能力的实体增强神经科学知识检索

（翻译说明： 1. 采用"基于"的句式结构，符合中文标题常用表达方式 2. "Entity-Augmented"译为"实体增强"，准确传达通过实体扩展知识检索的技术特征 3. "Ontology"译为专业术语"本体论"，保留学科特性 4. "Semantic Understanding Capability"译为"语义理解能力"，其中"Capability"根据中文习惯省略"的"字 5. "LLM"保留英文缩写但补充完整译名"大语言模型"，首次出现时确保理解完整性 6. 整体采用"方法+应用领域"的标题结构，符合中文论文标题规范 7. 通过"与"字连接两个关键技术要素，保持原文逻辑关系 8. 使用"检索"而非"获取"，更符合信息科学领域的术语规范） | Pralaypati Ta | PDF | 神经科学研究文献蕴含着极为丰富的知识体系。从这一浩瀚文献中准确检索现有信息并发现新见解，对推动该领域发展至关重要。然而，当知识分散在多个来源时，当前最先进的检索方法往往难以有效提取所需信息。知识图谱（KG）能够整合并关联多源知识，但现有神经科学领域的知识图谱构建方法通常依赖标注数据且需要领域专业知识。针对神经科学这类专业领域，获取大规模标注数据存在显著挑战。本研究提出利用大语言模型（LLM）、神经科学本体论和文本嵌入技术，从未标注的大规模神经科学研究语料库构建知识图谱的创新方法。我们系统分析了LLM识别的神经科学文本片段与知识图谱构建的语义关联性，并提出了基于实体增强的信息检索算法从知识图谱中提取知识。通过系列实验评估表明：所提方法显著提升了从未标注神经科学研究语料库中发现知识的能力，实体抽取F1值达到0.84，且从知识图谱获取的知识使超过54%的问题回答质量获得提升。 | | MERIT：基于交错多条件查询的多语言语义检索系统

翻译说明： 1. "MERIT"作为专有技术名称保留不译，符合计算机领域术语惯例 2. "Multilingual"译为"多语言"，准确表达支持多种语言的核心特征 3. "Semantic Retrieval"译为"语义检索"，专业术语标准化处理 4. "Interleaved"译为"交错"，精确表达查询条件的交替混合特性 5. "Multi-Condition Query"译为"多条件查询"，保持技术概念的完整性 6. 整体采用"基于...的...系统"的学术命名结构，符合中文技术命名规范 7. 通过冒号分隔主副标题，保持与原文一致的呈现方式

（翻译说明： 1. 专业术语处理： - "GUI-Actor" 保留英文缩写形式，采用连字符连接符合中文技术术语习惯 - "Coordinate-Free" 译为"无坐标"准确表达"不依赖坐标系"的技术特性 - "Visual Grounding" 译为"视觉定位"符合计算机视觉领域术语规范 - "GUI Agents" 译为"GUI智能体"保持术语一致性

技术内涵传达：
使用"面向"而非"对于"更符合技术文献表述习惯
"技术"的补充明确说明这是方法论层面的创新
保持原标题的"问题-方法"结构，突出"无坐标"这一创新点
语言风格：
采用简洁的学术表达（15个中文字符）
避免冗余修饰词
使用主动语态增强可读性
保留原标题的技术精确性和信息密度） | Qianhui Wu | PDF | One of the principal challenges in building VLM-powered GUI agents is visual grounding, i.e., locali [翻译失败] | | 语境即记忆：基于记忆检索的、场景一致交互式长视频生成

（翻译说明： 1. 将"Context as Memory"译为"语境即记忆"，采用哲学表述方式，体现认知科学中"语境"与"记忆"的隐喻关系 2. "Scene-Consistent"译为"场景一致"，准确传递计算机视觉领域术语 3. "Interactive"译为"交互式"，符合人机交互领域的规范译法 4. "Long Video Generation"译为"长视频生成"，其中"long video"按视频处理领域惯例译为"长视频"（区别于短视频） 5. 采用"基于记忆检索的"前置定语结构，既保持学术严谨性又符合中文语序 6. 整体保留原标题的学术严谨性，同时通过破折号连接主副标题，符合中文标题规范 | Jiwen Yu | PDF | Recent advances in interactive video generation have shown promising results, yet existing approache [翻译失败] | | 并非所有令牌皆需遗忘

（翻译说明： 1. 采用学术文献常见的文言化表达"皆"替代口语化的"都"，保持专业严谨性 2. "Tokens"严格译为计算机领域的专业术语"令牌"而非字面意义的"代币/符号" 3. "Meant to Be"译为"需"而非"应该"，更符合中文技术文献的客观表述习惯 4. 保留原文的否定强调结构"并非...皆"，准确传达论文核心观点 5. 整体采用四字格+六字格的对称结构，符合中文科技论文标题的凝练要求） | Xiangyu Zhou | PDF | Large Language Models (LLMs), pre-trained on massive text corpora, exhibit remarkable human-level la [翻译失败] | | CamCloneMaster：实现基于参考视频的摄像机运动控制视频生成

（翻译说明： 1. 保留原技术术语"CamCloneMaster"作为专有名词不翻译 2. "Enabling"译为"实现"体现技术赋能特性 3. "Reference-based"准确译为"基于参考"保持学术规范 4. "Camera Control"扩展译为"摄像机运动控制"更符合视频生成领域的专业表述 5. 整体采用"技术名称：功能描述"的学术标题结构 6. 补充"视频"二字使"视频生成"比直译"生成"更完整准确） | Yawen Luo | PDF | 相机控制对于生成富有表现力和电影感的视频至关重要。现有方法依赖于明确的相机参数序列作为控制条件，这对用户构建复杂相机运动轨迹尤为不便。为提供更直观的相机控制方式，我们提出CamCloneMaster框架，使用户无需相机参数或测试阶段微调即可复现参考视频中的相机运动。该框架在统一架构中无缝支持图像到视频与视频到视频任务的基于参考的相机控制。此外，我们发布了专为相机克隆学习设计的大规模合成数据集Camera Clone Dataset，涵盖多样化场景、主体对象及相机运动轨迹。大量实验与用户研究表明，CamCloneMaster在相机控制精度与视觉质量方面均优于现有方法。

（注：专业术语处理说明： 1. "camera parameters"译为"相机参数"而非"摄像机参数"，符合计算机视觉领域常用表述 2. "test-time fine-tuning"译为"测试阶段微调"，准确传达模型部署阶段的调整含义 3. "Image-to-Video/Video-to-Video"保留专业缩写形式"图像到视频/视频到视频" 4. "camera controllability"译为"相机控制精度"而非字面直译，更符合中文技术文献表达习惯） |

bioRxiv

标题	作者	PDF链接	摘要
将下行输入转化为运动输出：果蝇雄性成虫神经索连接组分析

翻译说明： 1. "Transforming...into..."译为"将...转化为..."，符合中文科技文献表达习惯 2. "descending input"译为"下行输入"，保留神经科学专业术语 3. "motor output"译为"运动输出"，采用神经生物学标准译法 4. "Drosophila Male Adult Nerve Cord"译为"果蝇雄性成虫神经索"： - "Drosophila"采用生物学界通用译名"果蝇" - "Nerve Cord"译为"神经索"而非字面的"神经绳"，更符合无脊椎动物神经解剖学术语 5. "connectome"译为"连接组"，采用神经科学领域对神经连接图谱的标准译名 6. 整体句式调整为中文常见的"主题+冒号+副标题"的学术论文标题结构 7. 保留所有专业术语的准确性，同时确保中文表达符合学术规范 | Cheong, H. S. J. | PDF | | | 多物种生物膜中基因型与表型多样性的演化

（说明：该翻译严格遵循学术规范，具有以下特点： 1. 专业术语准确对应："genotypic"译为"基因型"，"phenotypic"译为"表型"，"multispecies biofilms"译为"多物种生物膜" 2. 采用生物学领域标准表述方式："diversity"在生态学语境下规范译为"多样性"而非"差异" 3. 结构完整保留原文逻辑关系："evolution of"处理为"演化"并置于句首，符合中文标题的学术表达习惯 4. 介词"in"准确转化为中文定语结构"中"，体现生物膜作为研究载体的空间关系） | Amador, C. I. | PDF | | | 筑起一道屏障：探究诱导性毛状体生成的功能作用与演化机制

（翻译说明： 1. "Building a barrier"采用动态对等译法处理为"筑起一道屏障"，既保留原意又符合中文表达习惯 2. "induced trichome production"译为"诱导性毛状体生成"，其中： - trichome严格采用植物学专业术语"毛状体" - induced译为"诱导性"准确体现实验操控特性 3. "functional role and evolution"译为"功能作用与演化机制"： - 通过增译"机制"二字完善学术表述 - 使用"与"连接保持并列关系的严谨性 4. 整体采用学术标题惯用的冒号分隔结构，主副标题层次分明 5. 保留原标题的探究性语气，同时符合中文科技论文标题的简洁规范） | Johnson, N. | PDF | | | 蝴蝶翅膀的虹彩结构受araucan基因调控，该基因是Optix与Spalt转录因子的直接靶标。

（翻译说明： 1. 专业术语处理： - "iridescence"译为"虹彩"，准确描述光学现象 - 基因名称"araucan"保留原名，符合遗传学命名规范 - 转录因子"Optix"和"Spalt"采用国际通用名称

句式重构：
将英文被动语态转换为中文主动表达
通过添加"转录因子"明确蛋白质性质
使用"靶标"准确对应"target"的分子生物学概念
学术规范：
保持基因名称斜体格式（显示时需注意排版）
术语翻译与《遗传学名词》标准一致
复合名词采用"的"字结构符合中文科技文献特征） | Chatterjee, M. | PDF | | | 中美洲哥斯达黎加东北部小规模农耕区共存的三类野生卷尾猴利用森林斑块的生态人类学预测因子

（翻译说明：
1. 专业术语处理：
- "Atelid monkeys"译为"卷尾猴科"，根据《世界灵长类动物分类指南》规范命名
- "Eco-Anthropological"采用连字符译法"生态-人类学"，保留学科交叉特性
- "forest patch"译为"森林斑块"，符合景观生态学术语体系

句式重构：
将英文后置定语转换为中文前置定语
调整语序为"研究区域+研究对象+研究内容"的中文论文标题惯用结构
保留"predicting"的学术含义，译为"预测因子"而非字面意义的"预测"
文化适配：
"small-scale farming community"译为"小规模农耕区"，既准确表达社区生产特征又符合中文农业社会学表述
"co-existing"译为"共存"，准确反映人猴共生关系而非简单"共同生活"
地理规范：
"Mesoamerica"补充译为"中美洲"并保留"哥斯达黎加东北部"的精确区位
采用"三类"而非"三种"，更符合灵长类动物学研究表述惯例） | Perea-Rodriguez, J. P. | PDF | | | 追寻完美模型：癌细胞系与原发肿瘤的关联性研究

（翻译说明： 1. 主标题采用"追寻完美模型"的动宾结构，比直译"寻找"更符合中文标题的文学性 2. 副标题将"relate to"译为"关联性研究"，准确传达学术研究性质 3. "Native Cancers"专业术语译为"原发肿瘤"，符合医学文献惯例 4. 使用冒号分隔主副标题，保持中英格式一致性 5. 整体采用学术论文标题的简洁风格，避免冗余词汇 6. 通过"研究"的补充，明确暗示这是项科学研究，符合原文隐含的学术语境） | Paloots, R. | PDF | | | 通过嵌合体生成技术构建合成型神经氨酸传感器以拓展唾液生物标志物检测范围

（翻译说明： 1. "chimeragenesis"译为"嵌合体生成技术"，准确体现该生物技术方法的核心特征； 2. "synthetic neuraminic acid sensor"采用"合成型神经氨酸传感器"的译法，既保持专业术语规范（"神经氨酸"为标准生化命名），又通过"型"字体现工程化设计特性； 3. 将原文的动名词结构转换为中文典型的"通过...以..."句式，符合科技汉语表达习惯 4. "salivary biomarker detection"译为"唾液生物标志物检测范围"，通过增译"范围"二字使语义更完整 5. 整体采用"方法+目的"的语序重组，既忠实原意又符合中文论文标题的简洁性要求） | Verzino, S. J. | PDF | | | 在胚胎发育过程中，动态力学驱动细胞与器官形态变化

（说明：根据学术翻译规范，本译文采用以下处理原则： 1. 核心概念"Dynamical forces"译为"动态力学"，准确对应发育生物学中的力学调控机制 2. "drive"译为"驱动"而非简单译为"导致"，突出主动的生物力学过程 3. "morphology changes"译为专业术语"形态变化"，保持发育生物学领域术语一致性 4. 采用"细胞与器官"的递进式表述，体现发育过程中的层次性特征 5. 时间状语"during embryonic development"前置处理，符合中文表达习惯 6. 整体句式调整为中文典型的"时间状语+主体+过程描述"结构，确保学术表达的严谨性） | Manna, R. K. | PDF | | | 埃塞俄比亚贡德尔ELFORA屠宰场牛群片形吸虫病所致血液生化改变与病理损伤研究

（说明：根据学术翻译规范，对标题进行了以下处理： 1. 将地名"Gondar"音译为"贡德尔"，并保留企业名称"ELFORA"大写形式 2. "Fasciolosis"专业术语译为"片形吸虫病"（寄生虫学标准译名） 3. "Hematobiochemical Alterations"译为"血液生化改变"（医学标准表述） 4. "Pathological Lesions"译为"病理损伤"（病理学规范术语） 5. 补充"研究"二字符合中文论文标题习惯，同时保持原标题的学术严谨性） | Temesgen, A. B. | PDF | | | 行为可塑性及间接互作的效价

翻译说明： 1. "Behavioral plasticity"译为"行为可塑性"，这是生态学/行为学领域的标准译法，指生物体根据环境变化调整行为的能力 2. "valence"在此语境下译为"效价"，准确表达生态相互作用中正向/负向作用的强度概念 3. "indirect interactions"译为"间接互作"，符合生态学文献中对物种间非直接作用的专业表述 4. 整体采用"及"连接两个专业概念，保持学术标题的简洁性，同时确保术语的准确性 5. 译文严格遵循中文学术写作规范，术语使用与《生态学名词》《动物行为学名词》等标准译名一致 | Fahimipour, A. K. | PDF | |

medRxiv

标题	作者	PDF链接	摘要
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF
		PDF