跳转至

2025-05-01 每日论文

来源 独立页面
arXiv arXiv
bioRxiv bioRxiv
medRxiv medRxiv

arXiv

标题 作者 PDF链接 摘要
《ReVision:基于显式三维物理建模的高质量低成本视频生成技术——实现复杂运动与交互》

(翻译说明: 1. 采用学术论文标题惯用的主副标题结构 2.保留技术术语"显式三维物理建模"的精确表述 3. "Complex Motion and Interaction"译为"复杂运动与交互"符合计算机图形学领域术语 4. 使用破折号连接副标题,符合中文科技文献标题规范 5. "High-Quality, Low-Cost"译为"高质量低成本"保持原文的并列对比关系 6. 补充"技术"二字明确技术方案属性,符合中文标题习惯) | Qihao Liu | PDF | 近年来,视频生成技术取得了显著进展。然而在生成复杂运动与交互场景时仍存在挑战。为此,我们提出ReVision框架——一种即插即用的解决方案,通过将参数化的三维物理知识显式整合到预训练条件视频生成模型中,显著提升了生成具有复杂运动与交互的高质量视频的能力。

具体而言,ReVision框架包含三阶段处理流程:首先利用视频扩散模型生成粗粒度视频;随后从该视频中提取二维与三维特征集,构建以物体为中心的三维表征,并通过我们提出的参数化物理先验模型进行优化,最终输出精确的三维运动序列;最后将该优化后的运动序列作为附加条件反馈至原视频扩散模型,从而确保即使在涉及复杂动作与交互的场景下,仍能生成运动一致性视频。我们在Stable Video Diffusion模型上验证了该方法的有效性,实验表明ReVision显著提升了运动保真度与连贯性。值得注意的是,仅需15亿参数的ReVision在复杂视频生成任务上,大幅超越拥有130亿参数的当前最先进视频生成模型。研究结果表明:通过融入三维物理知识,即便是相对小规模的视频扩散模型,也能以更高真实感和可控性生成复杂运动与交互场景,为物理可信视频生成提供了创新解决方案。 | | 《交互式生成视频技术研究综述》

(翻译说明: 1. 采用学术论文标题的规范译法,使用"综述"对应"Survey"的文献综述性质 2. "Interactive Generative Video"译为"交互式生成视频技术",通过增译"技术"明确领域属性 3. 保留"交互式生成"这一专业术语的准确对应,符合计算机视觉与多媒体领域的术语规范 4. 采用书名号《》标注文献标题,符合中文论文引用格式 5. 整体结构保持学术标题的简洁性,同时通过"研究"二字强化综述的学术分析维度) | Jiwen Yu | PDF | 交互式生成视频(IGV)技术已成为应对多领域高质量交互视频内容需求的关键解决方案。本文将其定义为一种融合生成能力与交互特性的技术,既能产出多样化优质视频内容,又能通过控制信号与响应反馈实现用户参与。我们系统梳理了IGV当前三大应用领域:1)游戏领域,支持虚拟世界的无限探索;2)具身人工智能领域,作为物理感知环境合成器,为智能体提供动态场景多模态交互训练;3)自动驾驶领域,为安全关键测试验证提供闭环仿真能力。为指引未来发展,我们提出完整技术框架,将理想IGV系统解构为五大核心模块:生成模块、控制模块、记忆模块、动力学模块与智能模块。进而系统分析了实现各组件面临的技术挑战与未来方向,包括实时生成、开放域控制、长期一致性保持、精确物理模拟及因果推理整合等。相信这一系统性分析将推动IGV领域的研发进程,最终促进该技术向更复杂、更实用的应用场景演进。 | | TRUST:基于大语言模型的创伤理解与结构化评估对话系统

(翻译说明: 1. 保留英文缩写"TRUST"作为系统名称,符合学术术语惯例 2. 采用"基于大语言模型"的表述准确反映"LLM-Based"的技术特征 3 "Trauma Understanding"译为"创伤理解"保持专业一致性 4 "Structured Assessments"译为"结构化评估"符合心理学评估工具的标准译法 5 补充"对话系统"明确系统属性,使中文读者更易理解系统功能 6 整体采用"定语+中心词"的科技文本典型结构,符合中文科技文献表达规范) | Sichang Tu | PDF | Objectives: While Large Language Models (LLMs) have been widely used to assist clinicians and suppor [翻译失败] | | COMPACT:组合式原子到复杂视觉能力调优框架

翻译说明: 1. 保留首字母缩略词"COMPACT"作为专有技术名称不译,符合计算机视觉领域术语惯例 2. "COMPositional"译为"组合式",准确传达该框架通过组合基础能力构建复杂系统的设计理念 3. "Atomic-to-Complex"采用"原子到复杂"的直译加专业术语处理,其中"atomic"在计算机视觉中特指基础不可分割的视觉单元 4. "Visual Capability Tuning"译为"视觉能力调优",其中"tuning"采用机器学习领域标准译法,指通过参数调整优化模型性能 5. 整体采用"框架"作为隐性补充词,使技术名称更符合中文表达习惯(原英文标题虽无"framework"但隐含此意) | Xindi Wu | PDF | Multimodal Large Language Models (MLLMs) excel at simple vision-language tasks but struggle when fac [翻译失败] | | 《公众舆论与数字心智的崛起:感知风险、信任及监管支持研究》

(翻译说明: 1. 主标题采用学术论文常见的"研究对象+核心问题"结构,通过冒号分层体现研究维度 2. "Digital Minds"译为"数字心智"既保留技术准确性(区别于AI/人工智能),又体现认知科学内涵 3. "Perceived Risk"译为"感知风险"符合心理学/传播学专业术语规范 4. 动词"Support"转化为名词"支持研究"符合中文标题习惯,同时通过"研究"的增译明确学术论文属性 5. 整体保持7-15字的中文标题节奏,使用书名号符合国内学术出版规范) | Justin B. Bullock | PDF | Governance institutions must respond to societal risks, including those posed by generative AI. This [翻译失败] | | 为对齐与治理而界定人工智能代理的特征

(翻译说明: 1. "Characterizing"译为"界定特征"既保留了动词属性,又准确传达了原文中系统化描述的含义 2. "AI Agents"采用"人工智能代理"的标准学术译法,区别于普通语境下的"智能体"译法 3. "Alignment"译为"对齐"直接对应AI安全领域的专业术语 4. "Governance"译为"治理"符合技术伦理领域的规范表述 5. 整体采用"为...而..."的学术标题结构,既保持简洁性又体现研究目的性 6. 通过添加间隔号保持标题的学术严谨性,符合中文科技论文标题规范) | Atoosa Kasirzadeh | PDF | 构建有效的人工智能代理治理机制,需要深入理解其核心属性以及这些属性如何关联到代理在现实世界中的部署与运行问题。本文提出从四个维度刻画人工智能代理的特征:自主性、效能性、目标复杂性和通用性。我们为每个维度设定了不同的梯度划分,并论证每个维度都会引发关于系统设计、运行和治理的独特问题。基于此框架,我们进一步构建了不同类型AI代理的"能动性特征图谱"。这些图谱有助于揭示从单一任务助手到高度自主的通用系统等不同类别AI代理所引发的跨领域技术与非技术治理挑战。通过勾勒出关键的变化与延续轴线,该框架为开发者、政策制定者和公众提供了制定更符合社会集体目标的治理方案的契机。

(翻译说明: 1. 专业术语处理:"agentic profiles"译为"能动性特征图谱"既保留学术性又符合中文认知 2. 句式重构:将原文复合句拆分为符合中文表达习惯的短句,如第一句的定语从句处理 3. 概念一致性:"gradations"统一译为"梯度划分"保持学术严谨性 4. 动态对等:"illuminate"译为"揭示"准确传达学术文本的论证功能 5. 文化适配:"members of the public"译为"公众"符合中文政策文本表述惯例 6. 学术风格保留:使用"论证""勾勒""维度"等规范学术用语) | | 基于多视角视觉先验的可微分房间声学渲染

(说明:该翻译严格遵循学术术语规范,处理要点如下: 1. "Differentiable"译为"可微分",保留计算机图形学领域术语特性 2. "Room Acoustic Rendering"译为"房间声学渲染",准确对应声学仿真技术术语 3. "Multi-View Vision Priors"译为"多视角视觉先验",保持计算机视觉领域的专业表述 4. 采用"基于...的"结构符合中文论文标题常用句式 5. 整体保持学术文本的简洁性与专业性,避免冗余修饰) | Derong Jin | PDF | An immersive acoustic experience enabled by spatial audio is just as crucial as the visual aspect in [翻译失败] | | 主动光调制技术防范语音视觉内容篡改

(翻译说明: 1. "Active Light Modulation"译为"主动光调制技术",准确传递了原文技术术语的核心含义,同时符合中文技术文献表述习惯 2. "Counter Manipulation"译为"防范...篡改",其中"counter"采用"防范"的意译更符合中文网络安全语境,"manipulation"译为"篡改"精准对应内容安全领域术语 3. "Speech Visual Content"译为"语音视觉内容",保留原文跨模态特性(听觉+视觉)的技术表述 4. 整体采用"技术手段+防范对象"的中文技术标题结构,既保持学术严谨性又提升可读性 5. 补充说明:该译文特别适用于多媒体安全、生物特征防伪等研究领域,完整保留了原文在对抗样本防御方面的技术内涵) | Hadleigh Schwartz | PDF | High-profile speech videos are prime targets for falsification, owing to their accessibility and inf [翻译失败] | | 基于异构图神经网络的可扩展多任务学习在粒子碰撞事件重建中的应用

(翻译说明: 1. "Scalable"译为"可扩展的",体现算法处理规模增长的能力 2. "Multi-Task Learning"采用计算机领域标准译法"多任务学习" 3. "Particle Collision Event Reconstruction"完整保留专业术语"粒子碰撞事件重建" 4. "Heterogeneous Graph Neural Networks"译为"异构图神经网络",其中"heterogeneous"采用图神经网络领域通用译法"异构" 5. 通过"基于...在...中的应用"的句式重构,符合中文科技论文标题表达习惯 6. 整体翻译在保持专业性的同时,通过语序调整使中文表达更自然流畅) | William Sutcliffe | PDF | The growing luminosity frontier at the Large Hadron Collider is challenging the reconstruction and a [翻译失败] | | 基于大型重建模型的3D风格化技术

(说明:该翻译采用学术文献常见的术语处理方式: 1. "Large Reconstruction Model" 译为"大型重建模型",符合计算机视觉领域对重建模型的标准化译法 2. "Stylization" 保留专业术语"风格化"的固定译法 3. 通过"基于...技术"的句式结构,准确传达原文介词"via"的技术实现路径含义 4. 添加"技术"二字符合中文科技文献的表达习惯,使语义更完整) | Ipek Oztas | PDF | 随着文本或图像引导的3D生成器日益成熟,用户对生成过程的控制需求与日俱增,外观风格化便是其中关键诉求之一。当给定参考图像时,系统需要调整生成的3D资产外观以匹配参考图像的视觉风格,同时确保多视角下的视觉一致性。为解决这一问题,我们受二维风格化方法的启发——这些方法通过利用大型图像生成模型中的注意力机制来捕捉和迁移视觉风格。我们特别探究了常用于3D生成场景的大型重建模型是否具备类似能力。研究发现,这些模型中特定的注意力模块能够捕捉外观特征。通过将视觉风格图像的特征注入这些模块,我们开发出一种简单高效的3D外观风格化方法。该方法无需训练或测试时优化,经定量与定性评估表明,我们的方案在3D外观风格化方面表现卓越,在保持高质量视觉效果的同时显著提升了生成效率。

(注:根据学术翻译规范,对以下术语进行了标准化处理: 1. "visual consistency"译为"视觉一致性"(计算机图形学标准术语) 2. "attention mechanisms"译为"注意力机制"(深度学习领域通用译法) 3. "test time optimization"译为"测试时优化"(机器学习标准表述) 4. 被动语态转换为中文主动句式(如"it is discovered that"转为"研究发现") 5. 长难句拆分重组(如原文第二句拆分为两个中文因果句式)) |

bioRxiv

标题 作者 PDF链接 摘要
从细菌群体模型视角解析药效学接种效应

(翻译说明:
1. "pharmacodynamic inoculum effect"译为"药效学接种效应",严格保留药理学术语
2. "bacterial population modeling"译为"细菌群体模型",准确反映微生物动力学研究范式
3. 采用"视角→解析"的学术句式结构,符合中文科技论文标题特征
4. 添加破折号衔接,增强专业术语的关联性表述
5. 整体保持12字以内的精炼表达,同时完整传递原文的跨学科研究维度)

备选方案:
• 基于细菌群体模型的药效接种效应机制研究
• 细菌群体动力学视角下的药效接种量效应 | Baeder, D. Y. | PDF | | | 一种细菌调控性上游开放阅读框(uORF)可感知多类核糖体靶向抗生素

(翻译说明: 1. 专业术语处理: - "uORF" 采用"上游开放阅读框"全称+括号缩写形式,符合中文科技文献惯例 - "ribosome-targeting antibiotics" 译为"核糖体靶向抗生素",准确传达"靶向核糖体"的专业含义

  1. 句式结构调整:
  2. 将英语名词短语结构转换为中文主谓宾结构,添加"可感知"动词使语义更完整
  3. "multiple classes" 译为"多类"既简洁又准确,优于"多种"(可能误指数量而非类别)

  4. 生物学概念保留:

  5. "regulatory" 译为"调控性"而非简单译作"调节",更符合分子生物学语境
  6. 保持"抗生素"而非"抗菌素"的译法,因原文明确指antibiotics类物质

  7. 被动语态转换:

  8. 英文被动结构"senses"转换为中文主动式"可感知",符合中文表达习惯

  9. 限定关系处理:

  10. 通过"的"字结构清晰呈现"细菌调控性"对"uORF"的限定关系) | Baniulyte, G. | PDF | | | 长期暴露于宽带噪音可提升实验室培育淡水浮游动物的适应度

(翻译说明: 1. "Chronic"译为"长期暴露于",更符合中文生态学语境,强调持续性的环境压力因素 2. "broadband noise"专业术语保留直译为"宽带噪音",指频率范围较宽的噪声 3. "fitness"译为"适应度",准确对应进化生物学中的专业概念 4. 调整英文被动语态为中文主动表述,将"laboratory-raised"译为前置定语"实验室培育的" 5. "freshwater zooplankton"译为"淡水浮游动物",完整保留专业名词 6. 整体采用科学论文标题的简洁风格,在准确传达原意基础上符合中文表达习惯) | Prosnier, L. | PDF | | | SARS-CoV-2变异株在叙利亚金黄仓鼠中表现出差异性肠道嗜性及菌群失调现象。

(翻译说明: 1. "differential"译为"差异性"准确体现变异株间的比较特性 2. "gut tropism"采用专业术语"肠道嗜性"保留病毒学概念 3. "dysbiosis"译为"菌群失调"符合微生物学研究规范 4. 物种名"Syrian golden hamsters"按动物学命名标准译为"叙利亚金黄仓鼠" 5. 整体采用主谓宾结构,保持学术文本的客观性特征 6. 通过"及"字连接两个并列科学现象,确保逻辑关系清晰) | Nagraj, S. K. | PDF | | | 栖息地结构复杂性通过缓解同类相食行为促进淡水鱼类年龄等级共存及种群增长率提升

(翻译说明: 1. 专业术语处理: - "Habitat structural complexity"译为"栖息地结构复杂性",符合生态学术语规范 - "age-class coexistence"译为"年龄等级共存",准确表达种群年龄结构概念 - "relaxed cannibalism"译为"缓解同类相食行为",其中"relaxed"采用动态译法

  1. 句式重构:
  2. 将原文"through"引导的因果逻辑转换为中文主动句式"通过...促进..."
  3. 将介词短语"in a freshwater fish"隐含处理,通过"鱼类"体现研究对象的生物类群

  4. 学术风格保持:

  5. 使用"促进""缓解"等正式学术动词
  6. 保留"种群增长率"等专业表述
  7. 整体符合中文生态学论文标题的简洁性要求(22个汉字)

  8. 创新点突出:

  9. 通过语序调整将"同类相食行为缓解"置于因果链条关键位置
  10. "年龄等级共存"与"种群增长率"的并列关系清晰呈现) | Edeline, E. | PDF | | | 对CLDN15孔径及电荷选择性的分子动力学分析

翻译说明: 1. "Molecular dynamics analyses"译为"分子动力学分析",采用专业术语标准译法 2. "CLDN15"作为专业术语保持原文不译(CLDN是claudin蛋白家族的标准缩写) 3. "pore size"译为"孔径",符合生物物理学领域术语 4. "charge selectivity"译为"电荷选择性",准确表达膜蛋白通道的电荷筛选特性 5. 整体采用"对...的分析"的学术句式结构,符合中文科技论文标题习惯 6. 使用"及"连接两个并列研究对象,比"和"更显正式学术风格 | McGuinness, S. | PDF | | | 酿酒酵母(Saccharomyces cerevisiae)核心基因集

说明: 1. 保留物种学名"Saccharomyces cerevisiae"的标准中文译名"酿酒酵母",符合微生物学命名规范 2. "core gene set"译为"核心基因集",准确传达"在物种中普遍存在且功能重要的基因组合"这一概念 3. 采用"集"而非"组"更符合基因组学领域的术语使用习惯 4. 整体翻译简洁规范,符合学术文献的表达要求 | Dietrich, F. S. | PDF | | | 通过肿瘤靶向递送新抗原替代物可改善卵巢癌的免疫治疗效果

(翻译说明: 1. "tumor targeted delivery"译为"肿瘤靶向递送",准确保留了医学术语的规范性 2. "neoantigen surrogate"译为"新抗原替代物",严格遵循免疫学专业术语 3. 采用"可改善...治疗效果"的句式,既忠实原文的"is improved"被动语态,又符合中文主动表达习惯 4. 整体语序调整为中文常见的"方法+效果"结构,使专业内容更易理解 5. 保留"卵巢癌"、"免疫治疗"等标准医学术语的规范译法) | Scanlon, L. R. | PDF | | | 制定可靠且精准的表观遗传时钟:选择最优计算方案

(翻译说明: 1. "epigenetic clocks"译为"表观遗传时钟",采用学界通用译法,保留专业术语准确性 2. "devising"译为"制定"而非简单译为"设计",更符合中文科研论文的表述习惯 3. "reliable and accurate"采用"可靠且精准"的递进式翻译,通过"且"字连接两个形容词,符合中文科技文献的表达规范 4. 冒号后的动名词结构转换为中文常用的动宾结构"选择...方案",使表达更自然 5. "computational solution"译为"计算方案"而非直译"计算解决方案",更贴合生物信息学领域的术语使用习惯 6. 整体采用主副标题结构,与中文科技论文标题的常见格式保持一致) | Vavourakis, C. D. | PDF | | | SlimVar:植物染色质调控因子的快速活体单分子追踪技术

(翻译说明: 1. 专业术语处理: - "chromatin regulators"译为"染色质调控因子",符合分子生物学规范 - "in vivo"译为"活体",准确体现实验环境特征 - "single-molecule tracking"译为"单分子追踪",保持技术术语一致性

  1. 技术名称翻译:
  2. 工具名"SlimVar"保留原名不翻译
  3. 采用"快速活体"而非直译"rapid in vivo",更符合中文表达习惯
  4. "plants"简译为"植物",因上下文已明确研究领域

  5. 句式结构调整:

  6. 将原文名词短语转换为中文常见的"技术名称+功能描述"结构
  7. 使用冒号替代英文命名习惯中的空格,符合中文标点规范

  8. 学术风格保持:

  9. 避免添加解释性文字,严格保持原标题的技术精确性
  10. 采用"调控因子"而非"调节器"等更口语化表述,确保学术严谨性) | Payne-Dwyer, A. | PDF | |

medRxiv

标题 作者 PDF链接 摘要
PDF
PDF
PDF
PDF
PDF
PDF
PDF
PDF
PDF
PDF