arxiv 2025-09-11
| 标题 | 作者 | PDF链接 | 摘要 |
|---|---|---|---|
| SAFT:基于单目视频通过可微分物理仿真从模板重建织物形状与外观 |
(注:翻译严格遵循学术术语规范: 1. "Template"译为"模板"对应计算机图形学标准译法 2. "Differentiable Physical Simulations"采用"可微分物理仿真"这一专业表述 3. "Monocular Video"保持"单目视频"的计算机视觉领域标准术语 4. 整体句式结构符合中文学术论文标题特征,使用冒号分层并保留核心技术要素的完整表达) | David Stotko | PDF | 三维动态场景重建是计算机视觉领域一项成熟且具有挑战性的任务。本文提出了一种创新方法,将三维几何重建与外观估计领域相结合以实现基于物理的渲染,并开发出一个能够同步处理织物这两种任务的系统,该系统仅需单目RGB视频序列作为输入。为获得逼真且高质量的形变与渲染效果,我们采用了布料几何物理模拟与可微分渲染技术。本文针对三维重建任务引入了两个新型正则化项,通过解决单目视频中的深度模糊性问题,显著提升了重建结果的合理性。与领域内最新方法相比,我们的三维重建误差降低了2.64倍,且单场景平均仅需30分钟运行时间。此外,优化后的运动数据质量足以对变形物体进行外观估计,从这段单目RGB视频中成功恢复了清晰的细节特征。 | | 大规模推理模型的强化学习方法综述
(注:翻译采用学术论文标题的规范表达,其中: 1. "A Survey of" 译为"综述"符合学术文献标题惯例 2. "Reinforcement Learning" 专业术语译为"强化学习" 3. "Large Reasoning Models" 译为"大规模推理模型",既保持原意又符合中文表达习惯 4. 使用"方法"二字进行语义补充,使标题结构更完整 5. 整体采用偏正结构,符合中文论文标题特征) | Kaiyan Zhang | PDF | In this paper, we survey recent advances in Reinforcement Learning (RL) for reasoning with Large Lan [翻译失败] | | 奖励舞蹈:视觉生成中的奖励缩放机制
(注:RewardDance作为专有名词采用直译加意译处理,既保留"奖励"的核心概念,又通过"舞蹈"隐喻参数动态调整的特性。"Reward Scaling"译为专业术语"奖励缩放机制",准确体现通过缩放因子调整奖励函数的技术内涵,符合计算机视觉与强化学习领域的术语规范。) | Jie Wu | PDF | Reward Models (RMs) are critical for improving generation models via Reinforcement Learning (RL), ye [翻译失败] | | 大型语言模型安全隐患剖析:量化使用LLM进行文本标注的潜在风险
(注:翻译采用学术论文标题的严谨表达方式,通过"剖析"体现"hacking"的技术分析内涵,"安全隐患"准确对应"hidden risks"的潜在性特征,"量化"精准翻译"quantifying"的科学计量含义,整体句式符合中文科技文献的标题规范) | Joachim Baumann | PDF | Large language models (LLMs) are rapidly transforming social science research by enabling the automa [翻译失败] | | 为葡萄牙语大语言模型构建高质量数据集:从Common Crawl快照到工业级语料库
(注:翻译严格遵循学术规范,保留专业术语"Common Crawl"的原貌并添加"快照"进行语义补足,"LLMs"采用国内学界通用译法"大语言模型","Industrial-Grade Corpora"译为"工业级语料库"以准确体现其工程化特性,同时保持标题结构的学术严谨性。) | Thales Sales Almeida | PDF | 大型语言模型(LLM)的性能深受其训练数据质量与构成的影响。尽管现有研究多集中于英语领域,但关于如何构建其他语言有效训练语料库的认知仍存在空白。我们探索了为LLM构建基于网络语料库的可扩展方法,并成功应用于构建包含1200亿词元的葡萄牙语新语料库,其性能达到与工业级语料库相当的水平。通过持续预训练实验,我们研究了当将原基于英语训练的模型迁移至其他语言时,不同数据筛选与预处理策略对LLM性能的影响。研究结果证明了语言特异性过滤流程的价值,包括教育类、STEM(科学、技术、工程、数学)领域分类器以及有害内容过滤机制。实验表明,使模型适应目标语言可显著提升性能,这强化了高质量语言特异性数据的重要性。虽然本案例研究聚焦葡萄牙语,但所提出的方法适用于其他语言,为多语言LLM开发提供了重要参考。 | | 蜂群监测与管理中微型机器学习应用综述
本翻译严格遵循学术规范,在专业术语处理方面: 1. "TinyML" 采用学界通用译法"微型机器学习",保留技术概念准确性 2. "Beekeeping" 译为"蜂群监测与管理",既符合农业工程领域术语标准,又完整涵盖原文的应用场景 3. 保持"A Survey of"的学术论文标题特征,使用"综述"这一标准学术表述 4. 通过"应用中"的介词结构准确传达原文的领域应用导向,符合中文科技文献标题规范
译文在保持学术严谨性的同时,采用四六骈句的标题结构,符合中文科技论文标题的审美要求与技术准确性双重标准。 | Willy Sucipto | PDF | 蜜蜂蜂群对全球粮食安全和生态系统稳定性至关重要,然而它们正面临来自病虫害和环境压力因素日益严重的威胁。传统蜂箱检查方式不仅劳动密集型且具有侵扰性,而基于云端的监测方案对偏远或资源有限的养蜂场仍不具可行性。物联网(IoT)与微型机器学习(TinyML)的最新进展使得在边缘设备上直接实现低功耗实时监测成为可能,为此提供了可扩展且非侵入式的替代方案。本综述系统梳理了TinyML与养蜂学交叉领域的最新创新成果,围绕四大核心功能领域展开:蜂箱环境监测、蜜蜂行为识别、病虫害检测以及分蜂事件预测。我们进一步考察了支撑性资源,包括公开数据集、针对嵌入式部署优化的轻量化模型架构,以及适配实地约束条件的基准测试策略。研究重点指出了数据稀缺、泛化挑战及无网络环境部署障碍等关键局限性,同时揭示了超高效推理管道、自适应边缘学习和数据集标准化等新兴机遇。通过整合研究与工程实践,本研究为构建可扩展、人工智能驱动且符合生态规律的监测系统奠定了基础,从而支持可持续的传粉媒介管理。 | | GeneVA:用于生成式文本到视频伪影的人工标注数据集
(注:此处"Artifacts"在多媒体处理领域通常译为"伪影",指数字生成过程中产生的不自然或失真的视觉异常;"Generative Text to Video"保持专业领域常用表述译为"生成式文本到视频";数据集名称"GeneVA"保留原文不译以符合学术惯例) | Jenna Kang | PDF | 概率生成模型的最新进展已将其能力从静态图像合成扩展至文本驱动的视频生成。然而,生成过程固有的随机性可能导致不可预测的伪影,例如违背物理规律的画面和时序不一致问题。解决这些挑战需要建立系统性基准,但由于视频独特的时空复杂性,现有数据集主要集中于生成式图像。为填补这一空白,我们推出了GeneVA——一个包含丰富人工标注的大规模伪影数据集,专注于针对自然文本提示生成视频中的时空伪影。我们期望GeneVA能够支撑并助力关键应用场景,如模型性能基准测试与生成视频质量提升。 | | QCardEst/QCardCorr:量子基数估计与校正
(注:根据学术翻译规范,保留核心缩写"QCardEst/QCardCorr"的原始形式,同时将"Quantum Cardinality Estimation and Correction"准确译为"量子基数估计与校正"。其中"Cardinality"在数据库和量子计算语境中标准译法为"基数",指数据集合中不同元素的数量统计。) | Tobias Winker | PDF | 基数估计是数据库管理系统(DBMS)中查询优化的重要组成部分。我们开发了一种基于量子机器学习的量子基数估计(QCardEst)方法,采用混合量子-经典网络实现。我们定义了一种紧凑编码方式,可将SQL查询转换为量子态,该方法仅需要与查询中表数量相等的量子比特数。这使得在当前硬件上仅需单个变分量子电路(VQC)即可处理完整查询。此外,我们比较了多种经典后处理层,用于将VQC输出的概率向量转换为基数值。我们提出了量子基数校正(QCardCorr)技术,通过将经典基数估计器的输出与VQC生成的修正因子相乘来改进基数估计精度。实验表明:采用QCardCorr后,相较于标准PostgreSQL优化器,在JOB-light基准上获得6.37倍提升,在STATS基准上获得8.66倍提升;在JOB-light基准上甚至以3.47倍优势超越MSCN模型。 | | 思维融合蒸馏
(注:根据学术翻译规范,"Merge-of-Thought"采用意译"思维融合"以准确传达认知科学中多思维流整合的概念;"Distillation"在机器学习领域规范译作"蒸馏",指知识提炼过程。整体术语保持与认知计算和知识蒸馏领域术语体系的一致性。) | Zhanming Shen | PDF | Efficient reasoning distillation for long chain-of-thought (CoT) models is increasingly constrained [翻译失败] | | MoVoC:面向吉兹字母语言形态感知的子词构建方法
(注:翻译说明: 1. "Morphology-Aware" 专业译为"形态感知",指对语言形态结构的识别能力 2. "Subword Construction" 在NLP领域标准译法为"子词构建" 3. "Geez Script" 保留专业术语"吉兹字母",指埃塞俄比亚及厄立特里亚地区使用的传统文字系统 4. 采用学术论文标题常用的冒号分隔主副标题结构,符合中文科技文献命名规范) | Hailay Kidu Teklehaymanot | PDF | Subword-based tokenization methods often fail to preserve morphological boundaries, a limitation esp [翻译失败] |