Arxiv 2025-01-06 Papers

标题	作者	PDF链接	代码仓库	Title
高斯掩码自编码器	Jathushan Rajasegaran	PDF	N/A	Gaussian Masked Autoencoders
LightGNN：用于推荐的简单图神经网络	Guoxuan Chen	PDF	N/A	LightGNN: Simple Graph Neural Network for Recommendation
BoostStep：通过改进单步推理提升大型语言模型的数学能力	Beichen Zhang	PDF	N/A	BoostStep: Boosting mathematical capability of Large Language Models via improved single-step reasoning
自动化生成具有挑战性的多选题以评估视觉语言模型	Yuhui Zhang	PDF	N/A	Automated Generation of Challenging Multiple-Choice Questions for Vision Language Model Evaluation
Rate-My-LoRA：用于心脏MRI分割的高效自适应联邦模型调优	Xiaoxiao He	PDF	N/A	Rate-My-LoRA: Efficient and Adaptive Federated Model Tuning for Cardiac MRI Segmentation
以下是这段英文的中文翻译：

描述分布式随机凸优化中的准确性-通信-隐私权衡

“归一化批量归一化用于长尾识别”

或者更自然的表达可以是：

“长尾识别中的批量归一化归一化”

在这段翻译中，“AIF-SFDA”是原文的缩写，直接保留。其余部分翻译如下： - “Autonomous Information Filter-driven” 翻译为“基于自主信息过滤的” - “Source-Free Domain Adaptation” 翻译为“无源域自适应” - “for Medical Image Segmentation” 翻译为“医学图像分割方法”

咨询对话中的信任建模：一项基准研究

这个翻译将原标题进行了适当的扩展和调整，以更清晰地表达研究内容：

"Group Shapley" 翻译为 "群体Shapley值"，明确了这是关于Shapley值方法的研究
增加了连接词"及其"，使标题各部分关系更清晰
"Robust Significance Testing" 翻译为"基于稳健显著性检验"，采用倒装结构突出方法论特征
"Application to" 翻译为"及其在...中的应用"，更符合中文表达习惯
"Bond Recovery Rate Prediction" 翻译为"债券回收率预测"，准确传达了应用领域

数据证明：一种用于协作智能的共识协议

一个用于优化向用户重复交付个性化行动的点过程模型

翻译说明： - "A Point Process Model" 翻译为 "点过程模型"。 - "for Optimizing" 翻译为 "用于优化"。 - "Repeated Personalized Action Delivery" 翻译为 "重复交付个性化行动"。 - "to Users" 翻译为 "向用户"。

“利用集成深度学习框架进行高分辨率集合降水预测”

翻译说明： - Skillful：译为“熟练的”或“高效的”，这里可以理解为“高效的”或“精准的”。 - High-Resolution：译为“高分辨率”。 - Ensemble Precipitation Forecasting：译为“集合降水预测”，集合预测是一种通过结合多个模型或预测结果来提高预测准确性的方法。 - Integrated Deep Learning Framework：译为“集成深度学习框架”，指结合多种深度学习技术的综合框架。

基于强化学习的移动机器人仿真到现实迁移：从NVIDIA Isaac Sim到Gazebo和真实的ROS 2机器人

翻译解释： - Sim-to-Real Transfer：仿真到现实迁移，指将仿真环境中训练的结果应用到现实世界中的技术。 - Mobile Robots：移动机器人，指能够在环境中自主移动的机器人。 - Reinforcement Learning：强化学习，一种机器学习方法，通过试错和奖励机制来训练智能体。 - NVIDIA Isaac Sim：NVIDIA开发的机器人仿真平台。 - Gazebo：一个开源的机器人仿真工具。 - ROS 2 Robots：基于ROS 2（机器人操作系统2）的机器人。

希望这段翻译对你有帮助！ | Sahar Salimpour | PDF | N/A | Sim-to-Real Transfer for Mobile Robots with Reinforcement Learning: from NVIDIA Isaac Sim to Gazebo and Real ROS 2 Robots | | 基于感兴趣区域的医学图像压缩 | Utkarsh Prakash Srivastava | PDF | N/A | Region of Interest based Medical Image Compression | | FoundPAD: 重新加载基础模型用于人脸呈现攻击检测 | Guray Ozgur | PDF | N/A | FoundPAD: Foundation Models Reloaded for Face Presentation Attack Detection | | 解释幽默风格分类：一种理解计算幽默分析的可解释人工智能方法 | Mary Ogbuka Kenneth | PDF | N/A | Explaining Humour Style Classifications: An XAI Approach to Understanding Computational Humour Analysis | | 从维度分析的角度重新审视多智能体强化学习中的通信效率 | Chuxiong Sun | PDF | N/A | Revisiting Communication Efficiency in Multi-Agent Reinforcement Learning from the Dimensional Analysis Perspective | | MDP3：一种无需训练的列表式视频帧选择方法，适用于视频-LLMs | Hui Sun | PDF | N/A | MDP3: A Training-free Approach for List-wise Frame Selection in Video-LLMs | | PARF-Net：将像素级自适应感受野融入混合Transformer-CNN网络用于医学图像分割 | Xu Ma | PDF | N/A | PARF-Net: integrating pixel-wise adaptive receptive fields into hybrid Transformer-CNN network for medical image segmentation | | 基于条件互信息的扩散后验采样用于求解逆问题 | Shayan Mohajer Hamidi | PDF | N/A | Conditional Mutual Information Based Diffusion Posterior Sampling for Solving Inverse Problems | | 二维未知视角层析成像中的未知角度分布问题 | Kaishva Chintan Shah | PDF | N/A | Two-Dimensional Unknown View Tomography from Unknown Angle Distributions | | IIMedGPT：通过高效的人类偏好对齐提升大型语言模型在医疗任务中的能力 | Yiming Zhang | PDF | N/A | IIMedGPT: Promoting Large Language Model Capabilities of Medical Tasks by Efficient Human Preference Alignment | | Diff-Lung：基于扩散的纹理合成技术用于增强肺部CT扫描中的病理组织分割 | Rezkellah Noureddine Khiati | PDF | N/A | Diff-Lung: Diffusion-Based Texture Synthesis for Enhanced Pathological Tissue Segmentation in Lung CT Scans | | 在自监督表示学习中看到部分的整体 | Arthur Aubret | PDF | N/A | Seeing the Whole in the Parts in Self-Supervised Representation Learning | | 一种基于相机-激光雷达融合的新型视觉Transformer用于交通对象分割 | Toomas Tahves | PDF | N/A | A Novel Vision Transformer for Camera-LiDAR Fusion based Traffic Object Segmentation | | ParetoLens：一个用于探索多目标进化算法解集的视觉分析框架 | Yuxin Ma | PDF | N/A | ParetoLens: A Visual Analytics Framework for Exploring Solution Sets of Multi-objective Evolutionary Algorithms | | 合成真菌数据集：一种时间对齐的方法 | A. Rani | PDF | N/A | Synthetic Fungi Datasets: A Time-Aligned Approach | | 用于视频监控应用的大型语言模型 | Ulindu De Silva | PDF | N/A | Large Language Models for Video Surveillance Applications | | HOGSA：基于3D高斯溅射数据增强的双手机-物体交互理解 | Wentian Qu | PDF | N/A | HOGSA: Bimanual Hand-Object Interaction Understanding with 3D Gaussian Splatting Based Data Augmentation | | 基于图的检索增强生成用于动态少样本文本分类 | Yubo Wang | PDF | N/A | Graph-based Retrieval Augmented Generation for Dynamic Few-shot Text Classification | | RAHN：一种基于声誉的沙漏网络用于Web服务QoS预测 | Xia Chen | PDF | N/A | RAHN: A Reputation Based Hourglass Network for Web Service QoS Prediction | | GenIR的基础 | Qingyao Ai | PDF | N/A | Foundations of GenIR | | 通过高效聚合局部特征增强屋顶太阳能电池板的检测 | Kuldeep Kurte | PDF | N/A | Enhanced Rooftop Solar Panel Detection by Efficiently Aggregating Local Features | | 《向前一步，全面优化：面向高效云-端协同设备端推荐的结构化参数化适配》 | Kairui Fu | PDF | N/A | Forward Once for All: Structural Parameterized Adaptation for Efficient Cloud-coordinated On-device Recommendation | | Samba-asr 利用结构化状态空间模型实现的最先进语音识别 | Syed Abdul Gaffar Shakhadri | PDF | N/A | Samba-asr state-of-the-art speech recognition leveraging structured state-space models | | 通用特征引导的零样本类别级物体姿态估计 | Wentian Qu | PDF | N/A | Universal Features Guided Zero-Shot Category-Level Object Pose Estimation | | 随机抽样的语言推理问题揭示了大型语言模型的局限性 | Kavi Gupta | PDF | N/A | Randomly Sampled Language Reasoning Problems Reveal Limits of LLMs | | γ-氨基丁酸（GABA）受体介导的麻醉的蛋白质组学研究 | Jian Jiang | PDF | N/A | Proteomic Learning of Gamma-Aminobutyric Acid (GABA) Receptor-Mediated Anesthesia | | RDD4D：基于4D注意力引导的道路损坏检测与分类 | Asma Alkalbani | PDF | N/A | RDD4D: 4D Attention-Guided Road Damage Detection And Classification | | InpDiffusion: 基于条件扩散模型的图像修复定位 | Kai Wang | PDF | N/A | InpDiffusion: Image Inpainting Localization via Conditional Diffusion Models | | 基于自编码器特征提取的日降水量预测类比预报系统：在香港的应用 | Yee Chun Tsoi | PDF | N/A | Analogue Forecast System for Daily Precipitation Prediction Using Autoencoder Feature Extraction: Application in Hong Kong | | 街道景观店铺招牌识别竞赛第一名解决方案 | Bin Wang | PDF | N/A | First-place Solution for Streetscape Shop Sign Recognition Competition | | 暗黑先知：通过隐藏风格增强和稀疏噪声缓解的归纳时空克里金法 | Zhuoxuan Liang | PDF | N/A | DarkFarseer: Inductive Spatio-temporal Kriging via Hidden Style Enhancement and Sparsity-Noise Mitigation | | AE-NeRF：增强基于事件的神经辐射场以应对非理想条件和更大场景 | Chaoran Feng | PDF | N/A | AE-NeRF: Augmenting Event-Based Neural Radiance Fields for Non-ideal Conditions and Larger Scene | | 利用缓存机制增强终身多智能体路径规划 | Yimin Tang | PDF | N/A | Enhancing Lifelong Multi-Agent Path Finding with Cache Mechanism | | COph100：一个来自“RIDIRP”数据库的婴儿眼底图像配准综合数据集 | Yan Hu | PDF | N/A | COph100: A comprehensive fundus image registration dataset from infants constituting the "RIDIRP" database | | GraphDART：用于高效高级持续性威胁检测的图蒸馏技术 | Saba Fathi Rabooki | PDF | N/A | GraphDART: Graph Distillation for Efficient Advanced Persistent Threat Detection | | InfiFusion：一个通过LLM融合增强跨模型推理的统一框架 | Zhaoyi Yan | PDF | N/A | InfiFusion: A Unified Framework for Enhanced Cross-Model Reasoning via LLM Fusion | | 公平通过匹配 | Kunwoong Kim | PDF | N/A | Fairness Through Matching | | 使用浅层神经网络的线性算子学习的正交贪婪算法 | Ye Lin | PDF | N/A | Orthogonal greedy algorithm for linear operator learning with shallow neural network | | 将文本分段并学习其奖励以改进语言模型中的RLHF | Yueqin Yin | PDF | N/A | Segmenting Text and Learning Their Rewards for Improved RLHF in Language Model | | GLoG-CSUnet：通过可适应的放射组学特征增强视觉Transformer，用于医学图像分割 | Niloufar Eghbali | PDF | N/A | GLoG-CSUnet: Enhancing Vision Transformers with Adaptable Radiomic Features for Medical Image Segmentation | | CCStereo：用于双耳音频生成的视听上下文与对比学习 | Yuanhong Chen | PDF | N/A | CCStereo: Audio-Visual Contextual and Contrastive Learning for Binaural Audio Generation | | 基于迁移学习的混合深度卷积模型用于肺癌检测 | Sugandha Saxena | PDF | N/A | Hybrid deep convolution model for lung cancer detection with transfer learning | | 从密集到稀疏：事件响应在提升住宅负荷预测中的应用 | Xin Cao | PDF | N/A | From Dense to Sparse: Event Response for Enhanced Residential Load Forecasting | | ICFNet：用于生存预测的集成跨模态融合网络 | Binyu Zhang | PDF | N/A | ICFNet: Integrated Cross-modal Fusion Network for Survival Prediction | | 学习一种用于参数化动作马尔可夫决策过程的灵活探索模型 | Zijian Wang | PDF | N/A | Learn A Flexible Exploration Model for Parameterized Action Markov Decision Processes | | 无监督领域自适应用于抗遮挡人体姿态估计 | Arindam Dutta | PDF | N/A | Unsupervised Domain Adaptation for Occlusion Resilient Human Pose Estimation | | GeAR: 生成增强检索 | Haoyu Liu | PDF | N/A | GeAR: Generation Augmented Retrieval | | WorldPose: 一个用于全球3D人体姿态估计的世界杯数据集 | Tianjian Jiang | PDF | N/A | WorldPose: A World Cup Dataset for Global 3D Human Pose Estimation | | 在有限通信范围约束下的多智能体路径规划：动态引导方法 | Hoang-Dung Bui | PDF | N/A | Multi-Agent Path Finding under Limited Communication Range Constraint via Dynamic Leading | | 提升图神经网络可信度的基于排序的保形训练方法 | Ting Wang | PDF | N/A | Enhancing Trustworthiness of Graph Neural Networks with Rank-Based Conformal Training | | GNNs在多模态故障诊断中是否有效用于微服务系统？ | Fei Gao | PDF | N/A | Are GNNs Effective for Multimodal Fault Diagnosis in Microservice Systems? | | 视觉大语言模型在广义和专门应用中的应用 | Yifan Li | PDF | N/A | Visual Large Language Models for Generalized and Specialized Applications | | LDMapNet-U：一个面向城市级车道级地图更新的端到端系统 | Deguo Xia | PDF | N/A | LDMapNet-U: An End-to-End System for City-Scale Lane-Level Map Updating | | 超越 $\mathcal{O}(\sqrt{T})$ 遗憾：在线线性规划中的学习与决策解耦 | Wenzhi Gao | PDF | N/A | Beyond $\mathcal{O}(\sqrt{T})$ Regret: Decoupling Learning and Decision-making in Online Linear Programming | | CHAT：超越对比图变换器用于异质网络中的链路预测 | Shengming Zhang | PDF | N/A | CHAT: Beyond Contrastive Graph Transformer for Link Prediction in Heterogeneous Networks | | MBTSAD：基于令牌分割和注意力蒸馏的语言模型后门缓解方法 | Yidong Ding | PDF | N/A | MBTSAD: Mitigating Backdoors in Language Models Based on Token Splitting and Attention Distillation | | Ultrasound-QBench：大型语言模型能否辅助超声成像的质量评估？ | Hongyi Miao | PDF | N/A | Ultrasound-QBench: Can LLMs Aid in Quality Assessment of Ultrasound Imaging? | | 在智能物流中通过集成Transformer和图神经网络（GNN）提升机器人路径优化 | Hao Luo | PDF | N/A | Enhancing Robot Route Optimization in Smart Logistics with Transformer and GNN Integration | | 砖块扩散：通过砖块到墙面的去噪生成长视频 | Yunlong Yuan | PDF | N/A | Brick-Diffusion: Generating Long Videos with Brick-to-Wall Denoising | | 基于深度卷积随机配置网络的熔镁炉工况可解释性识别 | Li Weitao | PDF | N/A | Interpretable Recognition of Fused Magnesium Furnace Working Conditions with Deep Convolutional Stochastic Configuration Networks | | TARDiS：用于优化多样性与可分离性的文本增强技术 | Kyungmin Kim | PDF | N/A | TARDiS : Text Augmentation for Refining Diversity and Separability | | 整体语义表示用于导航轨迹生成 | Ji Cao | PDF | N/A | Holistic Semantic Representation for Navigational Trajectory Generation | | 序列补充器：通过可学习序列增强变压器在时间序列预测中的应用 | Xiwen Chen | PDF | N/A | Sequence Complementor: Complementing Transformers For Time Series Forecasting with Learnable Sequences | | AFed：算法公平的联邦学习 | Huiqiang Chen | PDF | N/A | AFed: Algorithmic Fair Federated Learning | | OpenGU: 图遗忘综合基准 | Bowen Fan | PDF | N/A | OpenGU: A Comprehensive Benchmark for Graph Unlearning | | 基于树的RAG-Agent推荐系统：医学测试数据案例研究 | Yahe Yang | PDF | N/A | Tree-based RAG-Agent Recommendation System: A Case Study in Medical Test Data | | 创意产业中的人工智能：2025年前的进展 | Nantheera Anantrasirichai | PDF | N/A | Artificial Intelligence in Creative Industries: Advances Prior to 2025 | | 学习具有嵌入潜在转移算子的随机非线性动力学 | Naichang Ke | PDF | N/A | Learning Stochastic Nonlinear Dynamics with Embedded Latent Transfer Operators | | 改进新兴计算范式的数据编码：从随机计算到超维计算 | Mehran Shoushtari Moghadam | PDF | N/A | Improved Data Encoding for Emerging Computing Paradigms: From Stochastic to Hyperdimensional Computing | | KG-CF：在大语言模型指导下的知识图谱补全与上下文过滤 | Zaiyi Zheng | PDF | N/A | KG-CF: Knowledge Graph Completion with Context Filtering under the Guidance of Large Language Models | | 强化学习中的视野泛化 | Vivek Myers | PDF | N/A | Horizon Generalization in Reinforcement Learning | | 多级语义感知模型用于AI生成视频质量评估 | Jiaze Li | PDF | N/A | Multilevel Semantic-Aware Model for AI-Generated Video Quality Assessment | | 知识蒸馏与自适应权重 | Sirong Wu | PDF | N/A | Knowledge Distillation with Adapted Weight | | 基于后门的水印在神经网络中的持久性：一项全面评估 | Anh Tu Ngo | PDF | N/A | Persistence of Backdoor-based Watermarks for Neural Networks: A Comprehensive Evaluation | | QuIM-RAG：通过逆向问题匹配提升检索增强生成以增强问答性能 | Binita Saha | PDF | N/A | QuIM-RAG: Advancing Retrieval-Augmented Generation with Inverted Question Matching for Enhanced QA Performance | | 通过先验引导的混合感知方法和水下图像修复的广泛基准分析 | Xiaojiao Guo | PDF | N/A | Underwater Image Restoration Through a Prior Guided Hybrid Sense Approach and Extensive Benchmark Analysis | | EAGLE：增强视觉基础减少教学多模态模型中的幻觉 | Andrés Villa | PDF | N/A | EAGLE: Enhanced Visual Grounding Minimizes Hallucinations in Instructional Multimodal Models |