Arxiv 2025-01-13 Papers

标题	作者	PDF链接	代码仓库	Title
数据集蒸馏通过委员会投票	Jiacheng Cui	PDF	N/A	Dataset Distillation via Committee Voting
3D中的不常见物体	Xingchen Liu	PDF	N/A	UnCommon Objects in 3D
WebWalker：在网页遍历中评估大型语言模型（LLMs）	Jialong Wu	PDF	N/A	WebWalker: Benchmarking LLMs in Web Traversal
E2ESlack：一种用于预布线松弛预测的端到端基于图的框架	Saurabh Bodhe	PDF	N/A	E2ESlack: An End-to-End Graph-Based Framework for Pre-Routing Slack Prediction
无需训练的运动引导视频生成：通过运动一致性损失增强时间一致性	Xinyu Zhang	PDF	N/A	Training-Free Motion-Guided Video Generation with Enhanced Temporal Consistency Using Motion Consistency Loss
MatchAnything: 基于大规模预训练的通用跨模态图像匹配	Xingyi He	PDF	N/A	MatchAnything: Universal Cross-Modality Image Matching with Large-Scale Pre-Training
动态原型演练在心电图心律失常检测中的持续学习应用	Sana Rahmani	PDF	N/A	Dynamic Prototype Rehearsal for Continual Learning in ECG Arrhythmia Detection
SST-EM：评估视频编辑中语义、空间和时间方面的高级指标	Varun Biyyala	PDF	N/A	SST-EM: Advanced Metrics for Evaluating Semantic, Spatial and Temporal Aspects in Video Editing
在空间中进行推理时的想象：多模态思维可视化	Chengzu Li	PDF	N/A	Imagine while Reasoning in Space: Multimodal Visualization-of-Thought
ML Mule: 移动驱动的上下文感知协作学习	Haoxiang Yu	PDF	N/A	ML Mule: Mobile-Driven Context-Aware Collaborative Learning
研究基于地图的路径损耗模型：卷积神经网络中特征表示的研究	Ryan G. Dempsey	PDF	N/A	Investigating Map-Based Path Loss Models: A Study of Feature Representations in Convolutional Neural Networks
自信伪标签扩散增强用于犬类心脏肥大检测	Shiman Zhang	PDF	N/A	Confident Pseudo-labeled Diffusion Augmentation for Canine Cardiomegaly Detection
研究大型语言模型在从用户对话中推断人格特质的能力	Jianfeng Zhu	PDF	N/A	Investigating Large Language Models in Inferring Personality Traits from User Conversations
评估基于代理的程序修复在谷歌的应用	Pat Rondon	PDF	N/A	Evaluating Agent-based Program Repair at Google
IP-FaceDiff：基于扩散模型的身份保持面部视频编辑	Tharun Anand	PDF	N/A	IP-FaceDiff: Identity-Preserving Facial Video Editing with Diffusion
RadAlign：通过视觉-语言概念对齐推进放射学报告生成	Difei Gu	PDF	N/A	RadAlign: Advancing Radiology Report Generation with Vision-Language Concept Alignment
并行键值缓存融合用于位置不变的RAG	Philhoon Oh	PDF	N/A	Parallel Key-Value Cache Fusion for Position Invariant RAG
进化与仿生优化中的成功悖论：重新审视关键问题、重要研究及方法论路径	Daniel Molina	PDF	N/A	The Paradox of Success in Evolutionary and Bioinspired Optimization: Revisiting Critical Issues, Key Studies, and Methodological Pathways
通过深度强化学习实现高效流动性供应，提升去中心化金融（DeFi）的可访问性	Haonan Xu	PDF	N/A	Improving DeFi Accessibility through Efficient Liquidity Provisioning with Deep Reinforcement Learning
从原始数据和在线专家反馈中归纳学习机器人任务知识	Daniele Meli	PDF	N/A	Inductive Learning of Robot Task Knowledge from Raw Data and Online Expert Feedback
RbRL2.0：基于评分的强化学习的奖励与策略集成学习	Mingkang Wu	PDF	N/A	RbRL2.0: Integrated Reward and Policy Learning for Rating-based Reinforcement Learning
三视图焦距恢复从单应性矩阵	Yaqing Ding	PDF	N/A	Three-view Focal Length Recovery From Homographies
对齐先行，再融合：一种新颖的弱监督多模态暴力检测方法	Wenping Jin	PDF	N/A	Aligning First, Then Fusing: A Novel Weakly Supervised Multimodal Violence Detection Method
探索和缓解基于投票的排行榜的对抗性操纵	Yangsibo Huang	PDF	N/A	Exploring and Mitigating Adversarial Manipulation of Voting-Based Leaderboards
可持续人工智能的数据与系统视角	Tao Xie	PDF	N/A	Data and System Perspectives of Sustainable Artificial Intelligence
21世纪的智能学习：跨越三个数字时代的建构主义发展	Ilya Levin	PDF	N/A	Smart Learning in the 21st Century: Advancing Constructionism Across Three Digital Epochs
TiEBe：一个用于评估大型语言模型当前知识水平的基准	Thales Sales Almeida	PDF	N/A	TiEBe: A Benchmark for Assessing the Current Knowledge of Large Language Models
3DGS-to-PC：将3D高斯泼溅场景转换为密集点云或网格	Lewis A G Stuart	PDF	N/A	3DGS-to-PC: Convert a 3D Gaussian Splatting Scene into a Dense Point Cloud or Mesh
估计音频中的音乐意外性	Mathias Rose Bjare	PDF	N/A	Estimating Musical Surprisal in Audio
《医疗保健中的具身人工智能调查：技术、应用与机遇》	Yihao Liu	PDF	N/A	A Survey of Embodied AI in Healthcare: Techniques, Applications, and Opportunities
理解与基准测试人工智能：OpenAI的o3并非通用人工智能	Rolf Pfister	PDF	N/A	Understanding and Benchmarking Artificial Intelligence: OpenAI's o3 Is Not AGI
动态神经网络研究综述：从计算机视觉到多模态传感器融合	Fabio Montello	PDF	N/A	A Survey on Dynamic Neural Networks: from Computer Vision to Multi-modal Sensor Fusion
PrecipDiff：利用图像扩散模型增强基于卫星的降水观测	Ting-Yu Dai	PDF	N/A	PrecipDiff: Leveraging image diffusion models to enhance satellite-based precipitation observations
基于熵正则化最优传输的概率测度数据合成与分析	Brendan Mallery	PDF	N/A	Synthesis and Analysis of Data as Probability Measures with Entropy-Regularized Optimal Transport
在线从答案集中进行归纳学习以实现高效的强化学习探索	Celeste Veronese	PDF	N/A	Online inductive learning from answer sets for efficient reinforcement learning exploration
当你需要关注时	Lokesh Boominathan	PDF	N/A	Attention when you need
成对比较无随机传递性：模型、理论与应用	Sze Ming Lee	PDF	N/A	Pairwise Comparisons without Stochastic Transitivity: Model, Theory and Applications
引导式SAM：标签高效的部分分割	S. B. van Rooij	PDF	N/A	Guided SAM: Label-Efficient Part Segmentation
对加权约束满足问题中隐式命中集方法的实证评估	Aleksandra Petrova	PDF	N/A	Empirical Evaluation of the Implicit Hitting Set Approach for Weighted CSPs
Diff-Ensembler：学习集成2D扩散模型以实现体到体医学图像翻译	Xiyue Zhu	PDF	N/A	Diff-Ensembler: Learning to Ensemble 2D Diffusion Models for Volume-to-Volume Medical Image Translation
基于将K分量高斯混合模型流形嵌入对称正定矩阵流形的距离度量	Amit Vishwakarma	PDF	N/A	Distance Measure Based on an Embedding of the Manifold of K-Component Gaussian Mixture Models into the Manifold of Symmetric Positive Definite Matrices
MVICAD2：具有延迟和扩张的多视角独立成分分析	Ambroise Heurtebise	PDF	N/A	MVICAD2: Multi-View Independent Component Analysis with Delays and Dilations
学生宿舍能源预测的季节性变化研究	Muhammad Umair Danish	PDF	N/A	An Investigation into Seasonal Variations in Energy Forecasting for Student Residences
基于传感器的开放词汇活动识别的初步发现：通过文本嵌入反演	Lala Shakti Swarup Ray	PDF	N/A	Initial Findings on Sensor based Open Vocabulary Activity Recognition via Text Embedding Inversion
保护：使用无监督学习进行蛋白质昼夜时间预测	Aram Ansary Ogholbake	PDF	N/A	PROTECT: Protein circadian time prediction using unsupervised learning
深度学习中的有效梯度流方程推导与训练数据的动态截断	Thomas Chen	PDF	N/A	Derivation of effective gradient flow equations and dynamical truncation of training data in Deep Learning
OCORD：开放校园物体移除数据集	Shuo Zhang	PDF	N/A	OCORD: Open-Campus Object Removal Dataset
使用大型视觉-语言模型进行零样本场景理解以实现自动目标识别	Yasiru Ranasinghe	PDF	N/A	Zero-Shot Scene Understanding for Automatic Target Recognition Using Large Vision-Language Models
《人工智能生活与社会基础：面向大学社区的AI素养课程》	Joydeep Biswas	PDF	N/A	The Essentials of AI for Life and Society: An AI Literacy Course for the University Community
增强检索增强生成：最佳实践研究	Siran Li	PDF	N/A	Enhancing Retrieval-Augmented Generation: A Study of Best Practices
Kolmogorov-Arnold网络用于遥感图像语义分割	Xianping Ma	PDF	N/A	Kolmogorov-Arnold Network for Remote Sensing Image Semantic Segmentation
信息理论双记忆系统的持续学习	RunQing Wu	PDF	N/A	Information-Theoretic Dual Memory System for Continual Learning
FedSemiDG：面向领域泛化的联邦半监督医学图像分割	Zhipeng Deng	PDF	N/A	FedSemiDG: Domain Generalized Federated Semi-supervised Medical Image Segmentation
以下是将“A RankNet-Inspired Surrogate-Assisted Hybrid Metaheuristic for Expensive Coverage Optimization”翻译成中文的结果：

基于RankNet启发的代理辅助混合元启发式算法用于昂贵覆盖优化

翻译说明： 1. RankNet-Inspired：RankNet是一种用于排序学习的神经网络模型，这里表示该方法是受到RankNet的启发。 2. Surrogate-Assisted：代理辅助，指的是使用代理模型（如机器学习模型）来替代昂贵的计算过程。 3. Hybrid Metaheuristic：混合元启发式算法，结合了多种优化策略的元启发式方法。 4. Expensive Coverage Optimization：昂贵覆盖优化，指的是在计算成本较高的情况下进行覆盖优化问题。

翻译说明：

The Devil is in the Spurious Correlation: 这是一个英语谚语，意思是“看似简单的事情往往暗藏玄机”。在这里，它暗示了时刻检索任务中存在的虚假关联问题。
Boosting Moment Retrieval: 提升时刻检索，指的是提高模型在视频中定位特定时刻的能力。
Temporal Dynamic Learning: 时间动态学习，指的是模型能够捕捉和理解视频中时间维度上的动态变化。

完整翻译：

魔鬼藏在虚假的关联中：通过时间动态学习提升时刻检索

翻译解读：

从红队测试100个生成式AI产品中获得的经验教训

或者，根据上下文，也可以翻译为：

红队测试100款生成式AI产品的启示

基于众包的非专业用户标注镰状细胞病患者外周血涂片样本图像的计算方法

翻译说明： - "Crowdsourced" 翻译为 "众包"，指利用大量非专业用户的集体智慧来完成某项任务。 - "human-based computational approach" 翻译为 "基于人类参与的计算方法"，强调通过人工参与的方式进行处理。 - "tagging" 翻译为 "标注"，指对图像进行标记或分类。 - "peripheral blood smear sample images" 翻译为 "外周血涂片样本图像"，指通过显微镜观察的血液样本图像。 - "Sickle Cell Disease patients" 翻译为 "镰状细胞病患者"，这是一种遗传性血液疾病。 - "non-expert users" 翻译为 "非专业用户"，指没有专业医学背景的普通人。

《$\texttt{KSig}$ 用户指南：GPU 加速的签名核计算》

如果需要进一步调整或补充，请告诉我！ | Csaba Tóth | PDF | N/A | A User's Guide to $\texttt{KSig}$: GPU-Accelerated Computation of the Signature Kernel | | FlexQuant：面向边缘设备本地托管大型语言模型的弹性量化框架 | Yuji Chai | PDF | N/A | FlexQuant: Elastic Quantization Framework for Locally Hosted LLM on Edge Devices | | 在恶劣天气条件下的LiDAR点云中实现鲁棒的单目标跟踪 | Xiantong Zhao | PDF | N/A | Robust Single Object Tracking in LiDAR Point Clouds under Adverse Weather Conditions | | LLM360 K2：扩展360度开源大型语言模型 | Zhengzhong Liu | PDF | N/A | LLM360 K2: Scaling Up 360-Open-Source Large Language Models | | 使用符号回归推断可解释的碎裂函数模型 | Nour Makke | PDF | N/A | Inferring Interpretable Models of Fragmentation Functions using Symbolic Regression | | MSV-Mamba: 一种用于超声心动图分割的多尺度视觉Mamba网络 | Xiaoxian Yang | PDF | N/A | MSV-Mamba: A Multiscale Vision Mamba Network for Echocardiography Segmentation | | 双工：用于组合零样本学习的双重原型学习 | Zhong Peng | PDF | N/A | Duplex: Dual Prototype Learning for Compositional Zero-Shot Learning | | 结构化光匹配自由深度恢复 | Zhuohang Yu | PDF | N/A | Matching Free Depth Recovery from Structured Light | | ListConRanker: 一种采用列表编码的对比文本重排序器 | Junlong Liu | PDF | N/A | ListConRanker: A Contrastive Text Reranker with Listwise Encoding | | 动态多模态融合通过元学习实现微视频推荐 | Han Liu | PDF | N/A | Dynamic Multimodal Fusion via Meta-Learning Towards Micro-Video Recommendation | | 视觉理解的探索：视觉问答演进的历程 | Anupam Pandey | PDF | N/A | The Quest for Visual Understanding: A Journey Through the Evolution of Visual Question Answering | | GPT是如何逐层学习的 | Jason Du | PDF | N/A | How GPT learns layer by layer | | RMAvatar：基于单目视频的逼真人像重建——基于校正网格嵌入高斯方法 | Sen Peng | PDF | N/A | RMAvatar: Photorealistic Human Avatar Reconstruction from Monocular Video Based on Rectified Mesh-embedded Gaussians | | AdaCS: 用于增强代码切换ASR的自适应归一化 | The Chuong Chu | PDF | N/A | AdaCS: Adaptive Normalization for Enhanced Code-Switching ASR | | 双尺度感知自适应掩码知识蒸馏用于目标检测 | ZhouRui Zhang | PDF | N/A | Dual Scale-aware Adaptive Masked Knowledge Distillation for Object Detection | | 基于超二次曲面的自我中心RGB视频中3D手-物体重建与组合动作识别的协作学习 | Tze Ho Elden Tse | PDF | N/A | Collaborative Learning for 3D Hand-Object Reconstruction and Compositional Action Recognition from Egocentric RGB Videos Using Superquadrics | | MathReader：数学文档的文本转语音工具 | Sieun Hyeon | PDF | N/A | MathReader : Text-to-Speech for Mathematical Documents | | 在线处理中的视频质量评估：从空间采样到时间采样 | Jiebin Yan | PDF | N/A | Video Quality Assessment for Online Processing: From Spatial to Temporal Sampling | | 提升文本到图像生成：通过大型多模态模型中的多语言提示 | Yongyu Mu | PDF | N/A | Boosting Text-To-Image Generation via Multilingual Prompting in Large Multimodal Models | | ADKGD：基于双通道训练的知识图谱异常检测 | Jiayang Wu | PDF | N/A | ADKGD: Anomaly Detection in Knowledge Graphs with Dual-Channel Training | | D3MES：用于三维分子生成的多头等变自注意力扩散变换器 | Zhejun Zhang | PDF | N/A | D3MES: Diffusion Transformer with multihead equivariant self-attention for 3D molecule generation | | 点云上采样的全局与局部输入表示学习 | Tongxu Zhang | PDF | N/A | Representation Learning of Point Cloud Upsampling in Global and Local Inputs | | 源自由域适应中的标签校准 | Shivangi Rai | PDF | N/A | Label Calibration in Source Free Domain Adaptation | | 价值指南针排行榜：一个用于基础和验证性评估大型语言模型（LLMs）价值观的平台 | Jing Yao | PDF | N/A | Value Compass Leaderboard: A Platform for Fundamental and Validated Evaluation of LLMs Values | | 通过渐进式提示提升图像生成的真实性 | Zhen Xiong | PDF | N/A | Enhancing Image Generation Fidelity via Progressive Prompts | | 基于结构信息理论的分层超像素分割 | Minhui Xie | PDF | N/A | Hierarchical Superpixel Segmentation via Structural Information Theory | | 基于增量学习的检索增强生成（RAG）模型在线更新方法研究 | Yuxin Fan | PDF | N/A | Research on the Online Update Method for Retrieval-Augmented Generation (RAG) Model with Incremental Learning | | 逻辑与魔法的交汇：大型语言模型破解智能合约漏洞 | ZeKe Xiao | PDF | N/A | Logic Meets Magic: LLMs Cracking Smart Contract Vulnerabilities | | SFC-GAN: 一种用于大脑功能与结构连接组转换的生成对抗网络 | Yee-Fan Tan | PDF | N/A | SFC-GAN: A Generative Adversarial Network for Brain Functional and Structural Connectome Translation | | PoAct：面向通用应用的政策与行动双控代理 | Guozhi Yuan | PDF | N/A | PoAct: Policy and Action Dual-Control Agent for Generalized Applications | | 揭示文本在高维时间序列预测中的潜力 | Xin Zhou | PDF | N/A | Unveiling the Potential of Text in High-Dimensional Time Series Forecasting | | 利用ASIC AI芯片实现同态加密 | Jianming Tong | PDF | N/A | Leveraging ASIC AI Chips for Homomorphic Encryption | | 差分隐私核化上下文赌博机 | Nikola Pavlovic | PDF | N/A | Differentially Private Kernelized Contextual Bandits | | ACCon：用于深度回归的角度补偿对比正则化器 | Botao Zhao | PDF | N/A | ACCon: Angle-Compensated Contrastive Regularizer for Deep Regression | | Protego：通过内在能力检测视觉Transformer的对抗样本 | Jialin Wu | PDF | N/A | Protego: Detecting Adversarial Examples for Vision Transformers via Intrinsic Capabilities | | 重新思考蒸馏中的知识：一种上下文样本检索的视角 | Jinjing Zhu | PDF | N/A | Rethinking Knowledge in Distillation: An In-context Sample Retrieval Perspective | | 基于物联网的实时医疗相关人体活动识别：使用骨骼数据和多阶段深度学习技术，应用于医疗保健领域 | Subrata Kumer Paul | PDF | N/A | IoT-Based Real-Time Medical-Related Human Activity Recognition Using Skeletons and Multi-Stage Deep Learning for Healthcare | | 探索时间序列基础模型在跟车行为分析中的应用 | Luwei Zeng | PDF | N/A | Explore the Use of Time Series Foundation Model for Car-Following Behavior Analysis | | 使用基于生成对抗网络（GAN）的模型检测在线支付中的AI深度伪造和欺诈 | Zong Ke | PDF | N/A | Detection of AI Deepfake and Fraud in Online Payments Using GAN-Based Models | | PRKAN: 参数简化的科尔莫戈罗夫-阿诺德网络 | Hoang-Thang Ta | PDF | N/A | PRKAN: Parameter-Reduced Kolmogorov-Arnold Networks | | 使用扩散模型消除信号检测中的噪声：从理论到应用 | Xiucheng Wang | PDF | N/A | Erasing Noise in Signal Detection with Diffusion Model: From Theory to Application | | 基于大型语言模型的档案系统智能搜索方案 | Ha Dung Nguyen | PDF | N/A | A Proposed Large Language Model-Based Smart Search for Archive System | | 改进的在线公平分配与多臂赌博机学习的遗憾界 | Benjamin Schiffer | PDF | N/A | Improved Regret Bounds for Online Fair Division with Bandit Learning | | 神经概率电路：通过逻辑推理实现组合性和可解释性预测 | Weixin Chen | PDF | N/A | Neural Probabilistic Circuits: Enabling Compositional and Interpretable Predictions through Logical Reasoning | | ViSoLex: 一个用于越南社交媒体词汇规范化的开源仓库 | Anh Thi-Hoang Nguyen | PDF | N/A | ViSoLex: An Open-Source Repository for Vietnamese Social Media Lexical Normalization | | UNetVL：利用切比雪夫KAN驱动的视觉LSTM增强3D医学图像分割 | Xuhui Guo | PDF | N/A | UNetVL: Enhancing 3D Medical Image Segmentation with Chebyshev KAN Powered Vision-LSTM | | 多模态深度学习框架用于泛癌症预后 | Binyu Zhang | PDF | N/A | A Multi-Modal Deep Learning Framework for Pan-Cancer Prognosis | | SplatMAP：基于3D高斯泼溅的在线密集单目SLAM | Yue Hu | PDF | N/A | SplatMAP: Online Dense Monocular SLAM with 3D Gaussian Splatting | | AlgoRxplorers | 精准突变——利用先进的蛋白质稳定性预测工具提升药物设计 | Karishma Thakrar | PDF | N/A | AlgoRxplorers | Precision in Mutation -- Enhancing Drug Design with Advanced Protein Stability Prediction Tools | | 使用扩散模型和间接方法进行全球搜索以优化低推力航天器轨迹 | Jannik Graebner | PDF | N/A | Global Search for Optimal Low Thrust Spacecraft Trajectories using Diffusion Models and the Indirect Method | | 多增益估计在进化组合优化运行时间中的应用 | Min Huang | PDF | N/A | Multiple-gain Estimation for Running Time of Evolutionary Combinatorial Optimization | | 通过分层保体积映射的级联扩散模型的似然训练 | Henry Li | PDF | N/A | Likelihood Training of Cascaded Diffusion Models via Hierarchical Volume-preserving Maps | | 运动轨迹：小样本模仿学习中人类-机器人迁移的统一表示 | Juntao Ren | PDF | N/A | Motion Tracks: A Unified Representation for Human-Robot Transfer in Few-Shot Imitation Learning | | LEO：增强视觉编码器混合以支持多模态大型语言模型 | Mozhgan Nasr Azadani | PDF | N/A | LEO: Boosting Mixture of Vision Encoders for Multimodal Large Language Models | | 在多标签分类的推荐系统中应用图对比学习 | Jiayang Wu | PDF | N/A | Graph Contrastive Learning on Multi-label Classification for Recommendations | | 拉丁美洲和加勒比地区的数据丰富化工作与人工智能劳动力 | Gianna Williams | PDF | N/A | Data Enrichment Work and AI Labor in Latin America and the Caribbean | | 结合大语言模型（LLM）决策和强化学习（RL）动作选择，以改进自适应干预中的强化学习策略。 | Karine Karine | PDF | N/A | Combining LLM decision and RL action selection to improve RL policy for adaptive interventions |