Arxiv 2025-01-16 Papers

标题	作者	PDF链接	代码仓库	Title
为自动驾驶提炼多模态大语言模型	Deepti Hegde	PDF	N/A	Distilling Multi-modal Large Language Models for Autonomous Driving
SynthLight：通过学习重新渲染合成人脸的扩散模型实现肖像重打光	Sumit Chaturvedi	PDF	N/A	SynthLight: Portrait Relighting with Diffusion Model by Learning to Re-render Synthetic Faces
以下是这段文字的中文翻译：

从扩展视觉分词器中学习的重建与生成经验

在大型视觉语言模型（LVLMs）中，幻觉（hallucination）问题指的是模型生成的文本或图像与输入内容不符或包含不真实的信息。为了减轻这一问题，研究者们提出了使用策略内数据（on-policy data）的方法，并通过DPO（Data-Policy Optimization）进行优化。这种方法的核心在于利用模型自身生成的数据来调整和优化其输出，从而减少幻觉现象的发生。 | Zhihe Yang | PDF | N/A | Mitigating Hallucinations in Large Vision-Language Models via DPO: On-Policy Data Hold the Key | | 以下是这段文字的中文翻译：

一种在Massart噪声下学习边际半空间的近乎最优算法

在专家混合（Mixture of Experts, MoE）模型中，基于大型语言模型（LLM）的路由机制是一种创新的方法，用于在多个专家模型之间进行选择和组合，以实现更高效和准确的预测或决策。这种框架特别适用于交易领域，其中需要快速响应市场变化并做出最优决策。

核心概念

专家混合模型（MoE）：MoE模型由多个专家模型组成，每个专家模型专门处理特定类型的输入数据。通过结合这些专家的输出，MoE模型能够在复杂任务中表现出色。
路由机制：路由机制负责根据输入数据的特征，决定将数据分配给哪个专家模型。传统的路由机制通常基于简单的规则或启发式方法，而基于LLM的路由机制则利用大型语言模型的强大能力来做出更智能的决策。
大型语言模型（LLM）：LLM是一种经过大规模数据训练的深度学习模型，能够理解和生成自然语言文本。在MoE框架中，LLM被用于分析输入数据的上下文和语义，从而做出更精确的路由决策。

应用场景

在交易领域，基于LLM的专家混合路由框架可以应用于以下场景：

市场预测：通过将市场数据分配给不同的专家模型，LLM可以根据当前市场状况选择最合适的模型进行预测，从而提高预测的准确性。
风险管理：在风险管理中，LLM可以根据交易策略和历史数据，选择最合适的专家模型来评估潜在风险，并制定相应的风险控制措施。
交易执行：在交易执行过程中，LLM可以根据市场流动性和交易量，选择最优的专家模型来执行交易，从而减少交易成本并提高执行效率。

优势

智能决策：LLM能够理解复杂的市场环境和交易策略，从而做出更智能的路由决策。
灵活性：基于LLM的路由机制可以根据市场变化动态调整专家模型的权重，适应不同的市场条件。
高效性：通过优化专家模型的选择和组合，LLM能够提高交易系统的整体效率和性能。

挑战

计算资源：LLM通常需要大量的计算资源，这可能增加系统的复杂性和成本。
数据隐私：在交易领域，数据隐私和安全是一个重要问题，需要确保LLM在处理敏感数据时的安全性。

结论

朝向带边界流形上局部线性嵌入的光谱收敛

这个框架提出了一种新的半监督学习方法，用于二维人体姿态估计任务。它包含三个主要角色：

教师模型：负责生成伪标签，指导学生学习
评审员模型：评估教师生成的伪标签质量
学生模型：在教师和评审员的指导下进行学习

基于文本驱动的基模型适应用于少样本手术工作流分析

多值紧凑遗传算法在广义LeadingOnes问题上的运行时分析